База знаний

База знаний

База знаний (КБ) - это технология, используемая для хранения сложной структурированной и неструктурированной информации, используемой компьютерной системой. Первоначально этот термин использовался в связи с экспертными системами, которые были первыми системами, основанными на знаниях.

Оригинальное использование термина
Первоначально термин "база знаний" использовался для описания одной из двух подсистем экспертной системы. Система, основанная на знаниях, состоит из базы знаний, представляющей факты о мире, и механизма вывода, рассуждающего об этих фактах и использующего правила и другие формы логики для вывода новых фактов или выявления несоответствий.

Свойства

Термин "база знаний" был придуман для того, чтобы отличить эту форму хранилища знаний от более распространенного и широко используемого термина базаданных . В 1970-е годы практически все крупные информационные системы управления хранили свои данные в той или иной иерархической или реляционной базеданных . На данном этапе истории информационных технологийразличие между базой данных и базой знаний было четким и недвусмысленным.

База данных имеет следующие свойства:
  • Плоские данные: данные обычно представлялись в табличном формате со строками или числами в каждом поле.
  • Несколько пользователей: обычная база данных, необходимая для поддержки более чем одного пользователя или системы, вошедших в одни и те же данные одновременно.
  • Транзакции: одним из основных требований к базе данных было поддержание целостности и согласованности данных, к которым обращались параллельные пользователи. Это так называемые кислотные свойства: атомарность, консистенция, изоляция и долговечность.
  • Большие, долговечные данные: корпоративная база данных должна поддерживать не только тысячи, но и сотни тысяч или более строк данных. Такая база данных, как правило, должна сохраняться в течение определенного периода использования любой отдельной программы; она должна хранить данные в течение многих лет и десятилетий, а не в течение всего срока службы программы.
Первые системы, основанные на знаниях, имели потребности в данных, противоположные этим требованиям к базам данных. Экспертная система требует структурированных данных. Не только таблицы с числами и строками, но и указатели на другие объекты, которые, в свою очередь, имеют дополнительные указатели. Идеальным представлением базы знаний является объектная модель (часто называемая в литературе по искусственному интеллекту онтологией) с классами, подклассами и экземплярами.

Ранние экспертные системы также не имели большой потребности в нескольких пользователях или сложности, связанной с требованием транзакционных свойств данных. Данные для ранних экспертных систем использовались для получения конкретного ответа, такого как медицинский диагноз, конструкция молекулы или реакция на чрезвычайную ситуацию. После того, как решение проблемы было известно, не было критического требования хранить большие объемы данных обратно в постоянное хранилище памяти. Более точным утверждением было бы то, что, учитывая имеющиеся технологии, исследователи пошли на компромисс и обошлись без этих возможностей, потому что они поняли, что они находятся за пределами того, что можно было бы ожидать, и они могли бы разработать полезные решения нетривиальных проблем без них. Уже с самого начала более проницательные исследователи осознали потенциальные преимущества хранения, анализа и повторного использования знаний. Например, см. обсуждение корпоративной памяти в самой ранней работе программы Knowledge-Based Software Assistant от Корделл Грин и др.

Требования к объему базы знаний также отличались от требований к обычной базе данных. База знаний должна была знать факты о мире. Например, чтобы представить утверждение ,что "все люди смертны". База данных обычно не может представлять эти общие знания, а вместо этого должна хранить информацию о тысячах таблиц, которые представляют информацию о конкретных людях. Представление о том, что все люди смертны, и способность рассуждать о каждом конкретном человеке, что он смертен,-это работа базы знаний. Представляя интересы Джорджа, Мэри, Сэма, Дженны, Майка... и сотни тысяч других клиентов - это все люди с определенным возрастом, полом, адресом и т. д. это работа для базы данных.

По мере того как экспертные системы переходили от прототипов к системам, развернутым в корпоративных средах, требования к их хранилищу данных быстро начали перекрываться со стандартными требованиями к базам данных для нескольких распределенных пользователей с поддержкой транзакций. Первоначально спрос можно было наблюдать на двух различных, но конкурентных рынках. Из ИИ и объектно-ориентированных сообществ, объектно-ориентированных баз данных, таких как Versant возникший. Это были системы, разработанные с нуля, чтобы иметь поддержку объектно-ориентированных возможностей, но также и для поддержки стандартных служб баз данных. С другой стороны, крупные поставщики баз данных, такие как Oracle, добавили в свои продукты возможности, обеспечивающие поддержку требований базы знаний, таких как отношения между классами и подклассами и правила.

Интернет как база знаний

Следующей эволюцией термина "база знаний" стал интернет. С появлением Интернета поддержка документов, гипертекста и мультимедиа стала критически важной для любой корпоративной базы данных. Этого было уже недостаточно для поддержки больших таблиц данных или относительно небольших объектов, которые жили в основном в памяти компьютера. Поддержка корпоративных веб-сайтов требовала постоянства и транзакций для документов. Это создало целую новую дисциплину, известную как управление веб-контентом. Другой движущей силой поддержки документов стал рост числа поставщиков управления знаниями, таких как Lotus Notes. Управление знаниями фактически предшествовало появлению Интернета, но с появлением Интернета между этими двумя областями возникла большая Синергия. Продукты управления знаниями используют термин "база знаний" для описания своих хранилищ, но их значение имеет небольшое различие. В случае предыдущих систем, основанных на знаниях, эти знания предназначались в первую очередь для использования автоматизированной системы, чтобы рассуждать и делать выводы о мире. Что касается продуктов управления знаниями, то эти знания в первую очередь предназначались для людей, например, чтобы служить хранилищем руководств, процедур, политик, передового опыта, многоразовых конструкций и кода и т. д. В обоих случаях различия между видами использования и видами систем были нечетко определены. По мере развития технологии редко можно было найти систему, которая действительно могла бы быть четко классифицирована как основанная на знаниях в смысле экспертной системы, выполняющей автоматизированные рассуждения и основанной на знаниях в смысле управления знаниями, предоставляющей знания в форме документов и носителей, которые могли бы быть использованы нами, людьми.

Поделитесь ссылкой.

HTML код
BBCode
Link