Представление знаний и рассуждения

Представление знаний и аргументация (KR, KR², KR & R) — это область искусственного интеллекта (AI), предназначенная для представления информации о мире в форме, которую компьютерная система может использовать для решения сложных задач, таких как диагностика состояния здоровья или наличие диалога на естественном языке. Представление знаний включает в себя выводы из психологии о том, как люди решают проблемы и представляют знания для разработки формализмов, которые упростят проектирование и сборку сложных систем. Представление знаний и рассуждения также включают в себя выводы из логики для автоматизации различных видов рассуждений, таких как применение правил или отношения множеств и подмножеств.

Примеры формализмов представления знаний включают семантические сети, архитектуру систем, фреймы, правила и онтологии. Примеры автоматических логических движков включают в себя механизмы вывода, теоретические прокси и классификаторы.

Серия конференций КР была создана для обмена идеями и прогрессом в этой сложной области.

история
Самая ранняя работа по представлению компьютеризированных знаний была сосредоточена на общих решателях проблем, таких как система общего решения проблем (GPS), разработанная Алленом Ньюэлом и Гербертом А. Саймоном в 1959 году. В этих системах были представлены структуры данных для планирования и декомпозиции. Система начнется с цели. Затем он разложил эту цель на подцели, а затем намеревался построить стратегии, которые могли бы выполнить каждый подцель.

В эти первые годы ИИ также были разработаны общие алгоритмы поиска, такие как A *. Однако определения аморфных проблем для систем, таких как GPS, означали, что они работали только для очень ограниченных доменов игрушек (например, «мир блоков»). Чтобы решить проблемы, не связанные с игрушкой, исследователи ИИ, такие как Эд Фейгенбаум и Фредерик Хейс-Рот, поняли, что необходимо сосредоточить системы на более ограниченных проблемах.

Именно неудача этих усилий привела к когнитивной революции в психологии и к фазе ИИ, сосредоточенной на представлении знаний, в результате чего в 1970-х и 80-х годах были созданы экспертные системы, производственные системы, рамочные языки и т. Д. Вместо общих решателей проблем, ИИ сфокусировался на экспертных системах, которые могли бы соответствовать компетенции человека по конкретной задаче, такой как медицинский диагноз.

Экспертные системы дали нам терминологию, которая все еще используется сегодня, когда системы ИИ делятся на Базу знаний с фактами о мире и правилах и механизмом вывода, который применяет правила к базе знаний, чтобы отвечать на вопросы и решать проблемы. В этих ранних системах база знаний имела тенденцию быть довольно плоской структурой, по существу, утверждениями о значениях переменных, используемых правилами.

В дополнение к экспертным системам другие исследователи разработали концепцию основанных на кадрах языков в середине 1980-х годов. Кадр похож на класс объекта: это абстрактное описание категории, описывающей вещи в мире, проблемы и возможные решения. Фреймы изначально использовались в системах, ориентированных на взаимодействие человека, например, в понимании естественного языка и социальных установок, в которых различные ожидания по умолчанию, такие как заказы пищи в ресторане, ограничивают пространство поиска и позволяют системе выбирать соответствующие ответы на динамические ситуации.

Незадолго до того, как сообщества кадров и исследователи, основанные на правилах, поняли, что существует синергия между их подходами. Фреймы были хороши для представления реального мира, описываемых как классы, подклассы, слоты (значения данных) с различными ограничениями на возможные значения. Правила были хорошими для представления и использования сложной логики, такой как процесс постановки медицинского диагноза. Были разработаны интегрированные системы, которые объединяли рамки и правила. Одной из самых мощных и хорошо известных была инженерная среда знаний (KEE) 1983 года от Intellicorp. У KEE был полный механизм правил с прямой и обратной цепью. Он также обладал полной базой знаний на основе фреймов с триггерами, слотами (значениями данных), наследованием и передачей сообщений. Хотя передача сообщений происходила в объектно-ориентированном сообществе, а не в AI, он быстро был охвачен исследователями ИИ, а также в таких средах, как KEE и в операционных системах для машин Lisp от Symbolics, Xerox и Texas Instruments.

Интеграция фреймов, правил и объектно-ориентированного программирования была в значительной степени обусловлена ​​коммерческими предприятиями, такими как KEE и Symbolics, которые были выделены из различных исследовательских проектов. В то же время, когда это происходило, существовал еще один штамм исследований, который был менее коммерчески сфокусирован и управлялся математической логикой и автоматизированной теоретической проверкой. Одним из наиболее влиятельных языков в этом исследовании был язык KL-ONE середины 80-х годов. KL-ONE был языком фреймов, который имел строгую семантику, формальные определения для таких понятий, как отношение Is-A. KL-ONE и языки, на которые он повлиял, такие как Loom, имели автоматизированный механизм рассуждений, основанный на формальной логике, а не на правилах IF-THEN. Этот аргумент называется классификатором. Классификатор может анализировать набор деклараций и выводить новые утверждения, например, переопределять класс как подкласс или суперкласс другого класса, который не был формально определен. Таким образом, классификатор может функционировать как механизм вывода, выведя новые факты из существующей базы знаний. Классификатор также может обеспечивать проверку согласованности базы знаний (которая в случае языков KL-ONE также упоминается как онтология).

Еще одной областью исследования представления знаний была проблема здравого смысла. Одна из первых реализаций, извлеченных из попыток сделать программное обеспечение, которое может функционировать с человеческим естественным языком, состояло в том, что люди регулярно используют обширную основу знаний о реальном мире, которую мы просто принимаем как должное, но это совершенно не очевидно для искусственного агента , Основные принципы физики здравого смысла, причинности, намерений и т. Д. Примером является проблема кадра, что в логике, управляемой событиями, должны быть аксиомы, которые утверждают, что вещи сохраняют позицию от одного момента до следующего, если они не перемещаются какой-то внешней силой , Чтобы создать истинного агента искусственного интеллекта, который может общаться с людьми с использованием естественного языка и может обрабатывать основные утверждения и вопросы о мире, важно представлять этот вид знаний. Одной из самых амбициозных программ для решения этой проблемы был проект Doug Lenat’s Cyc. Cyc создал собственный язык фреймов, и большое количество аналитиков документировали различные области рассуждения здравого смысла на этом языке. Знания, записанные в Cyc, включали в себя модели здравого смысла времени, причинности, физики, намерений и многих других.

Отправной точкой для представления знаний является гипотеза представления знаний, впервые формализованная Брайаном Смитом в 1985 году:

Любой механически воплощенный интеллектуальный процесс будет состоять из структурных компонентов, которые: а) мы, естественно, как внешние наблюдатели, представляем пропозициональный отчет о знаниях, которые проявляет общий процесс, и б) независимо от такой внешней семантической атрибуции играют формальную, но причинную и существенную роль в порождении поведения, которое проявляет это знание.

В настоящее время одной из наиболее активных областей исследования представления знаний являются проекты, связанные с семантической сетью. Семантическая сеть пытается добавить слой семантики (значение) поверх текущего Интернета. Вместо того, чтобы индексировать веб-сайты и страницы через ключевые слова, семантический веб создает большие онтологии понятий. Поиск концепции будет более эффективным, чем обычный поиск по тексту. Языки фреймов и автоматическая классификация играют большую роль в видении будущего семантического Интернета. Автоматическая классификация дает разработчикам технологию для обеспечения порядка в постоянно развивающейся сети знаний. Определение онтологий, которые статичны и неспособны развиваться «на лету», будет очень ограничено для интернет-систем. Технология классификатора обеспечивает возможность работы с динамической средой Интернета.

Недавние проекты, финансируемые в основном Агентством перспективных исследований обороны (DARPA), имеют интегрированные языки и классификаторы кадров с языками разметки на основе XML. Структура описания ресурсов (RDF) предоставляет базовую возможность определять классы, подклассы и свойства объектов. Язык веб-онтологии (OWL) предоставляет дополнительные уровни семантики и обеспечивает интеграцию с механизмами классификации.

обзор
Представление знаний — это область искусственного интеллекта, которая фокусируется на разработке компьютерных представлений, которые захватывают информацию о мире, которая может быть использована для решения сложных проблем.

Обоснование представления знаний состоит в том, что обычный процедурный код не является лучшим формализмом для решения сложных проблем. Представление знаний упрощает определение и поддержку сложного программного обеспечения, чем процедурный код, и может использоваться в экспертных системах.

Например, общение с экспертами с точки зрения бизнес-правил, а не кода, уменьшает семантический разрыв между пользователями и разработчиками и делает разработку сложных систем более практичной.

Представление знаний идет рука об руку с автоматическим мышлением, потому что одной из основных целей явного представления знаний является возможность рассуждать об этом знании, делать выводы, утверждать новые знания и т. Д. Практически все языки представления знаний имеют механизм рассуждений или умозаключений как часть системы.

Ключевым компромиссом в оформлении формализма представления знаний является то, что между выразительностью и практичностью. Окончательный формализм представления представлений с точки зрения выразительной силы и компактности — Логика первого порядка (FOL). Нет более мощного формализма, чем математика, используемая математиками для определения общих положений о мире. Однако FOL имеет два недостатка в качестве формализма представления знаний: простота использования и практичность реализации. Логика первого порядка может быть пугающей даже для многих разработчиков программного обеспечения. Языки, которые не имеют полной формальной мощности FOL, могут по-прежнему обеспечивать близкую к той же выразительной мощности интерфейс пользователя, который более практичен для понимания средним разработчиком. Проблема практичности реализации заключается в том, что FOL в некотором роде слишком выразительна. С помощью FOL можно создавать операторы (например, квантификация по бесконечным множествам), что приведет к тому, что система никогда не завершится, если попытается их проверить.

Таким образом, подмножество FOL может быть более простым в использовании и более практичным для реализации. Это было движущей мотивацией для экспертных систем, основанных на правилах. Правила IF-THEN предоставляют подмножество FOL, но очень полезную, которая также очень интуитивно понятна. История большинства ранних формализмов представления знаний AI; от баз данных до семантических сетей до теоретических и производственных систем можно рассматривать как различные проектные решения о том, следует ли подчеркивать выразительную силу, вычислимость и эффективность.

В ключевой статье 1993 года по этой теме Рэндалл Дэвис из Массачусетского технологического института выделил пять различных функций для анализа структуры представления знаний:

Представление знаний (KR) наиболее фундаментально является суррогатом, заменителем самой вещи, используемой для того, чтобы дать субъекту возможность определять последствия, вместо того, чтобы действовать, а не действовать, то есть рассуждать о мире, а не предпринимать действия в нем.
Это набор онтологических обязательств, т. Е. Ответ на вопрос: на каких условиях я должен думать о мире?
Это фрагментарная теория разумных рассуждений, выраженная в трех компонентах: (i) фундаментальная концепция представления разумных рассуждений; (ii) набор выводов о санкциях представительства; и (iii) набор выводов, которые он рекомендует.
Это среда для прагматически эффективного вычисления, т. Е. Вычислительная среда, в которой осуществляется мышление. Одним из вкладов в эту прагматическую эффективность является руководство, которое обеспечивает организацию информации, с тем чтобы облегчить принятие рекомендаций.
Это среда человеческого выражения, то есть язык, на котором мы говорим о мире.

Представление знаний и рассуждения являются ключевой технологией для семантической сети. Языки, основанные на модели Frame с автоматической классификацией, обеспечивают слой семантики поверх существующего Интернета. Вместо поиска через текстовые строки, как это типично сегодня, можно будет определить логические запросы и найти страницы, которые сопоставляются с этими запросами. Автоматизированный компонент рассуждений в этих системах — это механизм, известный как классификатор. Классификаторы сосредотачиваются на взаимозависимых отношениях в базе знаний, а не на правилах. Классификатор может вывести новые классы и динамически изменить онтологию по мере поступления новой информации. Эта возможность идеально подходит для постоянно меняющегося и развивающегося информационного пространства Интернета.

Семантическая сеть объединяет концепции из представления знаний и рассуждений с языками разметки на основе XML. Структура описания ресурсов (RDF) предоставляет базовые возможности для определения объектов на основе знаний в Интернете с такими основными функциями, как отношения Is-A и свойства объекта. Язык веб-онтологии (OWL) добавляет дополнительную семантику и интегрируется с авторами классификации.

Характеристики
В 1985 году Рон Брахман классифицировал основные вопросы для представления знаний следующим образом:

Примитивы. Какова базовая структура, используемая для представления знаний? Семантические сети были одним из первых примитивов представления знаний. Кроме того, структуры данных и алгоритмы для общего быстрого поиска. В этой области наблюдается сильное совпадение с исследованиями в структурах данных и алгоритмах в информатике. В ранних системах язык программирования Lisp, который был смоделирован после лямбда-исчисления, часто использовался как форма представления функциональных знаний. Рамки и правила были следующим примитивом. Языки фреймов имели различные механизмы для выражения и обеспечения ограничений на данные фрейма. Все данные в кадрах хранятся в слотах. Слоты аналогичны отношениям в моделировании сущностных отношений и объектным свойствам в объектно-ориентированном моделировании. Другим методом примитивов является определение языков, которые моделируются после логики первого порядка (FOL). Наиболее известным примером является Prolog, но есть также множество условий, доказывающих условия для специальных целей. Эти среды могут проверять логические модели и вывести новые теории из существующих моделей. По сути, они автоматизируют процесс, который логик проведет при анализе модели. Теоретическая технология доказательства имела некоторые конкретные практические применения в области разработки программного обеспечения. Например, можно доказать, что программное обеспечение жестко придерживается формальной логической спецификации.

Мета-представление. Это также известно как проблема отражения в информатике. Это относится к способности формализма иметь доступ к информации о своем собственном государстве. Примером может служить метаобъектный протокол в Smalltalk и CLOS, который дает разработчикам время выполнения доступа к объектам класса и позволяет им динамически переопределять структуру базы знаний даже во время выполнения. Мета-представление означает, что язык представления знаний сам выражается на этом языке. Например, в большинстве фреймворческих сред все кадры будут экземплярами класса фрейма. Этот объект класса можно проверять во время выполнения, чтобы объект мог понять и даже изменить его внутреннюю структуру или структуру других частей модели. В средах, основанных на правилах, правила также обычно являются примерами классов правил. Часть мета-протокола для правил была мета-правилами, которые приоритизировали увольнение правила.

Неполнота. Традиционная логика требует дополнительных аксиом и ограничений для работы с реальным миром, а не с миром математики. Кроме того, часто бывает полезно связать степени уверенности с утверждением. То есть, не просто сказать «Сократ — это человек», а «Сократ — это человек с доверием 50%». Это было одним из ранних нововведений в исследованиях экспертных систем, которые перенесли некоторые коммерческие инструменты, способность связывать факторы определенности с правилами и выводами. Более поздние исследования в этой области известны как нечеткая логика.

Определения и универсалии против фактов и дефолтов. Универсалы — это общие утверждения о мире, такие как «Все люди смертны». Факты — это конкретные примеры универсалий, таких как «Сократ — человек, а значит и смертный». В логических терминах определения и универсалии относятся к универсальной количественной оценке, а факты и дефолты относятся к экзистенциальным квантованиям. Все формы представления знаний должны иметь дело с этим аспектом, и большинство из них делают это с некоторым вариантом теории множеств, моделируя универсалии как множества, подмножества и определения как элементы этих множеств.

Немонотонное рассуждение. Немонотонное рассуждение допускает различные гипотетические рассуждения. Система связывает факты, утверждаемые с помощью правил и фактов, используемых для их оправдания, и поскольку эти факты изменяют изменения и зависимых знаний. В системах на основе правил эта способность известна как система поддержания истины.

Выразительная адекватность. Стандартом, который Брачман и большинство исследователей ИИ используют для оценки выразительной адекватности, обычно является логикой первого порядка (FOL). Теоретические ограничения означают, что полная реализация FOL непрактична. Исследователи должны четко понимать, насколько выразительны (насколько полная выразительная сила FOL) они намерены представить.

Эффективность рассуждений. Это относится к эффективности времени работы системы. Способность базы знаний обновляться, и разумный разработчик разрабатывает новые выводы в разумные сроки. В некотором смысле, это обратная сторона выразительной адекватности. В целом, чем более мощное представление, тем больше он обладает выразительной адекватностью, тем менее эффективным его автоматизированный механизм рассуждений будет. Эффективность часто была проблемой, особенно для ранних применений технологии представления знаний. Они обычно выполнялись в интерпретируемых средах, таких как Lisp, которые были медленными по сравнению с более традиционными платформами того времени.

Формализация знаний
Более формальными инструментами для представления сложных знаний являются, например, концептуальные графики или семантические сети.

В области новых технологий в области искусственного интеллекта развилось формальное представление знаний. В формальном представлении знание представлено логическими объектами, связанными свойствами, аксиомами и правилами. Этот тип представления используется в экспертных системах.

Развитие Сети, и в частности перспектива Семантической Сети, возобновило свою деятельность, введя спорный термин онтологии. В этой перспективе было разработано несколько языков, в качестве стандартных RDFS, SKOS и OWL стандартных тематических карт W3C или ISO.

Методы представления знаний
Существуют разные системы упорядочения и представления знаний. Грубо упорядоченные по степени их власти, это:

Каталог, Глоссарий, Таксономия (Простой управляемый словарь),
Классификация, тезаурус (ограниченное число отношений, обычно без отношения наследования),
Семантическая сеть, онтология, рамки, правила производства,
Аксиомальная система, предикатная логика
многослойные расширенные семантические сети (MultiNet).
Если нет формального представления или возможного, должны быть найдены другие методы для посредничества, например, в области визуализации информации.

Критерии качества представления
Важными критериями выбора системы представления знаний являются:

правильность
Как обеспечить правильный синтаксис и правильную семантику?

Адекватность / выразительность / толщина
Четко и достаточно гибко ли язык представляет требуемые компоненты онтологии?

КПД
Насколько эффективно можно заключить?

сложность
Насколько крутой является кривая обучения для сопоставления знаний и поиска знаний?

Переводимость в другие форматы синтаксиса или языки

Связи между знаниями и рассуждениями
Формальное представление знаний (или убеждений) позволяет автоматизировать различные методы обработки этой информации. Это одна из областей исследований символического искусственного интеллекта: симуляция «умных» рассуждений на основе информации.

Одной из наиболее используемых формальных рамок является пропозициональная логика. В самом деле, большое количество проблем может быть решена с помощью логики пропозиционального логики и использования алгоритмических методов, разработанных в контексте исследования проблемы SAT. Например, различные игры могут быть закодированы как пропозициональная формула.

Другие формальные рамки позволяют представлять информацию, представляющую определенную структуру, такую ​​как системы аргументации, байесовские сети или возможную логику.

Моделирование большого числа типов человеческого мышления, включая вывод (например, вывод из базы знаний) или динамику убеждений (пересмотр, сокращение и расширение рамок AGM).

Онтологическая инженерия
В ранние годы основанных на знаниях систем базы знаний были довольно небольшими. Базы знаний, предназначенные для фактического решения реальных проблем, а не для доказательства демонстраций концепции, должны были сосредоточиться на четко определенных проблемах. Так, например, не только медицинский диагноз в целом, но и медицинский диагноз некоторых видов заболеваний.

По мере расширения технологии, основанной на знаниях, стала очевидной необходимость в более широких базовых знаниях и модульных базовых знаниях, которые могли бы общаться и интегрироваться друг с другом. Это породило дисциплину онтологического проектирования, проектирования и создания больших баз знаний, которые могли бы использоваться несколькими проектами. Одним из ведущих исследовательских проектов в этой области был проект Cyc. Cyc был попыткой создать огромную энциклопедическую базу знаний, которая содержала бы не только экспертные знания, но и знания здравого смысла. При разработке агента искусственного интеллекта вскоре было осознано, что представление знаний о здравом смысле, знание, которое люди просто считают само собой разумеющимся, было необходимо для создания ИИ, способного взаимодействовать с людьми с использованием естественного языка. Cyc предназначался для решения этой проблемы. Язык, который они определили, был известен как CycL.

После CycL был разработан ряд онтологических языков. Большинство из них являются декларативными языками и являются либо языками фреймов, либо основаны на логике первого порядка. Модульность — способность определять границы вокруг определенных областей и проблемных пространств — важна для этих языков, потому что, как заявил Том Грубер, «каждая онтология является договором — социальным соглашением между людьми с общими мотивами в обмене». Всегда есть много конкурирующих и разных взглядов, которые делают невозможным любую онтологию общего назначения. Онтология общего назначения должна быть применима в любой области, и разные области знаний должны быть унифицированы.

Существует долгая история работы по созданию онтологий для различных областей задач, например онтологии для жидкостей, модели с сосредоточенными элементами, широко используемой при представлении электронных схем (например,), а также онтологий для времени, убеждений и даже само программирование. Каждый из них предлагает способ увидеть часть света.

Например, модель сосредоточенного элемента предполагает, что мы рассматриваем схемы в терминах компонентов с соединениями между ними, причем сигналы мгновенно текут по соединениям. Это полезный вид, но не единственный возможный. Другая онтология возникает, если нам нужно следить за электродинамикой в ​​устройстве: здесь сигналы распространяются с конечной скоростью, и теперь может быть необходимо рассмотреть объект (например, резистор), который ранее рассматривался как один компонент с поведением ввода-вывода как расширенная среда, через которую протекает электромагнитная волна.

Конечно, онтологии могут быть записаны на самых разных языках и обозначениях (например, логика, LISP и т. Д.); важная информация — это не форма этого языка, а контент, т. е. набор концепций, предлагаемых как способ мышления о мире. Проще говоря, важной частью являются понятия, такие как соединения и компоненты, а не выбор между написанием их как предикатов или конструкций LISP.

Обязательство, сделанное при выборе той или иной онтологии, может дать совершенно иное представление о задаче. Рассмотрим разницу, возникающую при выборе вида сосредоточенного элемента схемы, а не электродинамического вида того же устройства. В качестве второго примера медицинский диагноз, рассматриваемый с точки зрения правил (например, MYCIN), выглядит существенно отличным от той же задачи, которая рассматривается в терминах фреймов (например, INTERNIST). Там, где MYCIN видит медицинский мир, состоящий из эмпирических ассоциаций, связывающих симптом с болезнью, INTERNIST видит, что набор прототипов, в частности прототипических заболеваний, следует сопоставлять с рассматриваемым случаем.