知識表現と推論

知識表現と推論(KR、KR²、KR&R)は、コンピュータシステムが医学的状態の診断や対話のような複雑なタスクを解決するために利用できる形で世界に関する情報を表現することに専念した人工知能(AI)自然言語で書かれています。 知識表現は、複雑なシステムの設計と構築を容易にする形式を設計するために、人間が問題を解決し、知識を表現する方法についての心理学の発見を取り入れています。 知識の表現と推論には、ルールの適用やセットとサブセットの関係など、さまざまな種類の推論を自動化するためのロジックの発見が組み込まれています。

知識表現形式の例には、意味論的ネット、システムアーキテクチャ、フレーム、ルール、およびオントロジーが含まれる。 自動推論エンジンの例には、推論エンジン、定理証明器、および分類器が含まれる。

この挑戦的な分野でアイデアと進歩を共有するために、KR会議シリーズが設立されました。

歴史
コンピュータ化された知識表現における最も初期の研究は、1959年にAllen NewellとHerbert A. Simonによって開発された一般的な問題ソルバ(GPS)システムのような一般的な問題解決者に焦点を当てていた。これらのシステムは、計画と分解のためのデータ構造を特色とした。 システムは目標から始めるだろう。 次に、そのゴールをサブゴールに分解し、各サブゴールを達成することができる戦略を構築するために出発する。

AIの初期段階では、A *などの一般的な検索アルゴリズムも開発されました。 しかし、GPSのようなシステムのアモルファス問題の定義は、非常に拘束されたおもちゃの領域(例えば、 “世界をブロックする”)に対してのみ働くことを意味していました。 非玩具の問題に取り組むために、Ed FeigenbaumやFrederick Hayes-RothなどのAI研究者は、制約の厳しい問題にシステムを集中させる必要があることを認識しました。

これらの努力が失敗し、心理学の認知革命とAIのフェーズにつながったのは、1970年代と80年代の専門システム、生産システム、フレーム言語などをもたらした知識表現に焦点を当てたものでした。一般的な問題解決者ではなく、 AIは、医療診断などの特定のタスクに対する人間の能力に合致するエキスパートシステムに焦点を当てました。

エキスパートシステムは、今日AIシステムが世界とルールに関する事実を持つナレッジベースと知識ベースにルールを適用して質問に答え、問題を解決する推論エンジンに分かれている、現在使用されている用語を私たちに与えました。 これらの初期のシステムでは、知識ベースはかなりフラットな構造である傾向があり、本質的にルールによって使用される変数の値についてのアサーションとなっていました。

エキスパートシステムに加えて、他の研究者は1980年代半ばにフレームベース言語の概念を開発しました。 フレームはオブジェクトクラスに似ています。これは、世界のもの、問題、潜在的な解決策を記述するカテゴリの抽象的な記述です。 フレームはもともと人間のインタラクションに合わせたシステムで使用されました。たとえば、自然言語や、レストランでの料理の注文などのさまざまなデフォルトの期待が検索スペースを狭め、システムが動的な状況に適切な対応を選択できるようにします。

フレーム・コミュニティとルールベースの研究者が、それらのアプローチ間に相乗効果があることが分かったのはずっと前です。 フレームは、実世界を表現するのに適していました。クラス、サブクラス、可能な値に関するさまざまな制約を持つスロット(データ値)として記述されていました。 ルールは、医療診断を行うプロセスなどの複雑なロジックを表現し利用するのに適していました。 フレームとルールを組み合わせた統合システムが開発されました。 最も強力で有名なのは、Intellicorpの1983年ナレッジエンジニアリング環境(KEE)でした。 KEEには、前方および後方チェインを備えた完全なルールエンジンがありました。 また、トリガー、スロット(データ値)、継承、およびメッセージの受け渡しを含む完全なフレームベースの知識ベースを備えていました。 メッセージの受け渡しは、AIではなくオブジェクト指向のコミュニティに由来していましたが、KEEやSymbolics、Xerox、Texas InstrumentsのLispマシンのオペレーティングシステムでも、AI研究者にも迅速に受け入れられました。

フレーム、ルール、およびオブジェクト指向プログラミングの統合は、KEEやSymbolicsなどの商用ベンチャーがさまざまな研究プロジェクトからスピンオフしたことによって大きく促進されました。 これが起こったのと同時に、商業的に焦点が絞られていなかった数学的論理と自動化された定理によって駆動されたもう一つの研究系統があった。 この研究で最も影響力のある言語の1つは、80年代半ばのKL-ONE言語でした。 KL-ONEは、厳密な意味論を持つフレーム言語であり、Is-A関係のような概念の正式な定義であった。 LoomのようなKL-ONEとその影響を受けた言語には、IF-THENルールではなく正式な論理に基づいた自動推論エンジンがありました。 この推論器は分類器と呼ばれます。 分類器は、一連の宣言を分析して新しいアサーションを推論することができます。たとえば、クラスを正式に指定されていない他のクラスのサブクラスまたはスーパークラスに再定義することができます。 このようにして、分類器は、既存の知識ベースから新しい事実を導き出す推論エンジンとして機能することができる。 クラシファイアは、ナレッジベース(KL-ONE言語の場合はオントロジーとも呼ばれます)で一貫性チェックを提供することもできます。

知識表現研究のもう一つの分野は、常識的な推論の問題でした。 人間の自然言語で機能するソフトウェアを作ろうとすることから学んだ最初の実現の1つは、人間が定期的に受け持っている現実世界に関する知識の広範な基礎を人間が定期的に引き受けるということでしたが、 。 例えば、常識的物理学、因果関係、意図などの基本的な原則は、事象駆動の論理では、何らかの外力によって動かされない限り、状態がある瞬間から次のものへと状態を維持するという公理が必要であるというフレーム問題である。 自然言語を使って人間と会話し、世界に関する基本的な声明や質問を処理できる真の人工知能エージェントを作るためには、この種の知識を表現することが不可欠です。 この問題に取り組む最も野心的なプログラムの1つは、Doug LenatのCycプロジェクトでした。 Cycは独自のフレーム言語を確立し、多数のアナリストにその言語の常識推論のさまざまな領域を文書化しました。 Cycに記録された知識には、時間、因果関係、物理学、意図、およびその他多くの常識モデルが含まれていました。

知識表現の出発点は、1985年にBrian C. Smithによって初めて公式化された知識表現仮説である。

機械的に実現されたインテリジェントプロセスは、a)外部の観察者が自然にプロセス全体が示す知識の命題を表現するために自然に取る構造的な要素と、b)外部の意味的帰属とは独立して、その知識を明示する行動を生み出すための不可欠な役割。

現在、知識表現研究の最も活発な分野の1つは、セマンティックウェブに関連するプロジェクトです。 セマンティックWebは、現在のインターネットの上にセマンティクス(意味)のレイヤーを追加しようとしています。 セマンティックウェブはキーワードを使ってウェブサイトやページを索引付けするのではなく、概念の大きなオントロジを作成します。 概念を検索することは、従来のテキストのみの検索よりも効果的です。 フレーム言語と自動分類は、将来のセマンティックWebのビジョンに大きな役割を果たします。 自動分類は、開発者が常に進化し続ける知識ネットワーク上で注文を提供する技術を提供します。 静的で、オンザフライで進化することができないオントロジーを定義することは、インターネットベースのシステムにとって非常に限定的である。 クラシファイア技術は、インターネットの動的環境に対処する能力を提供する。

主に国防総省先進研究プロジェクト庁(DARPA)が資金を提供する最近のプロジェクトでは、フレーム言語と分類器をXMLに基づくマークアップ言語と統合しています。 RDF(Resource Description Framework)は、オブジェクトのクラス、サブクラス、およびプロパティを定義する基本的な機能を提供します。 Web Ontology Language(OWL)は、セマンティクスの追加レベルを提供し、分類エンジンとの統合を可能にします。

概要
知識表現は、複雑な問題を解決するために使用できる世界に関する情報を収集するコンピュータ表現を設計することに焦点を当てた人工知能の分野です。

知識表現の正当性は、従来の手続き型コードは、複雑な問題を解決するための最良の形式化ではないということです。 知識表現は、複雑なソフトウェアを手続き型コードよりも定義し維持することを容易にし、エキスパートシステムで使用することができます。

たとえば、コードではなくビジネスルールの面で専門家と話すことで、ユーザーと開発者の間の意味のギャップが小さくなり、複雑なシステムの開発がより実用的になります。

知識表現は、知識を明示的に表現する主な目的の1つは、その知識について推論すること、推論を行うこと、新しい知識をアサートすることなどであるため、自動推論と関連している。事実、すべての知識表現言語は、推論エンジンまたは推論エンジンシステムの一部として

知識表現形式の設計において重要なトレードオフは、表現力と実用性の間の関係である。 表現力とコンパクトさの観点からの究極の知識表現形式は、First Order Logic(FOL)です。 世界についての一般的な命題を定義するために数学者が使用するものよりも強力な形式主義はありません。 しかし、FOLには知識の表現形式として2つの欠点があります。使いやすさと実装の実用性です。 一次論理は、多くのソフトウェア開発者にとってさえも脅威になる可能性があります。 FOLの正式な権限を持たない言語は、平均的な開発者が理解できるように、より現実的なユーザーインターフェイスで、表現力に近い表現力を提供することができます。 実装の実用性の問題は、いくつかの点でFOLはあまりにも表現力があるということです。 FOLを使用すると、検証しようとするとシステムが決して終了しないような文を作成することができます(例:無限集合の数量化など)。

したがって、FOLのサブセットは、使用するのが容易であり、実装するのがより実用的であり得る。 これはルールベースのエキスパートシステムの背後にある原動力でした。 IF-THENルールはFOLのサブセットを提供しますが、非常に便利なものも非常に直感的です。 初期のAI知識表現形式の大部分の歴史。 データベースからセマンティック・ネットから定理証明者やプロダクション・システムまでは、表現力や計算力、効率性を重視するかどうかのさまざまな設計上の決定と見ることができます。

トピックに関する重要な1993年の論文では、MITのRandall Davisは、知識表現フレームワークを分析するために5つの異なる役割を概説しました:

知識表現(KR)は、企業が行動ではなく思考、すなわち行動を取るのではなく推論することによって、結果を決定できるようにするために使用される、本質的にはサロゲートであり、物そのものの代替物です。
それは、存在論的な約束のセットです。すなわち、質問に対する答えです。私は世界についてどのような言葉で考えるべきですか?
それは3つの要素の観点から表現された知的推論の断片的な理論である:(i)表現の知的推論の基本的概念。 (ii)代表制裁の推論のセット; (iii)推薦する推論の集合。
これは、実用的に効率的な計算、すなわち思考が達成される計算環境のための媒体です。 この実用的な効率への貢献の1つは、推薦された推論の作成を容易にするように情報を整理するための表現が提供するガイダンスによって提供される。
それは人間の表現の媒体、すなわち世界についてのことを言う言葉です。

ナレッジの表現と推論は、セマンティックWebにとって重要な可能な技術です。 自動分類によるフレームモデルに基づく言語は、既存のインターネットの上にセマンティクスの層を提供します。 今日の典型的なテキスト文字列で検索するのではなく、論理クエリを定義し、それらのクエリにマップするページを見つけることができます。 これらのシステムの自動化された推論コンポーネントは、クラシファイアと呼ばれるエンジンです。 クラシファイアは、ルールではなく知識ベースの包含関係に焦点を当てます。 分類器は、新しい情報が利用可能になると、新しいクラスを推論し、動的にオントロジを変更することができる。 この機能は、インターネットの絶え間なく変化し、進化する情報空間にとって理想的です。

セマンティックWebは、知識表現と推論の概念をXMLに基づくマークアップ言語と統合します。 RDF(Resource Description Framework)は、インターネット上の知識ベースのオブジェクトを、Is-A関係やオブジェクトのプロパティなどの基本的な機能を定義するための基本的な機能を提供します。 Web Ontology Language(OWL)は、セマンティクスを追加し、自動分類リスナーと統合します。

特性
1985年に、Ron Brachmanは知識表現の中心的な問題を以下のように分類しました。

プリミティブ。 知識を表現する基礎となるフレームワークは何ですか? 意味ネットワークは、最初の知識表現プリミティブの1つでした。 また、一般的な高速検索のためのデータ構造およびアルゴリズム。 この分野では、コンピュータサイエンスにおけるデータ構造やアルゴリズムの研究との重複があります。 初期のシステムでは、ラムダ計算の後にモデル化されたLispプログラミング言語は、しばしば機能的知識表現の一形式として使用されていました。 フレームとルールは次の種類のプリミティブでした。 フレーム言語には、フレームデータに対する制約を表現し強制するためのさまざまなメカニズムがありました。 フレーム内のすべてのデータはスロットに格納されます。 スロットは、エンティティリレーションモデリングにおける関係や、オブジェクト指向モデリングにおけるオブジェクトプロパティに類似しています。 プリミティブのもう1つの技法は、First Order Logic(FOL)の後にモデル化された言語を定義することです。 最もよく知られている例はPrologですが、多くの特別目的定理証明環境もあります。 これらの環境は論理モデルを検証し、既存のモデルから新しい理論を導き出すことができます。 基本的に、彼らは、論理分析者がモデルを分析する過程を自動化します。 定理を証明する定理は、ソフトウェア工学の分野でいくつかの具体的な実用的なアプリケーションを持っていました。 例えば、ソフトウェアプログラムが正式な論理仕様に厳密に従うことを証明することが可能である。

メタ表現。 これは、コンピュータサイエンスでの反射の問題としても知られています。 それは、形式主義が自国の状態に関する情報にアクセスできる能力を指しています。 例としては、開発者にクラス・オブジェクトへの実行アクセスを与え、実行時にも知識ベースの構造を動的に再定義できるようにするSmalltalkとCLOSのメタオブジェクト・プロトコルがあります。 メタ表現とは、知識表現言語自体がその言語で表現されていることを意味します。 たとえば、ほとんどのフレームベースの環境では、すべてのフレームがフレームクラスのインスタンスになります。 そのクラスオブジェクトは実行時に検査することができるので、オブジェクトはその内部構造やモデルの他の部分の構造を理解し、変更することさえできます。 ルール・ベースの環境では、ルールは通常、ルール・クラスのインスタンスでした。 ルールのメタプロトコルの一部は、ルールの起動を優先させるメタルールでした。

Related Post

不完全さ。 伝統的な論理は、数学の世界とは対照的に、現実世界に対処するための追加の公理と制約を必要とします。 また、信頼度をステートメントに関連付けることはしばしば有用です。 つまり、「ソクラテスは人間である」というだけでなく、「ソクラテスは人間であり、自信を持って50%です」と言います。 これは、いくつかの商用ツールに移行したエキスパートシステム研究の初期の革新の1つであり、確実性要因をルールと結論に関連付ける能力でした。 この分野における後の研究は、ファジー論理として知られている。

定義と普遍性と事実とデフォルト。 ユニバーサルは、「すべての人間は死に至る」のような世界に関する一般的な陳述です。 事実は、「ソクラテスは人間であり、したがって死に至る」などの普遍の具体例である。 論理的に言えば、定義と普遍は普遍的な定量化についてのものであり、事実とデフォルトは実在の定量化に関するものです。 すべての形態の知識表現はこの側面を扱わなければならず、ほとんどの場合、集合理論のいくつかの変種で、普遍集合を集合と部分集合として定義し、それらの集合の要素として定義する。

非単調推論。 非単調推論は、様々な種類の仮説推論を可能にする。 システムは、アサーションされたファクトとそれを正当化するために使用されたファクトとを関連づけ、そのファクトが変更されると、依存する知識も更新されます。 ルールベースのシステムでは、この機能は真実維持システムとして知られています。

表現的妥当性。 Brachmanと多くのAI研究者が表現の妥当性を測定するために使用する標準は、通常First Order Logic(FOL)です。 理論的な限界は、FOLの完全な実装が実用的でないことを意味する。 研究者は、彼らが表現しようとしている表現力豊かな(どれだけの完全な表現力)を明確にすべきである。

推論効率。 これは、システムの実行時効率を指します。 妥当な期間内に知識ベースを更新し、推論者が新しい推論を開発する能力。 いくつかの点で、これは表現力のある妥当性の裏側です。 一般に、表現がより強力であるほど、表現力のある妥当性が高いほど、自動化された推論エンジンの効率は低下します。 効率性はしばしば問題であり、特に知識表現技術の早期適用には問題があった。 それらは通常、時間のより伝統的なプラットフォームと比較して遅いLispのような解釈された環境で実装されました。

知識の形式化
複雑な知識を表現するためのより正式なツールは、例えば、概念グラフや意味ネットワークです。

新技術の分野では、人工知能の分野で知識の形式的表現が発展してきた。 正式な表現では、知識は、プロパティ、公理、および規則によって接続された論理オブジェクトによって表される。 このタイプの表現はエキスパートシステムで使用されます。

Webの開発、特にセマンティックWebの観点から、オントロジーの論争の的になる用語を導入することでドメインを更新しました。 この視点では、W3CまたはISO標準のTopic Mapsの標準RDFS、SKOS、OWLとして多くの言語が開発されています。

知識表現の技法
知識の順序づけと表現には異なるシステムがあります。 彼らの力の程度に応じて大まかには、これらは次のとおりです:

カタログ、用語集、タクソノミ(簡単制御語彙)、
分類、シソーラス(通常継承関係のない限定された数の関係)、
セマンティックネットワーク、オントロジ、フレーム、制作ルール、
公理システム、述語論理
多層拡張セマンティックネットワーク(MultiNet)。
正式な表現や可能性がない場合、例えば情報の視覚化の分野において、他の方法が媒介することが見出されなければならない。

表現の質の基準
知識表現システムを選択するための重要な基準は次のとおりです。

正しさ
正しい構文と正しいセマンティクスを確保する方法

妥当性/表現力/厚さ
言語は必要なオントロジーコンポーネントを明確かつ柔軟に表現していますか?

効率
どのように効率的に結論できますか?

複雑
知識マッピングと知識検索の学習曲線はどれほど急峻ですか?

他の構文形式または言語への翻訳能力

知識と推論のリンク
知識(または信念)の正式な表現は、この情報に関する様々な処理を自動化することを可能にする。 これは、象徴的な人工知能の研究分野の1つであり、情報に基づく「知的」推論のシミュレーションです。

最もよく使用される正式なフレームワークの1つは、命題論理です。 確かに、命題論理コーディングとSAT問題に関する研究の文脈で開発されたアルゴリズム技術の使用によって、多数の問題を解決することができます。 例えば、様々なゲームを命題式としてコード化することができる。

他の正式なフレームワークは、議論システム、ベイジアンネットワーク、または可能性のある論理など、特定の構造を示す情報を表現することを可能にする。

推論(例えば、知識ベースの結果を得ることができる)や信念の力学(AGMフレームワークの改訂、縮小および拡張)を含む、多数のタイプの人間推論がモデル化されている。

オントロジーエンジニアリング
初期の知識ベースのシステムでは、知識ベースはかなり小さかった。 よく定義された問題に焦点を当てるために必要な概念実証の証明を行うのではなく、実際の問題を実際に解決することを意図した知識ベース。 たとえば、全体的な話題としての医療診断だけでなく、特定の種類の病気の医学的診断などです。

知識ベースの技術が拡大するにつれ、より広範な知識ベースと、相互に通信して統合できるモジュール式知識ベースの必要性が明らかになりました。 これは、オントロジエンジニアリングの規律を生み出し、複数のプロジェクトで使用できる大規模な知識ベースを設計および構築しました。 この分野の主な研究プロジェクトの1つはCycプロジェクトでした。 Cycは、専門知識だけでなく常識知識を含む巨大な百科事典の知識ベースを構築しようとする試みでした。 人工知能エージェントを設計するにあたっては、人間が自然言語を使って人間と対話できるAIを作るためには、人間が単純に取る知識である常識知識を表現することがすぐに実現することがすぐに分かった。 Cycはこの問題に対処することを意図していました。 彼らが定義した言語はCycLとして知られていました。

CycLの後、多くのオントロジ言語が開発されている。 ほとんどは宣言型言語であり、フレーム言語であるか、または一次論理に基づいています。 トム・グルーバーの言葉通り、「すべてのオントロジーは条約であり、共通の動機を持つ人々の間での社会的合意」であるため、モジュール性 – 特定のドメインと問題空間の境界を定義する能力 – はこれらの言語にとって不可欠です。 任意の汎用オントロジーを不可能にする多くの競合する意見と異なる意見が常にあります。 汎用オントロジーはどのドメインでも適用可能であり、異なる知識領域を統一する必要があります。

液体のためのオントロジー、電子回路(例えば、)を表現するのに広く使われている集中定数要素モデル、時間、信念、およびオントロジーなど、さまざまなタスク領域のオントロジーを構築しようとする長い歴史があります。プログラミング自体も。 これらはそれぞれ、世界の一部を見る方法を提供します。

例えば、集中定数モデルは、回路間の接続を持つコンポーネントの観点から回路を考え、その信号は接続に沿って瞬間的に流れることを示唆しています。 これは有用なビューですが、唯一可能なビューではありません。 私たちがデバイスの電気力学に関わる必要があるならば、異なるオントロジーが生まれます。信号は有限の速度で伝播し、I / O動作を持つ単一のコンポーネントとして以前見られていたオブジェクト(抵抗器のようなもの)は考えられる必要があります電磁波が流れる拡張媒体としての役割を果たす。

オントロジーはもちろん、多種多様な言語や表記法(例えば、論理、LISPなど)で書くことができます。 不可欠な情報はその言語の形ではなく、内容、すなわち世界を考える方法として提供される一連の概念です。 簡単に言えば、重要な部分は、接続やコンポーネントのような概念であり、述語やLISP構造として書くことの選択ではありません。

1つまたは別のオントロジーを選択することにより、コミットメントは、手元のタスクを大きく異なる視点で生成することができます。 同じデバイスの電気力学的図ではなく、回路の一括要素図を選択する際に生じる相違点を考慮してください。 第2の例として、ルール(例えば、MYCIN)で見た医療診断は、フレーム(例えば、INTERNIST)に関して見た同じタスクとは実質的に異なって見える。 MYCINは、病気と症状を結びつける経験的な団体で構成されているように医療界を見ているところで、プロトタイプ、特にプロトタイプの病気のセットを手元のケースに合わせて見ています。

Share