人工智能的常识知识

在人工智能研究中,常识性知识(Commonsense knowledge)包括关于日常世界的事实,例如“柠檬酸”,所有人都应该知道。 第一个解决常识知识的人工智能程序是约翰麦卡锡于1959年创立的Advice Taker。

它目前是人工智能的一个未解决的问题,并且是保罗艾伦人工智能研究所的焦点。 常识知识可以支持常识推理过程,尝试推断诸如“你可能会因为你想让人们吃蛋糕而烤蛋糕”。 可以将自然语言处理过程附加到常识知识库,以允许知识库尝试回答关于世界的常识性问题。 常识知识也有助于解决面对不完整信息的问题。 使用广泛持有的关于日常物品或常识知识的信念,人工智能系统对人类的未知方式做出常识性假设或默认假设。 在AI系统或英语中,这表示为“正常P持有”,“通常为P”或“通常P为假设P”。 例如,如果我们知道’tweety是一只鸟’这一事实,因为我们知道人们普遍持有的关于鸟类的信念,通常是Bird Fly,在不知道其他任何关于tweety的情况下,我们可以合理地假设’tweety可以飞行’。 随着随着时间的推移发现或学习更多的世界知识,AI系统可以使用真值维护过程修改其关于tweety的假设。 如果我们后来得知’tweety是企鹅’,那么真相维护会修改这个假设,因为我们也知道’企鹅不会飞’。

常识推理
常识推理模拟了人类每天遇到的普通情境的类型和本质的假设,包括时间,缺失或不完整的信息以及因果关系。 解释因果关系的能力是可解释AI的一个重要方面。 与人类相比,所有现有的尝试人类AI的计算机程序在现代“常识推理”基准测试中表现极差,例如Winograd Schema Challenge。 在“常识知识”任务中获得人类能力的问题被认为可能是“人工智能完成”(即解决它需要能够综合完整的人类智能),尽管有些人反对这种观念并相信人类AI也需要富有同情心的智力。 常识推理已成功应用于更有限的领域,如自动诊断或分析。

应用
大约在2013年,麻省理工学院的研究人员开发了BullySpace,它是常识知识库ConceptNet的延伸,用于捕捉嘲弄社交媒体的评论。 BullySpace包含了200多个基于刻板印象的语义断言,以帮助系统推断像“戴上假发和口红并成为你真正的人”这样的评论更有可能是针对男孩而不是女孩的侮辱。

ConceptNet也被聊天机器人和构成原创小说的计算机所使用。 在劳伦斯利弗莫尔国家实验室,常识性知识用于智能软件代理,以检测违反全面禁止核试验条约的行为。

数据
例如,截至2012年,ConceptNet包含以下21种与语言无关的关系:

ISA
用于
有个
能够
欲望
CreatedBy(“蛋糕”可以通过“烘焙”创建)
部分
原因
LocatedNear
AtLocation(某处“厨师”可以是“餐馆”)
定义为
SymbolOf(X代表Y)
ReceivesAction(“蛋糕”可以“吃掉”)
HasPrerequisite(除非A做B否则X不能做Y)
MotivatedByGoal(你会“烘烤”,因为你想“吃”)
CausesDesire(“烘焙”让你想“跟随食谱”)
MadeOf
HasFirstSubevent(当你做X时需要的第一件事是实体Y做Z)
HasSubevent(“吃”有子事件“燕子”)
HasLastSubevent

常识知识库

常识知识库是当代智能系统或智能代理所具备的一种知识库。它是解决人工智能或知识工程技术瓶颈难题的一项关键措施,其特点是数量上规模大。早期人工智能或知识工程系统所具备的领域知识库是另一种知识库。也就是说,领域知识库和常识知识库是智能计算机系统所具备的知识库的两种基本类型。计算机科学领域普遍认为领域知识库和常识知识库是人工智能或知识工程技术瓶颈难题。从早期关注专家的领域知识到现在同时关注常识知识,这是人工智能或知识工程技术的一种进步。由于计算机硬件和软件以及数据库乃至数据仓库及其人机交互界面等技术的不断成熟,使得人们在21世纪开发各种专家系统所需要的各个中等规模的领域知识库和开发常识系统所需要的大规模的常识知识库都具备了基础条件。

常识性的知识
在人工智能的研究中,常识性知识是收集到的事实和一个普通人预知的信息。常识性知识问题是一个正在进行中的项目,属于知识表达领域(人工智能的一个分支领域)。它旨在创造一个常识知识库:一个数据库,包含大多数人拥有的所有的一般知识。它表达的方式,便于它可在人工智能程序中使用自然语言或作出关于普通世界的推论。这样的数据库是一种知识本体,其中最普遍的是所谓的上层本体。

多线程工作
这个问题被认为是最难的,因为人工智能研究的广度和详细的常识性知识是巨大的。任何需要常识性知识的任务,被认为是人工智能完成:许多工作要做的,以及作为一个人所没有的,它需要机器显现出作为一个人的智能。这些任务包括机器翻译、对象识别、文本挖掘和许多其它问题。要完美地执行这些任务,机器简单地知道文本在谈论什么、对象可视,这是不可能的,除非机器熟悉与一个普通人所熟悉且相同的概念。

常识内容列举
在常识知识库中的信息,可包括但不限于以下内容:

本体的类和个体
部分和对象的材料
对象的属性(如颜色和大小)
对象的功能和用途
对象的位置和分布
行动和事件的位置
行动和事件的时间
行动和事件的先决条件
行动和事件的影响(后置条件)
行动的主体和客体
装置的行为
情况或脚本的陈旧
人权的目标和需求
情感
计划和战略
故事主题
语境

流行的范例
词网(WordNet),它是一种词典式的常识知识库。
(大规模)常识知识库(Cyc),它是一种类似于百科全书的大规模常识知识库。
思想珍藏(ThoughtTreasure),它是一种涉及自然语言处理常识知识库。
语义网(Semantic Web)它是一种未来的同时具有领域知识库和常识知识库的网络。
启心常识(Open Mind Common Sense)
基本的形式化的知识本体(Basic Formal Ontology
一般的形式化的知识本体(General Formal Ontology)
概念网络(ConceptNet)
思想点阵图(Mindpixel)
知识本体((computer_science)| Ontology (computer science))
上位或上层知识本体Upper ontology)
常识推理(Commonsense reasoning )

专家的观点
有专家认为“常识性知识处理是人工知识研究的核心难题”。有专家认为“如何有效地获取领域专家的知识一直被为人工智能中的难题”。

实际的研究
例如:研究面向智能代理的大规模常识知识库的本体结构和运行机制。

数据库
CYC
Open Mind Common Sense(数据源)和ConceptNet(数据存储区和NLP引擎)
ThoughtTreasure
Mindpixel
真正的知识
DBpedia中
Graphiq