发展机器人

发展机器人(DevRob),有时也称为表观遗传机器人,是一个科学领域,旨在研究发展机制,架构和约束,允许终身和开放式学习体验机器中的新技能和新知识。 与人类儿童一样,学习预计将是累积的,并且逐渐增加复杂性,并且结合社会互动来自我探索世界。 典型的方法论方法包括从发展心理学,神经科学,发育和进化生物学以及语言学等领域阐述的人类和动物发展理论开始,然后在机器人中形式化和实施它们,有时探索它们的扩展或变体。 机器人中的这些模型的实验允许研究人员将它们与现实对抗,因此发展机器人技术也提供了关于人类和动物发展理论的反馈和新假设。

发展机器人与进化机器人(ER)有关,但不同。 ER使用随着时间推移而发展的机器人群,而DevRob对于随着时间的推移,单个机器人控制系统的组织如何通过经验发展感兴趣。

DevRob还与机器人和人工生命领域的工作有关。

背景
机器人能像孩子一样学习吗? 它能否在设计时和部分未知和不断变化的环境中学习各种新技能和新知识? 它如何发现它的身体及其与物理和社会环境的关系? 一旦工程师“走出工厂”,如果没有工程师的干预,它的认知能力如何不断发展? 通过与人类的自然社会互动,它能学到什么? 这些是发展机器人技术的核心问题。 艾伦·图灵以及其他一些控制论先驱者已经在1950年提出了这些问题和一般方法,但直到20世纪末才开始系统地研究它们。

由于自适应智能机的概念是发展机器人的核心,它与人工智能,机器学习,认知机器人或计算神经科学等领域有关。 然而,虽然它可能会重复使用这些领域中阐述的一些技术,但它与许多方面的不同之处在于它们。 它不同于传统的人工智能,因为它不具备先进的符号推理能力,而是侧重于体现和定位的感觉运动和社交技能,而不是抽象的象征性问题。 它不同于传统的机器学习,因为它针对的是独立于任务的自主学习,而不是针对“勺子喂人类编辑的传感器数据”的任务特定推理(Weng et al。,2001)。 它与认知机器人不同,因为它侧重于允许形成认知能力的过程而不是这些能力本身。 它与计算神经科学不同,因为它侧重于集成开发和学习架构的功能建模。 更一般地说,发展机器人技术的独特之处在于以下三个特征:

它针对任务独立的架构和学习机制,即机器/机器人必须能够学习工程师不知道的新任务;
它强调开放式发展和终身学习,即有机体不断获得新技能的能力。 这不应被理解为学习“任何东西”甚至“一切”的能力,而只是被收集的技能集可以至少在某些(并非所有)方向上无限延伸;
获得的知识和技能的复杂性将逐步增加(并且增加得到控制)。

发展机器人技术出现在几个研究团体的十字路口,包括具体的人工智能,动态系统认知科学,连接主义。 从学习和发展的基本观点出发,作为大脑,身体及其身体和社会环境之间动态相互作用的自组织结果,并试图理解如何利用这种自我组织来提供与任务无关的终身学习发展机器人技术日益复杂,与发展心理学,发育和认知神经科学,发育生物学(胚胎学),进化生物学和认知语言学等领域强烈相互作用。 由于许多来自这些科学的理论都是口头的和/或描述性的,这意味着发展机器人技术中的关键形式化和计算建模活动。 这些计算模型不仅用作探索如何构建更多功能和自适应机器的方法,而且还用作评估其一致性的方法,并可能探索用于理解生物发育的替代解释。

研究方向
技能领域
由于一般的方法和方法,发展机器人项目通常专注于让机器人开发与人类婴儿相同类型的技能。 重要的第一类是调查感觉运动技能。 这些包括发现自己的身体,包括其结构和动态,如手眼协调,运动,与物体的互动以及工具使用,特别关注发现和学习可供性。 发展机器人所针对的第二类技能是社交和语言技能:获取简单的社交行为游戏,如轮流,协调互动,词典,语法和语法,以及将这些语言技能融入感觉运动技能(有时会被引用)作为符号接地)。 与此同时,正在研究相关认知技能的获得,例如自我/非自我区分的出现,注意力能力的发展,分类系统的发展以及可供性或社会结构的更高层次表征,价值的出现,同理心或心灵理论。

机制和制约因素
人类和机器人生活的感觉运动和社交空间如此庞大和复杂,以至于只有一小部分潜在可学习技能可以在一生中实际探索和学习。 因此,需要机制和约束来指导发育生物的发展和控制复杂性的增长。 在发展机器人技术中研究了这些引导机制和约束的几个重要族,所有这些都受到人类发展的启发:

激励系统,产生驱动探索和学习的内部奖励信号,可以是两种主要类型:
外在动机推动机器人/生物体维持基本的特定内部属性,如食物和水位,物理完整性或光线(例如在向光系统中);
内在动机推动机器人寻找新奇,挑战,压缩或学习进步本身,从而产生有时被称为好奇心驱动的学习和探索,或者主动学习和探索;
社会指导:随着人类通过与同伴互动而学到很多东西,发展机器人研究机制可以让机器人参与类似人类的社交互动。 通过感知和解释社会线索,这可能允许机器人向人类学习(通过模仿,仿真,刺激增强,演示等多种手段……)并触发自然的人类教育学。 因此,还研究了发展机器人的社会接受度;
统计推断偏差和累积知识/技能重用:表征表示/编码和推理机制的偏差通常可以显着提高学习效率,因此可以进行研究。 与此相关,通过重复使用先前学习的结构来推断新知识和获得新技能的机制也是必不可少的研究领域;
实施例的属性,包括通常被编码为动态系统的几何形状,材料或先天运动原语/协同作用,可以显着简化感觉运动或社交技能的获取,并且有时被称为形态计算。 这些约束与其他约束的相互作用是一个重要的调查轴;
成熟约束:在人类婴儿中,身体和神经系统都在逐渐成长,而不是在出生时已经完全成熟。 这意味着例如新的自由度以及可用感觉运动信号的音量和分辨率的增加可能表现为学习和发展。 将这些机制转移到发育机器人中,并了解它如何阻碍或相反,可以轻松获得新颖的复杂技能,这是发展机器人技术的核心问题。

Related Post

从生物模仿发展到功能灵感。
虽然大多数发展机器人项目与动物和人类发展理论强烈相互作用,但已识别的生物机制与机器人中的对应物之间的相似程度和灵感,以及建模的抽象层次可能会有很大差异。 虽然一些项目旨在精确建模功能和生物实现(神经或形态模型),例如神经机器人,但其他一些项目只关注上述机制和约束的功能建模,并可能例如在其架构技术中重用来自应用数学或工程领域。

打开问题
由于发展机器人技术是一个相对新颖的研究领域,同时又雄心勃勃,许多基本的开放性挑战仍有待解决。

首先,现有的技术远不是允许现实世界的高维机器人在一生中学习日益复杂的技能的开放式曲目。 高维连续感觉运动空间是一个需要解决的主要障碍。 终身累积学习是另一回事。 实际上,到目前为止还没有建立持续超过几天的实验,这与人类婴儿学习基本感觉运动技能所需的时间段形成鲜明对比,同时配备了比现有计算机制更强大的大脑和形态。

在为实现这一目标而进行探索的战略中,应更系统地研究上一节所述机制与制约因素之间的相互作用。 实际上,到目前为止它们主要是孤立地研究的。 例如,内在动机学习和社会引导学习的相互作用(可能受成熟约束)是一个需要研究的重要问题。

另一个重要的挑战是允许机器人在人机交互过程中感知,解释和利用非工程人员提供的多模式社会线索的多样性。 到目前为止,这些能力大多受限于不允许人类进行有效的通用教学。

需要理解和解决的基本科学问题,同样适用于人类发展,是在发展过程中如何在感觉运动和社会结构的各个层面上形成和利用组合性,功能等级,原始和模块性。 这与符号出现的问题密切相关,有时在语言习得方面被称为“符号基础问题”。 实际上,大脑中符号的存在和需求受到了积极的质疑,正在研究仍然允许组合性和功能层次的替代概念。

在生物表观发生过程中,形态学并不固​​定,而是与感觉运动和社交技能的发展不断相互作用而发展。 形态学的发展给机器人带来了明显的实际问题,但它可能是一个至关重要的机制,至少在模拟中,如形态机器人技术。

另一个开放性问题是理解发育机器人研究的关键现象(例如,分层和模块化感觉运动系统,内在/外在/社会动机和开放式学习)与潜在的大脑机制之间的关系。

同样,在生物学中,发育机制(在个体发育时间尺度上运作)与进化机制(在系统发育时间尺度上运作)强烈相互作用,如繁荣的“evo-devo”科学文献所示。 然而,这些机制在人造生物,特别是发育机器人中的相互作用仍然未得到充分的研究。 因此,进化机制,展开形态和开发感觉运动和社交技能的相互作用将成为发展机器人未来的一个高度刺激的话题。

Share