進化型ロボット

進化型ロボット(ER)は、進化的計算を使用して自律型ロボットのコントローラおよび/またはハードウェアを開発する方法論です。ERのアルゴリズムは、最初にある分布から選択された候補コントローラの集団で頻繁に動作します。この母集団は、適応関数に従って繰り返し修正される。進化的計算における共通の方法である遺伝子アルゴリズム(または「GA」)の場合、候補コントローラの集団は、交叉、突然変異および他のGA演算子に従って繰り返し増殖され、その後、適合関数に従って選別される。ERアプリケーションで使用される候補コントローラは、人工ニューラルネットワークのセットのいくつかのサブセットから抽出することができるが、いくつかのアプリケーション(SAMUEL、人工知能の応用研究の海軍センターで開発された)は、 “IF THEN ELSE”のコレクションを個々のコントローラの構成部分として使用しています。理論的には、可能な候補コントローラの空間として、制御法則(機械学習コミュニティでポリシーと呼ばれることもある)の任意の記号式を使用することが理論的に可能である。人工ニューラルネットワークは、進化型ロボットのコンテキスト外でのロボット学習にも使用できます。特に、ロボットコントローラを学習するために、他の形態の強化学習を使用することができる。理論的には、可能な候補コントローラの空間として、制御法則(機械学習コミュニティでポリシーと呼ばれることもある)の任意の記号式を使用することが理論的に可能である。人工ニューラルネットワークは、進化型ロボットのコンテキスト外でのロボット学習にも使用できます。特に、ロボットコントローラを学習するために、他の形態の強化学習を使用することができる。理論的には、可能な候補コントローラの空間として、制御法則(機械学習コミュニティでポリシーと呼ばれることもある)の任意の記号式を使用することが理論的に可能である。人工ニューラルネットワークは、進化型ロボットのコンテキスト外でのロボット学習にも使用できます。特に、ロボットコントローラを学習するために、他の形態の強化学習を使用することができる。

発達型ロボットは、進化型ロボットとは関係がありますが、それとは異なります。ERは、時間の経過と共に進化するロボットの集団を使用しますが、DevRobは、時間の経過とともに、単一のロボットの制御システムの構成がどのように経験を通じて開発されるかに関心があります。

歴史
ERの基盤は90年代のローマの国家研究評議会で成果をあげられましたが、ロボット制御システムをゲノムにコード化し、人工進化を改善する初期の考えは80年代後半にさかのぼります。

1992年と1993年にローザンヌのEPFLでFloreanoとMondadaを取り囲む3つの研究グループと、Sussex大学でCOGS、Cliff、Harvey、およびHusbandsを含む2つ目の研究グループはM. Anthony Lewisと南カリフォルニア大学から参加した。 Andrew H Faggは、自律型ロボットの人工進化に関する実験から有望な結果を報告した。この初期の研究の成功は、世界中の研究室でこのアプローチの可能性を活用しようとする動きの波を引き起こしました。

最近では、ロボットタスクの複雑さを「スケールアップ」することの難しさは、エンジニアリングの終わりではなく、理論的な理論的な終わりに向けていくらか注目されています。

目標
進化的ロボット工学は多くの異なる目的で、しばしば同時に行われます。これらには、実世界のロボットタスクのための有用なコントローラの作成、進化論の複雑さの探究(ボールドウィン効果など)、心理現象の再現、人工物の研究による生物学的神経ネットワークの発見などがあります。人工進化によるコントローラの作成には、多数の人口の評価が必要です。これは非常に時間がかかり、コントローラの進化が通常ソフトウェアで行われる理由の1つです。また、初期のランダムコントローラは、壁に繰り返しクラッシュするなど、潜在的に有害な動作を示す可能性があり、ロボットに損傷を与える可能性があります。シミュレーションで進化したコントローラーを物理的なロボットに転送することは非常に難しく、ERアプローチを使用する上で大きな課題です。その理由は、進化は、シミュレーションの不正確さを含め、高い適応性を得るためのあらゆる可能性を自由に探ることができるからです。ERアプローチの限界要因の1つは、高速で正確なコンピュータシミュレーションを必要とする多数の評価の必要性です。

Related Post

まれに、進化的計算を使用してコントローラのほかにロボットの物理的構造を設計することができます。これの最も顕著な例の1つは、Thinking Machines CorporationのKarl Simsのデモでした。

動機
一般的に使用されている機械学習アルゴリズムの多くは、仮説入力と所望の解答の両方からなる一連の訓練例を必要とする。多くのロボット学習アプリケーションでは、望ましい答えはロボットが取る行動です。これらの行動は、通常、明示的にはあらかじめ明示されていないが、ロボットは、与えられた行動の成功または失敗を示す値を最高で受け取ることができる。フィットネス関数はコントローラがとるべき正確なアクションではなく、特定のコントローラの成功または失敗をエンコードするだけでよいので、進化的アルゴリズムはこの種の問題フレームワークの自然な解決策です。ロボット学習における進化的計算の使用の代わりに、特定の行動の適応度を知るために、q学習などの他の形式の強化学習を使用することもできます。

会議および研究機関

主なカンファレンス
遺伝的・進化的計算会議
進化的計算に関するIEEE議会
人工生命に関する欧州会議
生活

学術機関および研究者
チャーマーズ工科大学:ピーター・ノーデル、ヒューマノイド・プロジェクト
サセックス大学:Inman Harvey、Phil Husbands、Ezequiel Di Paolo
Consiglio Nazionale delle Ricerche(CNR):ステファノ・ノルフィ
EPFL:Dario Floreano
チューリッヒ大学:Rolf Pfeifer
コーネル大学:Hod Lipson
バーモント大学:Josh Bongard
インディアナ大学:Randall Beer
ノースカロライナ州立大学ロボティクス・インテリジェント・マシンセンター:Eddie Grant、Andrew Nelson
ユニバーシティカレッジロンドン:Peter J. Bentley
IDSIA Robotics Lab:Juergen Schmidhuber、Juxi Leitner
US海軍研究所
神経細胞学グループOsnabrueck大学:Frank Pasemann
カール・シムス(GenArts)による進化したバーチャル・クリーチャー
Ken Rinaldo人工生命ロボット
欧州宇宙機関の先進コンセプトチーム:Dario Izzo
バスク国の大学(UPV-EHU):Robotica Evolutiva、PabloGonzález-Nalda(スペイン語)PDF(英語)
プリマス大学:Angelo Cangelosi、Davide Marocco、Fabio Ruini、* Martin Peniak
Heriot-Watt大学:Patricia A. Vargas
ピエールとマリーキュリー大学、ISIR:Stephane Doncieux、Jean-Baptiste Mouret
パリ・スー大学、INRIA、IAO / TAO:Nicolas Bredeche
理研脳科学総合研究センター
カールスルーエ工科大学応用情報学研究所と形式記述法:ルーカス・ケーニッヒ

Share