الروبوتات التطورية

الروبوتات التطورية (ER) هي منهجية تستخدم الحوسبة التطورية لتطوير أجهزة التحكم و / أو الأجهزة للروبوتات المستقلة. الخوارزميات في ER تعمل في كثير من الأحيان على مجموعات من وحدات تحكم المرشح ، في البداية مختارة من بعض التوزيع. يتم بعد ذلك تعديل هذا العدد بشكل متكرر وفقًا لوظيفة اللياقة البدنية. في حالة الخوارزميات الجينية (أو “GA”) ، وهي طريقة شائعة في الحوسبة التطورية ، تزرع مجموعة من وحدات التحكم المرشحة بشكل متكرر وفقًا للتقاطع ، والطفرة وغيرها من مشغلات GA ثم يتم التخلص منها وفقًا لوظيفة اللياقة البدنية. يمكن استخلاص وحدات التحكم المرشحة المستخدمة في تطبيقات ER من بعض المجموعات الفرعية لمجموعة الشبكات العصبية الاصطناعية ، على الرغم من بعض التطبيقات (بما في ذلك SAMUEL ، وضعت في المركز البحري للبحوث التطبيقية في الذكاء الاصطناعي) استخدام مجموعات من “إذا كان ذلك لاحقا” القواعد باعتبارها الأجزاء المكونة لوحدة تحكم فردية. من الممكن نظريًا استخدام أي مجموعة من الصياغات الرمزية لقانون التحكم (تسمى أحيانًا سياسة في مجتمع التعلم الآلي) كمساحة للتحكمات المحتملة للمرشحين. يمكن أيضًا استخدام الشبكات العصبية الاصطناعية لتعلم الروبوت خارج سياق الروبوتات التطورية. على وجه الخصوص ، يمكن استخدام أشكال أخرى من التعلم التعزيز لتعلم أجهزة التحكم في الروبوت. من الممكن نظريًا استخدام أي مجموعة من الصياغات الرمزية لقانون التحكم (تسمى أحيانًا سياسة في مجتمع التعلم الآلي) كمساحة للتحكمات المحتملة للمرشحين. يمكن أيضًا استخدام الشبكات العصبية الاصطناعية لتعلم الروبوت خارج سياق الروبوتات التطورية. على وجه الخصوص ، يمكن استخدام أشكال أخرى من التعلم التعزيز لتعلم أجهزة التحكم في الروبوت. من الممكن نظريًا استخدام أي مجموعة من الصياغات الرمزية لقانون التحكم (تسمى أحيانًا سياسة في مجتمع التعلم الآلي) كمساحة للتحكمات المحتملة للمرشحين. يمكن أيضًا استخدام الشبكات العصبية الاصطناعية لتعلم الروبوت خارج سياق الروبوتات التطورية. على وجه الخصوص ، يمكن استخدام أشكال أخرى من التعلم التعزيز لتعلم أجهزة التحكم في الروبوت.

ترتبط الروبوتات التطورية بالروبوتات التطورية ولكنها تختلف عنها. تستخدم ER مجموعات من الروبوتات التي تتطور مع مرور الوقت ، بينما تهتم DevRob بكيفية تطور نظام التحكم في الروبوت الواحد من خلال التجربة ، مع مرور الوقت.

التاريخ
تم وضع أساس ER مع العمل في مجلس البحث الوطني في روما في التسعينات ، ولكن الفكرة الأولية لترميز نظام التحكم في الروبوت في الجينوم ولها تطور صناعي تتحسن عليه تعود إلى أواخر الثمانينيات.

في عامي 1992 و 1993 ، شملت ثلاث مجموعات بحثية ، واحدة تحيط بـ Floreano و Mondada في EPFL في لوزان والثانية تشمل كليف وهارفي وأزاندز من COGS في جامعة Sussex والثالثة من جامعة جنوب كاليفورنيا ، M. Anthony Lewis و أعلن أندرو إتش فاج نتائج واعدة من التجارب على التطور الاصطناعي للروبوتات المستقلة. أثار نجاح هذا البحث المبكر موجة من النشاط في المختبرات في جميع أنحاء العالم في محاولة لتسخير إمكانات النهج.

في الآونة الأخيرة ، تحولت صعوبة “زيادة” تعقيد مهام الروبوت من الاهتمام إلى حد ما بالنهاية النظرية للحقل بدلاً من النهاية الهندسية.

الأهداف
يتم تحقيق الروبوتات التطورية مع العديد من الأهداف المختلفة ، في كثير من الأحيان في نفس الوقت. ويشمل ذلك إنشاء وحدات تحكم مفيدة لمهام الروبوت الحقيقية ، واستكشاف تعقيدات نظرية التطور (مثل تأثير بالدوين) ، وإعادة إنتاج الظواهر النفسية ، ومعرفة الشبكات العصبية البيولوجية من خلال دراسة الشبكات الاصطناعية. يتطلب إنشاء وحدات التحكم عن طريق التطور الصناعي عددًا كبيرًا من التقييمات لعدد كبير من السكان. هذا هو مضيعة للوقت للغاية ، وهو أحد الأسباب التي تجعل عادةً تطور وحدة التحكم في البرامج. أيضاً ، قد تظهر وحدات التحكم العشوائية الأولية سلوكًا ضارًا محتملاً ، مثل التعطل المتكرر في جدار ، مما قد يؤدي إلى تلف الروبوت. نقل وحدات التحكم تطورت في المحاكاة إلى الروبوتات المادية أمر صعب جدا وتحديا كبيرا في استخدام نهج ER. والسبب هو أن التطور مجاني لاستكشاف جميع الاحتمالات للحصول على لياقة عالية ، بما في ذلك أي عدم دقة في المحاكاة. وهذه الحاجة إلى عدد كبير من التقييمات ، التي تتطلب محاكاة حاسوبية سريعة ودقيقة ، هي أحد العوامل المقيدة للنهج ER.

في حالات نادرة ، يمكن استخدام الحساب التطوري لتصميم البنية الفيزيائية للروبوت ، بالإضافة إلى وحدة التحكم. واحدة من أبرز الأمثلة على هذا هو عرض كارل سيمز لشركة Thinking Machines Corporation.

التحفيز
تتطلب العديد من خوارزميات تعلم الآلة الشائعة استخدام مجموعة من الأمثلة التدريبية التي تتكون من كل من إدخال افتراضي وإجابة مرغوبة. في العديد من تطبيقات تعلم الروبوت ، فإن الإجابة المطلوبة هي إجراء يجب على الروبوت اتباعه. عادة ما تكون هذه الإجراءات غير معروفة بشكل واضح بشكل مسبق ، وبدلاً من ذلك يمكن للروبوت في أحسن الأحوال الحصول على قيمة تشير إلى نجاح أو فشل إجراء معين تم اتخاذه. الخوارزميات التطورية هي حلول طبيعية لهذا النوع من إطار المشكلة ، لأن وظيفة اللياقة البدنية تحتاج فقط إلى ترميز نجاح أو فشل وحدة تحكم معينة ، بدلاً من الإجراءات الدقيقة التي يجب أن يتخذها جهاز التحكم. بديل لاستخدام الحساب التطوري في تعلم الروبوت هو استخدام أشكال أخرى من التعلم التعزيزي ، مثل التعلم ، لمعرفة لياقة أي إجراء معين ،

المؤتمرات والمعاهد

المؤتمرات الرئيسية
مؤتمر الحوسبة الجينية والتطورية
مؤتمر IEEE بشأن الحوسبة التطورية
المؤتمر الأوروبي للحياة الاصطناعية
حياة

المعاهد الأكاديمية والباحثين
جامعة تشالمرز للتكنولوجيا: بيتر نوردين ، مشروع الإنسان
جامعة ساسكس: إنمان هارفي ، فيل هوسباندز ، إزيكويل دي باولو
Consiglio Nazionale delle Ricerche (CNR): Stefano Nolfi
EPFL: داريو فلوريانو
جامعة زيوريخ: رولف فايفر
جامعة كورنيل: هود ليبسون
جامعة فيرمونت: جوش بونجارد
جامعة إنديانا: راندال بير
مركز الروبوتات والآلات الذكية ، جامعة ولاية كارولينا الشمالية: إيدي غرانت ، أندرو نيلسون
University College London: Peter J. Bentley
مختبر IDSIA للروبوتات: يورجن شميدهوبر ، جوتشي لايتنر
مختبر البحوث البحرية الأمريكية
جامعة أوسنابروك ، Neurocybernetics المجموعة: فرانك Pasemann
المخلوقات الافتراضية تطورت بواسطة كارل سيمز (GenArts)
كين رينالدو الروبوتات الحياة الاصطناعية
فريق المفاهيم المتقدم لدى وكالة الفضاء الأوروبية: داريو إيزو
جامعة إقليم الباسك (UPV-EHU): Robótica Evolutiva، Pablo González-Nalda (in Spanish) PDF (in English)
جامعة بليموث: Angelo Cangelosi، Davide Marocco، Fabio Ruini، * Martin Peniak
جامعة هيريوت وات: Patricia A. Vargas
جامعة بيير وماري كوري ، ISIR: Stephane Doncieux ، جان بابتيست موريه
جامعة باريس-سود و INRIA ، IAO / TAO: نيكولاس Bredeche
معهد ريكن برين للعلوم
معهد كارلسروه للتكنولوجيا ، معهد المعلوماتية التطبيقية والوسائل الرسمية الوصف: لوكاس كونيج