प्रतिक्रियाशील योजना – HiSoUR कला संस्कृति का इतिहास

कृत्रिम बुद्धि में, प्रतिक्रियाशील नियोजन स्वायत्त एजेंटों द्वारा एक्शन चयन के लिए तकनीकों के एक समूह को दर्शाता है। ये तकनीक शास्त्रीय योजना से दो पहलुओं में भिन्न होती हैं। सबसे पहले, वे एक समय पर फैशन में काम करते हैं और इसलिए अत्यधिक गतिशील और अप्रत्याशित वातावरण का सामना कर सकते हैं। दूसरा, वर्तमान संदर्भ के आधार पर, वे प्रत्येक तत्काल में केवल एक अगली कार्रवाई की गणना करते हैं। प्रतिक्रियाशील योजनाकार अक्सर (लेकिन हमेशा नहीं) प्रतिक्रियाशील योजनाओं का फायदा उठाते हैं, जो एजेंट की प्राथमिकताओं और व्यवहार का वर्णन करने वाली संरचनाओं को संग्रहीत करते हैं।

यद्यपि शब्द प्रतिक्रियाशील योजना कम से कम 1 9 88 तक जाती है, फिर भी शब्द “प्रतिक्रियाशील” अब सक्रिय रूप से एक एंटोनिम के रूप में उपयोग किया जाने वाला अपमानजनक बन गया है। चूंकि प्रतिक्रियाशील नियोजन का उपयोग करने वाले लगभग सभी एजेंट सक्रिय हैं, कुछ शोधकर्ताओं ने गतिशील योजना के रूप में प्रतिक्रियाशील योजना का जिक्र करना शुरू कर दिया है।

प्रतिक्रियाशील योजना प्रतिनिधित्व
एक प्रतिक्रियाशील योजना का प्रतिनिधित्व करने के कई तरीके हैं। सभी को बुनियादी प्रतिनिधित्व इकाई और इन इकाइयों को योजनाओं में लिखने के साधनों की आवश्यकता होती है।

हालत-कार्य नियम (प्रोडक्शंस)
एक शर्त कार्रवाई नियम, या यदि-तो नियम, फ़ॉर्म में एक नियम है: यदि स्थिति तब कार्रवाई करें। इन नियमों को प्रोडक्शंस कहा जाता है। नियम का अर्थ इस प्रकार है: यदि स्थिति है, तो कार्रवाई करें। कार्रवाई या तो बाहरी हो सकती है (उदाहरण के लिए, कुछ उठाओ और इसे स्थानांतरित करें), या आंतरिक (उदाहरण के लिए, आंतरिक स्मृति में एक तथ्य लिखें, या नियमों के एक नए सेट का मूल्यांकन करें)। शर्तें आमतौर पर बुलियन होती हैं और क्रिया या तो किया जा सकता है, या नहीं।

उत्पादन नियम अपेक्षाकृत समतल संरचनाओं में व्यवस्थित किए जा सकते हैं, लेकिन अधिकतर किसी प्रकार के पदानुक्रम में व्यवस्थित होते हैं। उदाहरण के लिए, सब्सक्रिप्शन आर्किटेक्चर में इंटरकनेक्टेड व्यवहार की परतें होती हैं, प्रत्येक वास्तव में एक परिमित राज्य मशीन जो उपयुक्त इनपुट के जवाब में कार्य करती है। इन परतों को तब एक साधारण ढेर में व्यवस्थित किया जाता है, जिसमें निचले स्तर के लक्ष्यों को कम करने वाली उच्च परतें होती हैं। अन्य सिस्टम पेड़ों का उपयोग कर सकते हैं, या वर्तमान में कौन सा लक्ष्य / नियम सबसेट वर्तमान में सबसे महत्वपूर्ण है बदलने के लिए विशेष तंत्र शामिल हो सकते हैं। फ्लैट संरचनाएं निर्माण के लिए अपेक्षाकृत आसान होती हैं, लेकिन केवल सरल व्यवहार के विवरण के लिए अनुमति देती हैं, या कम संरचना की क्षतिपूर्ति के लिए अत्यधिक जटिल स्थितियों की आवश्यकता होती है।

किसी भी वितरित कार्रवाई चयन एल्गोरिदम का एक महत्वपूर्ण हिस्सा एक संघर्ष समाधान तंत्र है। यह प्रस्तावित कार्यों के बीच संघर्ष को हल करने के लिए एक तंत्र है जब एक से अधिक नियमों की स्थिति किसी दिए गए तत्काल में होती है। उदाहरण के लिए संघर्ष हल किया जा सकता है

पहले से नियमों को निश्चित प्राथमिकताओं को आवंटित करना,
वरीयताओं को असाइन करना (उदाहरण के लिए सोअर आर्किटेक्चर में)
नियमों के बीच सापेक्ष उपयोगिता सीखना (उदाहरण के लिए ACT-R में)
योजना के एक रूप का शोषण।
विशेषज्ञ प्रणालियों अक्सर नियमों का चयन करने के लिए पुनरावृत्ति जैसे अन्य सरल हेरिस्टिक्स का उपयोग करते हैं, लेकिन सरल दृष्टिकोण के साथ एक बड़ी प्रणाली में अच्छे व्यवहार की गारंटी देना मुश्किल है।

संघर्ष समाधान केवल उन नियमों के लिए आवश्यक है जो परस्पर अनन्य क्रियाएं (सीएफ ब्लंबरबर्ग 1 99 6) लेना चाहते हैं।

इस प्रकार की प्रतिक्रियाशील योजना की कुछ सीमाएं ब्रॉम (2005) में पाई जा सकती हैं।

परिमित राज्य मशीनें
परिमित राज्य मशीन (एफएसएम) एक प्रणाली के व्यवहार का मॉडल है। कंप्यूटर विज्ञान में एफएसएम का व्यापक रूप से उपयोग किया जाता है। एजेंटों का मॉडलिंग व्यवहार उनके संभावित अनुप्रयोगों में से एक है। एक सामान्य एफएसएम, जब किसी एजेंट के व्यवहार का वर्णन करने के लिए उपयोग किया जाता है, तो इन राज्यों के बीच राज्यों और संक्रमणों का एक सेट होता है। संक्रमण वास्तव में हालत कार्रवाई नियम हैं। हर पल में, एफएसएम की केवल एक स्थिति सक्रिय है, और इसके संक्रमण का मूल्यांकन किया जाता है। यदि एक संक्रमण लिया जाता है तो यह एक और राज्य को सक्रिय करता है। इसका मतलब है, सामान्य संक्रमण में निम्नलिखित रूपों में नियम हैं: यदि स्थिति तब सक्रिय होती है-नई स्थिति। लेकिन संक्रमण कुछ सिस्टमों में ‘स्वयं’ राज्य से भी जुड़ सकते हैं, वास्तव में राज्य को बदलने के बिना संक्रमण कार्यों को निष्पादित करने की अनुमति देने के लिए।

एफएसएम द्वारा व्यवहार का उत्पादन करने के दो तरीके हैं। वे एक डिजाइनर द्वारा राज्यों से जुड़े संबंधों पर निर्भर करते हैं — वे या तो ‘कार्य’ या स्क्रिप्ट हो सकते हैं। एक ‘एक्ट’ एक परमाणु क्रिया है जिसे एजेंट द्वारा किया जाना चाहिए यदि उसका एफएसएम दिया गया राज्य है। यह क्रिया हर समय चरण में किया जाता है। हालांकि, बाद का मामला अक्सर होता है। यहां, प्रत्येक राज्य एक स्क्रिप्ट से जुड़ा हुआ है, जो क्रियाओं के अनुक्रम का वर्णन करता है जिसे एजेंट को निष्पादित करना है यदि उसका एफएसएम किसी दिए गए राज्य में है। यदि कोई संक्रमण एक नई स्थिति को सक्रिय करता है, तो पूर्व स्क्रिप्ट को बाधित किया जाता है, और नया शुरू होता है।

यदि एक स्क्रिप्ट अधिक जटिल है, तो इसे कई स्क्रिप्ट तक तोड़ दिया जा सकता है और एक पदानुक्रमित एफएसएम का शोषण किया जा सकता है। ऐसे automaton में, प्रत्येक राज्य में सबस्टेट्स हो सकते हैं। केवल परमाणु स्तर पर राज्य एक स्क्रिप्ट (जो जटिल नहीं है) या परमाणु कार्रवाई से जुड़े होते हैं।

कम्प्यूटेशनल रूप से, पदानुक्रमित एफएसएम एफएसएम के बराबर हैं। इसका मतलब है कि प्रत्येक पदानुक्रमित एफएसएम को शास्त्रीय एफएसएम में परिवर्तित किया जा सकता है। हालांकि, पदानुक्रमित दृष्टिकोण डिजाइन को बेहतर बनाता है। कंप्यूटर गेम बॉट्स के एएसएम के उदाहरण के लिए डेमियन इस्ला (2005) का पेपर देखें, जो पदानुक्रमित एफएसएम का उपयोग करता है।

अस्पष्ट दृष्टिकोण
यदि दोनों-तो नियम और एफएसएम को अस्पष्ट तर्क के साथ जोड़ा जा सकता है। स्थितियां, राज्य और कार्य क्रमशः कोई भी बुलियन या “हां / नहीं” नहीं हैं बल्कि अनुमानित और चिकनी हैं। नतीजतन, परिणामस्वरूप व्यवहार चिकनी संक्रमण होगा, खासकर दो कार्यों के बीच संक्रमण के मामले में। हालांकि, अस्पष्ट स्थितियों का मूल्यांकन उनके कुरकुरा समकक्षों के मूल्यांकन से बहुत धीमा है।

एलेक्स चैंपियर्ड की वास्तुकला देखें।

कनेक्शनवादी दृष्टिकोण
प्रतिक्रियात्मक योजनाएं कृत्रिम तंत्रिका नेटवर्क या मुक्त प्रवाह पदानुक्रम जैसे कनेक्शनवादी नेटवर्क द्वारा भी व्यक्त की जा सकती हैं। मूल प्रतिनिधित्व इकाई एक इकाई है जिसमें कई इनपुट लिंक होते हैं जो यूनिट को “एक अमूर्त गतिविधि” और आउटपुट लिंक के साथ खिलाते हैं जो इकाइयों का पालन करने के लिए गतिविधि को प्रसारित करते हैं। प्रत्येक इकाई स्वयं गतिविधि ट्रांसड्यूसर के रूप में काम करती है। आमतौर पर, इकाइयां एक स्तरित संरचना में जुड़े होते हैं।

कनेक्शनवादी नेटवर्क के पॉजिटिव्स सबसे पहले, परिणामस्वरूप व्यवहार कुरकुरा द्वारा उत्पादित व्यवहार से अधिक चिकनी है, फिर नियम और एफएसएम, दूसरा, नेटवर्क अक्सर अनुकूली होते हैं, और तीसरा, अवरोध का तंत्र उपयोग किया जा सकता है और इसलिए, व्यवहार किया जा सकता है यह भी वर्णित रूप से वर्णित है (नियमों के माध्यम से कोई केवल व्यवहारिक रूप से व्यवहार का वर्णन कर सकता है)। हालांकि, विधियों में भी कई त्रुटियां हैं। सबसे पहले, एक डिजाइनर के लिए, यदि नेटवर्क के नियमों की तुलना में नेटवर्क द्वारा व्यवहार का वर्णन करने के लिए यह बहुत जटिल है। दूसरा, केवल अपेक्षाकृत सरल व्यवहार का वर्णन किया जा सकता है, खासकर यदि अनुकूलक सुविधा का शोषण किया जाना है।

प्रतिक्रियाशील योजना एल्गोरिदम
विशिष्ट प्रतिक्रियाशील नियोजन एल्गोरिदम केवल मूल्यांकन करता है – फिर एक कनेक्शनवादी नेटवर्क की स्थिति का नियम या गणना करता है। हालांकि, कुछ एल्गोरिदम में विशेष विशेषताएं हैं।

रीट मूल्यांकन: उचित तर्क प्रस्तुतिकरण (जो केवल कुरकुरा नियमों के लिए उपयुक्त है) के साथ, नियमों को हर समय चरण में फिर से मूल्यांकन करने की आवश्यकता नहीं होती है। इसके बजाय, पिछले चरण से मूल्यांकन को संग्रहित करने वाले कैश का एक रूप उपयोग किया जा सकता है।
स्क्रिप्टिंग भाषाएं: कभी-कभी, नियम या एफएसएम सीधे आर्किटेक्चर के प्राइमेटिव होते हैं (उदाहरण के लिए सोअर में)। लेकिन अधिकतर, प्रतिक्रियाशील योजनाएं एक स्क्रिप्टिंग भाषा में प्रोग्राम की जाती हैं, जहां नियम केवल प्राइमेटिव (जैसे जैम या एबीएल) में से एक हैं।
स्टीयरिंग
स्टीयरिंग एजेंटों के नेविगेशन में उपयोग की जाने वाली एक विशेष प्रतिक्रियाशील तकनीक है। प्रतिक्रियाशील स्टीयरिंग का सबसे सरल रूप ब्राइटनबर्ग वाहनों में नियोजित है, जो सेंसर इनपुट सीधे प्रभावक आउटपुट पर इनपुट करता है, और इसका पालन कर सकता है या इससे बच सकता है। अधिक जटिल प्रणालियां आकर्षक या प्रतिकूल ताकतों की एक सुपरपोजिशन पर आधारित होती हैं जो एजेंट पर प्रभाव डालती हैं। इस प्रकार का स्टीयरिंग क्रेग रेनॉल्ड्स की बोलियों पर मूल कार्य पर आधारित है। स्टीयरिंग के माध्यम से, कोई एक साधारण रूप प्राप्त कर सकता है:

एक लक्ष्य नेविगेशन की ओर
बाधाओं से बचने के व्यवहार
व्यवहार के बाद एक दीवार
दुश्मन आ रहा है
शिकारी टालना
भीड़ व्यवहार
स्टीयरिंग का लाभ यह है कि यह कम्प्यूटेशनल रूप से बहुत ही कुशल है। कंप्यूटर गेम में, इस तकनीक से सैकड़ों सैनिकों को संचालित किया जा सकता है। अधिक जटिल इलाके (उदाहरण के लिए एक इमारत) के मामलों में, हालांकि, स्टीयरिंग को पथ-खोज (उदाहरण के लिए मिलानी में) के साथ जोड़ा जाना चाहिए, जो नियोजन का एक रूप है।