भावना मान्यता

भावना मान्यता मानव भावना की पहचान करने की प्रक्रिया है, आमतौर पर चेहरे की अभिव्यक्तियों के साथ-साथ मौखिक अभिव्यक्तियों से भी। यह कुछ ऐसा है जो मनुष्य स्वचालित रूप से करते हैं लेकिन कम्प्यूटेशनल पद्धतियां भी विकसित की गई हैं।

वैज्ञानिक परिभाषा भावना
भावना, मनोदशा और व्यक्तित्व की अवधारणा से एक भावना को अलग किया जाना चाहिए। एक भावना जेड है। एक डरावना, उदाहरण के लिए, जब आप दीवार के पीछे एक मुखौटा व्यक्ति महसूस करते हैं। फिर आपको डर लगता है। एक भावना केवल एक भावना बन जाती है जब इस भौतिक परिवर्तन का मूल्यांकन संज्ञानात्मक रूप से किया जाता है।

अगर कोई, उदाहरण के लिए, उसकी दिल की धड़कन मास्क किए गए आदमी को वापस पाई जाती है, तो कोई डर बोलता है। हालांकि, अगर वह अपने गुप्त रूप से प्यार करता है, तो कोई खुशी का बात करेगा। भावनाएं आमतौर पर केवल कुछ ही सेकंड तक चलती हैं और स्पष्ट रूप से परिभाषित ऑन-सेट और ऑफ-सेट होती हैं। दूसरी ओर, मूड घंटों, दिन या यहां तक ​​कि सप्ताह तक चल सकती है। अगर कोई कहता है कि वह आज एक बुरे मूड में है, तो वह एक बुरे मूड में है। हालांकि, यह जरूरी भावनाओं के साथ कुछ भी नहीं है।

अक्सर एक विशेष मूड किसी विशेष भावना की घटना की संभावना को बढ़ा या घटा सकता है, लेकिन इन दो चीजों को विश्लेषणात्मक रूप से अलग किया जाना चाहिए। अंत में, किसी व्यक्ति के व्यक्तित्व को मनोदशा से अलग करने की आवश्यकता होती है। उदाहरण के लिए, एक कोलेरिक व्यक्ति स्थायी रूप से नकारात्मक रूप से नकारात्मक है। इस तरह से कोई व्यक्ति एक समय रेखा पर व्यवस्थित भावना, भावना, मनोदशा और व्यक्तित्व की कल्पना कर सकता है – एक तरफ, अल्पकालिक, और व्यक्तित्व दूसरे, दीर्घकालिक पक्ष पर महसूस करने के साथ।

मानव
मनुष्य भावनाओं को पहचानने में सार्वभौमिक स्थिरता दिखाते हैं लेकिन उनकी क्षमताओं में व्यक्तियों के बीच भिन्नता का एक बड़ा सौदा दिखाते हैं। यह मनोविज्ञान में अध्ययन का एक प्रमुख विषय रहा है।

क्रॉस रेस प्रभाव
दो लोगों के बीच भावनात्मक मान्यता मजबूत उतार-चढ़ाव के अधीन है। मनोविज्ञान में, एक घटना की खोज की गई है, जिसे क्रॉस-रेस प्रभाव कहा जाता है। इस घटना का तात्पर्य यह है कि भावना पहचानने की दर कम होती है जब भावना को पहचानने के लिए एक ऐसे चेहरे से संबंधित होता है जो पर्यवेक्षक के समान संस्कृति या जातीयता से संबंधित नहीं होता है। हालांकि, इस प्रभाव को प्रशिक्षण के एक रूप से दूर किया जा सकता है।

दृश्य नकल पहचान
इस भाग को आमतौर पर चेहरे के भाव के रूप में जाना जाता है। एक मानव मशीन इंटरफ़ेस के रूप में, एक डिजिटल वीडियो कैमरा या समकक्ष ऑप्टिकल इनपुट डिवाइस का उपयोग किया जाता है। यहां, चेहरे की पहचान की विधियों का उपयोग चेहरे की सतह की विशेषताओं का विश्लेषण करने के लिए किया जाता है। स्वत: वर्गीकरण द्वारा सीरियल फ्रेम के चेहरे के भाव को क्लस्टर के साथ जोड़ना संभव है जो संभवतः भावना से जुड़ा हो सकता है। हालांकि, शोध दिखाया गया है कि नकली भावनाओं का केवल 30% वास्तव में महसूस भावनाओं से मेल खाता है। इसलिए किसी को दृश्य भावना पहचान के साथ दृश्य चेहरे की अभिव्यक्तियों को समान नहीं करना चाहिए। दृश्य भावना पहचान की जैविक पृष्ठभूमि रोबोट में मानव ऑप्टिक तंत्रिका का अनुकरण है।

भावना प्रेरण
भावना मनोविज्ञान, व्यवहार संबंधी नैतिकता, न्यूरोप्सिओलॉजी और कई अन्य विज्ञान के क्षेत्र में प्रयोगात्मक सेटिंग्स के लिए, प्रयोगशाला स्थितियों के तहत विशिष्ट भावनाओं को उत्पन्न करने के लिए अक्सर महत्वपूर्ण होता है। भावनात्मक प्रेरण भावनात्मक शोध के सबसे कठिन क्षेत्रों में से एक है। इस विषय पर कई मेटा-विश्लेषणों ने कई विधियों को निकाला है जो भावनाओं को सबसे प्रभावी ढंग से प्रेरित कर सकते हैं।

पहला और सबसे महत्वपूर्ण वास्तविकता में भावना का कब्जा (कीवर्ड फ़ील्ड शोध) है। कम आंतरिक वैधता के कारण, अक्सर इसे से बचाया जाता है। दूसरी विधि, जो उच्च बाहरी वैधता वाले उच्च आंतरिक को जोड़ती है, भावनात्मक यादों की विधि है जिसमें कोई भावना स्मृति से यादों को उत्पन्न करने का प्रयास करता है। ईईजी भावना अनुसंधान के बाहर प्रयोगों के लिए निराश आईएपीएस या प्रेरण विधि जैसे प्रेरण विधियों द्वारा किया जाता है, जो कथित तौर पर भावना-प्रेरित फिल्म अनुक्रम या संगीत टुकड़ों का उपयोग करते हैं। ये सभी विधियां विशिष्ट प्रभावशीलता के सबूत के बिना रहती हैं। रोबोटिक्स अक्सर आदर्शीकृत प्रयोगात्मक प्रक्रियाओं का उपयोग करता है, उदाहरण के लिए:

इंसानों में भावना पैदा करने के लिए एक प्रेरण विधि माना जाता है।
मनुष्य एक बदली हुई चेहरे की सतह के साथ अपनी भावना व्यक्त करता है।
कंप्यूटर पर एक वेब कैमरा नई चेहरे की अभिव्यक्ति को पकड़ता है।
कंप्यूटर स्वचालित रूप से प्रेरित भावना के रूप में इसे वर्गीकृत करके भावना को वर्गीकृत कर सकता है।

सीखने के चरण को पूरा करने के बाद, एआई मानव द्वारा पहले सिखाए बिना भावनाओं को स्वतंत्र रूप से पहचानने में सक्षम होना चाहिए। हालांकि, न तो प्रेरण विधि के लिए अक्सर प्रेरण विधि का परीक्षण किया जाता है, न ही प्रयोग के दौरान प्रेरित भावनाओं का मूल्यांकन किया जाता है, रोबोटिक्स में इन आदर्शीकृत प्रयोगात्मक प्रक्रियाएं अक्सर गलत और अपूर्ण रहती हैं।

स्वचालित
यह प्रक्रिया सिग्नल प्रोसेसिंग, मशीन लर्निंग और कंप्यूटर दृष्टि जैसे कई क्षेत्रों से तकनीकों का लाभ उठाती है। Bayesian नेटवर्क जैसे भावनाओं को समझने के लिए विभिन्न पद्धतियों और तकनीकों को नियोजित किया जा सकता है।, गाऊसी मिश्रण मॉडल और छिपे हुए मार्कोव मॉडल।

दृष्टिकोण
भावना पहचान के कार्य में अक्सर मल्टीमोडाल रूपों जैसे ग्रंथों, ऑडियो या वीडियो में मानव अभिव्यक्तियों का विश्लेषण शामिल होता है। चेहरे की अभिव्यक्तियों, शरीर के आंदोलन और इशारे, और भाषण से जानकारी के एकीकरण के माध्यम से विभिन्न भावना प्रकारों का पता लगाया जाता है। भावनात्मक मान्यता में मौजूदा दृष्टिकोण कुछ भावनात्मक प्रकारों को वर्गीकृत करने के लिए आम तौर पर तीन मुख्य श्रेणियों में वर्गीकृत किया जा सकता है: ज्ञान-आधारित तकनीकों, सांख्यिकीय विधियों और संकर दृष्टिकोण।

ज्ञान आधारित तकनीकें
ज्ञान-आधारित तकनीकों (कभी-कभी लेक्सिकॉन-आधारित तकनीकों के रूप में जाना जाता है), कुछ ज्ञान प्रकारों का पता लगाने के लिए डोमेन ज्ञान और भाषा की अर्थपूर्ण और वाक्य रचनात्मक विशेषताओं का उपयोग करते हैं। इस दृष्टिकोण में, भावना वर्गीकरण प्रक्रिया जैसे WordNet, SenticNet, ConceptNet, और EmotiNet के दौरान ज्ञान आधारित संसाधनों का उपयोग करना आम है, कुछ नामों के लिए। इस दृष्टिकोण के फायदों में से एक ऐसी पहुंच-आधारित संसाधनों की बड़ी उपलब्धता के कारण पहुंच और अर्थव्यवस्था लाया गया है। दूसरी ओर इस तकनीक की एक सीमा, अवधारणा बारीकियों और जटिल भाषाई नियमों को संभालने में असमर्थता है।

ज्ञान-आधारित तकनीकों को मुख्य रूप से दो श्रेणियों में वर्गीकृत किया जा सकता है: शब्दकोश-आधारित और कॉर्पस-आधारित दृष्टिकोण। शब्दकोश-आधारित दृष्टिकोण एक शब्दकोश में राय या भावना बीज शब्द पाते हैं और राय या भावनाओं की प्रारंभिक सूची का विस्तार करने के लिए उनके समानार्थी और एंटोनिम्स की खोज करते हैं। दूसरी तरफ कॉर्पस-आधारित दृष्टिकोण, राय या भावना शब्दों की बीज सूची से शुरू होते हैं, और बड़े शब्दों में संदर्भ-विशिष्ट विशेषताओं वाले अन्य शब्दों को ढूंढकर डेटाबेस का विस्तार करते हैं। जबकि कॉर्पस-आधारित दृष्टिकोण खाते के संदर्भ में ध्यान देते हैं, उनके प्रदर्शन अभी भी अलग-अलग डोमेन में भिन्न होते हैं क्योंकि एक डोमेन में किसी दूसरे डोमेन में एक अलग अभिविन्यास हो सकता है।

सांख्यकी पद्धतियाँ
सांख्यिकीय तरीकों में आम तौर पर विभिन्न पर्यवेक्षित मशीन लर्निंग एल्गोरिदम का उपयोग शामिल होता है जिसमें एनोटेटेड डेटा का एक बड़ा सेट प्रणाली के लिए उचित भावना प्रकारों को सीखने और भविष्यवाणी करने के लिए एल्गोरिदम में खिलाया जाता है। इस दृष्टिकोण में आम तौर पर डेटा के दो सेट शामिल होते हैं: प्रशिक्षण सेट और परीक्षण सेट, जहां पूर्व का उपयोग डेटा के गुणों को जानने के लिए किया जाता है, जबकि बाद में मशीन लर्निंग एल्गोरिदम के प्रदर्शन को सत्यापित करने के लिए उपयोग किया जाता है। मशीन लर्निंग एल्गोरिदम आम तौर पर अन्य दृष्टिकोणों की तुलना में अधिक उचित वर्गीकरण सटीकता प्रदान करते हैं, लेकिन वर्गीकरण प्रक्रिया में अच्छे नतीजों को प्राप्त करने में चुनौतियों में से एक है, पर्याप्त रूप से बड़े प्रशिक्षण सेट की आवश्यकता है।

कुछ सबसे अधिक इस्तेमाल किए जाने वाले मशीन लर्निंग एल्गोरिदम में समर्थन वेक्टर मशीनें (एसवीएम), बेवकूफ बेयस और अधिकतम एंट्रॉपी शामिल हैं। गहरी शिक्षा, जो मशीन सीखने के असुरक्षित परिवार के तहत है, भी भावना पहचान में व्यापक रूप से नियोजित है। जाने-माने गहरे सीखने वाले एल्गोरिदम में कृत्रिम तंत्रिका नेटवर्क (एएनएन) के विभिन्न आर्किटेक्चर शामिल हैं जैसे कनवोल्यूशनल न्यूरल नेटवर्क (सीएनएन), लांग शॉर्ट टर्म मेमोरी (एलएसटीएम), और चरम लर्निंग मशीन (ईएलएम)। भावनात्मक मान्यता के क्षेत्र में गहरी सीखने के दृष्टिकोण की लोकप्रियता मुख्य रूप से कंप्यूटर दृष्टि, भाषण मान्यता, और प्राकृतिक भाषा प्रसंस्करण (एनएलपी) जैसे संबंधित अनुप्रयोगों में अपनी सफलता के लिए जिम्मेदार ठहराया जा सकता है।

हाइब्रिड दृष्टिकोण
भावना पहचान में हाइब्रिड दृष्टिकोण अनिवार्य रूप से ज्ञान-आधारित तकनीकों और सांख्यिकीय तरीकों का संयोजन हैं, जो दोनों तकनीकों से पूरक विशेषताओं का शोषण करते हैं। ज्ञान-संचालित भाषाई तत्वों और सांख्यिकीय तरीकों के एक समूह को लागू करने वाले कुछ कार्यों में सेंकिक कंप्यूटिंग और आईफील शामिल हैं, जिनमें से दोनों ने अवधारणा-स्तर ज्ञान-आधारित संसाधन SenticNet को अपनाया है। भावना वर्गीकरण प्रक्रिया में हाइब्रिड दृष्टिकोण के कार्यान्वयन में ऐसे ज्ञान-आधारित संसाधनों की भूमिका बेहद महत्वपूर्ण है। चूंकि हाइब्रिड तकनीक ज्ञान आधारित और सांख्यिकीय दृष्टिकोण दोनों द्वारा प्रदान किए गए लाभों से लाभ प्राप्त करती है, इसलिए वे स्वतंत्र वर्गीकरण प्रदर्शन करते हैं क्योंकि ज्ञान आधारित या सांख्यिकीय तरीकों को स्वतंत्र रूप से नियोजित करने के विरोध में। हालांकि हाइब्रिड तकनीकों का उपयोग करने का नकारात्मक हिस्सा वर्गीकरण प्रक्रिया के दौरान कम्प्यूटेशनल जटिलता है।

डेटासेट
डेटा भावना पहचान में मौजूदा दृष्टिकोण का एक अभिन्न अंग है और ज्यादातर मामलों में मशीन सीखने वाले एल्गोरिदम को प्रशिक्षित करने के लिए आवश्यक एनोटेटेड डेटा प्राप्त करना एक चुनौती है। जबकि अधिकांश सार्वजनिक रूप से उपलब्ध डेटा को एनोटेट नहीं किया गया है, वहां भावनात्मक मान्यता अनुसंधान करने के लिए उपलब्ध एनोटेटेड डेटासेट उपलब्ध हैं। ग्रंथों, ऑडियो, वीडियो या शारीरिक संकेतों के रूप में बहुआयामी स्रोतों से विभिन्न भावना प्रकारों को वर्गीकृत करने के कार्य के लिए, निम्नलिखित डेटासेट उपलब्ध हैं:

ह्यूमेन: कई तरीकों से भावनात्मक शब्दों और संदर्भ लेबल के साथ प्राकृतिक क्लिप प्रदान करता है
बेलफास्ट डेटाबेस: टीवी कार्यक्रमों और साक्षात्कार रिकॉर्डिंग से भावनाओं की एक विस्तृत श्रृंखला के साथ क्लिप प्रदान करता है
सेमेने: एक व्यक्ति और आभासी एजेंट के बीच ऑडियोविज़ुअल रिकॉर्डिंग प्रदान करता है और इसमें नाराज, खुश, भय, घृणा, उदासी, अवमानना, और मनोरंजन जैसे भावनाओं की टिप्पणियां होती हैं
IEMOCAP: अभिनेताओं के बीच डायाडिक सत्रों की रिकॉर्डिंग प्रदान करता है और इसमें भावनाओं, क्रोध, उदासी, निराशा और तटस्थ अवस्था जैसे भावनाओं की टिप्पणियां होती हैं
उद्यम: सात राष्ट्रीयताओं के विषयों की ऑडियोविज़ुअल रिकॉर्डिंग प्रदान करता है और इसमें भावनाओं, क्रोध, उदासी, आश्चर्य, घृणा, और भय जैसी भावनाओं की टिप्पणियां होती हैं
डीईएपी: फिल्म क्लिप देखने वाले लोगों के वैलेंस, उत्तेजना और प्रभुत्व के संदर्भ में इलेक्ट्रोएन्सेफ्लोग्राफी (ईईजी), इलेक्ट्रोकार्डियोग्राफी (ईसीजी), और फेस वीडियो रिकॉर्डिंग, साथ ही भावनाओं की टिप्पणियां प्रदान करता है
ड्रीमर: फिल्म क्लिप देखने वाले लोगों के वैलेंस, उत्तेजना और प्रभुत्व के संदर्भ में इलेक्ट्रोएन्सेफ्लोग्राफी (ईईजी) और इलेक्ट्रोकार्डियोग्राफी (ईसीजी) रिकॉर्डिंग, साथ ही भावनाओं की टिप्पणियां प्रदान करता है

अनुप्रयोगों
कंप्यूटर प्रोग्रामर अक्सर पॉल एकमन की फेशियल एक्शन कोडिंग सिस्टम का उपयोग गाइड के रूप में करते हैं।

भावनाओं का प्रयोग विभिन्न कारणों से किया जाता है। Affectiva विज्ञापनदाताओं और सामग्री रचनाकारों को अपने उत्पादों को अधिक प्रभावी ढंग से बेचने में मदद करने के लिए इसका उपयोग करता है। अफफेक्टिव एक क्यू-सेंसर भी बनाता है जो ऑटिस्टिक बच्चों की भावनाओं का अनुमान लगाता है। भावनात्मक एक स्टार्टअप कंपनी थी जिसने कृत्रिम बुद्धि का उपयोग “चेहरे की अभिव्यक्तियों के आधार पर दृष्टिकोण और कार्यों” की भविष्यवाणी करने के लिए किया था। ऐप्पल ने जनवरी 2016 में भावनात्मक खरीदने का इरादा इंगित किया। एनवीएसओ रीयल-टाइम एपीआई के माध्यम से वेब और मोबाइल एप्लिकेशन के लिए वास्तविक समय की भावना मान्यता प्रदान करता है। विज़ेज टेक्नोलॉजीज एबी विपणन और वैज्ञानिक अनुसंधान और इसी तरह के उद्देश्यों के लिए अपने विज़ेज एसडीके के हिस्से के रूप में भावना अनुमान प्रदान करता है। एरीरिस एक भावना पहचान कंपनी है जो कार निर्माताओं और सामाजिक रोबोट कंपनियों सहित एम्बेडेड सिस्टम निर्माताओं के साथ काम करती है, जो उनके चेहरे के विश्लेषण और भावना पहचान सॉफ्टवेयर को एकीकृत करते हैं; साथ ही वीडियो सामग्री निर्माता के साथ उनके छोटे और लंबे प्रारूप वीडियो रचनात्मक की अनुमानित प्रभावशीलता को मापने में मदद करने के लिए। दुनिया भर में कंपनियों और विश्वविद्यालयों द्वारा भावना मान्यता और भावना विश्लेषण का अध्ययन किया जा रहा है।

झूठ का पता लगाना
बहु-संवेदी भावना धारणा बोलने की सच्चाई का आकलन करने में सहायक होती है, विशेष रूप से झूठ का पता लगाने में, जहां झूठ जानबूझकर झूठे भ्रामक वक्तव्य के रूप में समझा जाता है। हालांकि यह झूठ की निश्चितता के लिए सार्वभौमिक रूप से मान्य संकेतक नहीं है, नकल, इशारे, भाषा और मुद्रा सुराग प्रदान कर सकते हैं। अपेक्षाकृत भरोसेमंद बेहोश या गैर-नियंत्रित संकेत हैं, जैसे कि छात्र चौड़ाई, दृष्टि की रेखा या धुंधलापन। इसके अलावा, ध्यान किसी व्यक्ति के विभिन्न मौखिक और गैर-मौखिक अभिव्यक्तियों के बीच विसंगतियों पर ध्यान केंद्रित किया जाना चाहिए।