संकेत पहचान

इशारा मान्यता गणित एल्गोरिदम के माध्यम से मानव संकेतों को समझने के लक्ष्य के साथ कंप्यूटर विज्ञान और भाषा प्रौद्योगिकी में एक विषय है। इशारा किसी भी शारीरिक गति या राज्य से उत्पन्न हो सकता है लेकिन आम तौर पर चेहरे या हाथ से निकलता है। क्षेत्र में वर्तमान फोकस में चेहरे और हाथ इशारा पहचान से भावना पहचान शामिल है। उपयोगकर्ता भौतिक रूप से उन्हें छूए बिना उपकरणों को नियंत्रित या बातचीत करने के लिए सरल संकेतों का उपयोग कर सकते हैं। साइन लैंग्वेज की व्याख्या करने के लिए कैमरे और कंप्यूटर दृष्टि एल्गोरिदम का उपयोग करके कई दृष्टिकोण किए गए हैं। हालांकि, मुद्रा, चाल, प्रॉक्समिक्स और मानव व्यवहार की पहचान और पहचान भी इशारा पहचान तकनीकों का विषय है। इशारा पहचान मानव शरीर की भाषा को समझने के लिए एक तरीका के रूप में देखा जा सकता है, इस प्रकार प्राचीन पाठ उपयोगकर्ता इंटरफेस या यहां तक ​​कि जीयूआई (ग्राफिकल यूजर इंटरफेस) की तुलना में मशीनों और मनुष्यों के बीच एक समृद्ध पुल का निर्माण करना, जो अभी भी कीबोर्ड में अधिकांश इनपुट को सीमित करता है और माउस।

इशारा पहचान मनुष्यों को मशीन (एचएमआई) के साथ संवाद करने और किसी भी यांत्रिक उपकरणों के बिना स्वाभाविक रूप से बातचीत करने में सक्षम बनाती है। इशारा पहचान की अवधारणा का उपयोग करके, कंप्यूटर स्क्रीन पर एक उंगली को इंगित करना संभव है ताकि कर्सर तदनुसार आगे बढ़े। यह पारंपरिक इनपुट डिवाइस जैसे माउस, कीबोर्ड और यहां तक ​​कि टच-स्क्रीन अनावश्यक बना सकता है।

परिभाषा
मानव-कंप्यूटर परस्पर संपर्क के संबंध में, कुर्टेनबाक और हूलिन इस प्रकार एक इशारा परिभाषित करते हैं: “एक इशारा शरीर की एक गति है जिसमें जानकारी होती है। अलविदा लहराते हुए एक इशारा होता है। कीबोर्ड पर एक कुंजी दबाकर इशारा नहीं होता है क्योंकि गति एक उंगली नहीं देखी जाती है और न ही महत्वपूर्ण है। जो भी मायने रखता है वह कुंजी दबाया जाता है। इसके विपरीत, हैरलिंग और एडवर्ड्स आंदोलन की आवश्यकता को छोड़ देते हैं और एक इशारा और स्थैतिक हाथ मुद्राओं द्वारा समझते हैं। इसे उन प्रणालियों के बीच प्रतिष्ठित किया जा सकता है जिनमें सेंसर आवश्यक हैं पहचान सीधे उपयोगकर्ता के शरीर पर स्थित होती है, और जिनके लिए बाहरी सेंसर द्वारा उपयोगकर्ता को देखा जाता है।

इशारा पहचान विशेषताएं:

अधिक सटीक
उच्च स्थिरता
डिवाइस को अनलॉक करने के लिए समय की बचत

वर्तमान परिदृश्य में इशारा पहचान के प्रमुख आवेदन क्षेत्र हैं:

ऑटोमोटिव सेक्टर
उपभोक्ता इलेक्ट्रॉनिक्स क्षेत्र
पारगमन क्षेत्र
गेमिंग क्षेत्र
स्मार्टफोन अनलॉक करने के लिए
रक्षा
घर स्वचालन
साइन भाषा व्याख्या

इशारा पहचान प्रौद्योगिकी को अत्यधिक सफल तकनीक माना जाता है क्योंकि यह किसी भी डिवाइस को अनलॉक करने के लिए समय बचाता है।

कंप्यूटर दृष्टि और छवि प्रसंस्करण से तकनीकों के साथ इशारा मान्यता आयोजित की जा सकती है।

साहित्य में कंप्यूटर दृष्टि से जुड़े कैमरे द्वारा इशारा कैप्चरिंग या अधिक सामान्य मानव मुद्रा और आंदोलनों पर कंप्यूटर दृष्टि क्षेत्र में चल रहे काम शामिल हैं।

इशारा पहचान और पेन कंप्यूटिंग: पेन कंप्यूटिंग सिस्टम के हार्डवेयर प्रभाव को कम कर देती है और पारंपरिक डिजिटल ऑब्जेक्ट्स जैसे कुंजीपटल और चूहों से परे नियंत्रण के लिए भौतिक दुनिया की वस्तुओं को भी बढ़ा देती है। ऐसे कार्यान्वयन हार्डवेयर की एक नई श्रृंखला को सक्षम कर सकते हैं जिसके लिए मॉनीटर की आवश्यकता नहीं होती है। यह विचार होलोग्राफिक प्रदर्शन के निर्माण के लिए नेतृत्व कर सकता है। शब्द इशारा पहचान का उपयोग गैर-पाठ-इनपुट हस्तलेखन प्रतीकों के लिए अधिक संकीर्ण रूप से संदर्भित करने के लिए किया गया है, जैसे ग्राफिक्स टैबलेट, मल्टी-टच जेस्चर, और माउस इशारा पहचान पर इनकिंग। यह एक पॉइंटिंग डिवाइस कर्सर के साथ प्रतीकों के चित्रण के माध्यम से कंप्यूटर परस्पर संपर्क है।

इशारा प्रकार
कंप्यूटर इंटरफेस में, दो प्रकार के इशारे को प्रतिष्ठित किया जाता है: हम ऑनलाइन संकेतों पर विचार करते हैं, जिन्हें स्केलिंग और घूर्णन जैसे प्रत्यक्ष जोड़ों के रूप में भी माना जा सकता है। इसके विपरीत, इंटरैक्शन समाप्त होने के बाद ऑफ़लाइन संकेत आमतौर पर संसाधित होते हैं; उदाहरण के लिए एक संदर्भ मेनू को सक्रिय करने के लिए एक सर्कल खींचा जाता है।

ऑफ़लाइन इशारे: उन इशारे जिन्हें ऑब्जेक्ट के साथ उपयोगकर्ता के संपर्क के बाद संसाधित किया जाता है। एक मेनू को सक्रिय करने के लिए इशारा एक उदाहरण है।
ऑनलाइन संकेत: डायरेक्ट मैनिपुलेशन जेस्चर। वे एक मूर्त वस्तु को स्केल या घुमाने के लिए उपयोग किया जाता है।
टचलेस इंटरफ़ेस
टचलेस यूजर इंटरफेस इशारा नियंत्रण के संबंध में एक उभरती हुई तकनीक है। टचलेस यूजर इंटरफेस (टीयूआई) कीबोर्ड, माउस या स्क्रीन को छूए बिना शरीर की गति और इशारे के माध्यम से कंप्यूटर को कमांड करने की प्रक्रिया है। उदाहरण के लिए, माइक्रोसॉफ्ट केनेक्ट एक टचलेस गेम इंटरफेस है; हालांकि, वाईआई जैसे उत्पादों को पूरी तरह से स्पर्शहीन नहीं माना जाता है क्योंकि वे नियंत्रकों के लिए tethered हैं। इशारा नियंत्रण के अलावा टचलेस इंटरफेस व्यापक रूप से लोकप्रिय हो रहे हैं क्योंकि वे शारीरिक रूप से उन्हें छूए बिना उपकरणों के साथ बातचीत करने की क्षमता प्रदान करते हैं।

डिवाइस-आधारित इशारा पहचान
शरीर पर पहने जाने वाले अधिकांश सिस्टम या हाथ संवेदक द्वारा निर्देशित डेटा दस्ताने एकीकृत त्वरण या स्थिति सेंसर में उपयोग करते हैं। डेटा दस्ताने-आधारित प्रणालियों का नुकसान यह है कि उपयोगकर्ता को सिस्टम का उपयोग करने के लिए दस्ताने पहनना चाहिए।

हाथ से निर्देशित सिस्टम, जैसे कि निंटेंडो वाईआई कंट्रोलर और ब्लूवांड, बीकॉन द्वारा निर्मित, का उपयोग इशारा इनपुट के लिए भी किया जा सकता है। दोनों प्रणालियों को उपयोगकर्ता द्वारा नियंत्रित किया जा सकता है और प्रत्येक डिवाइस के आंदोलन का पता लगाने के लिए त्वरण सेंसर होता है।

स्मार्टफोन और टैबलेट कंप्यूटर जैसे नए उपकरणों के लिए, विशेष रूप से टचस्क्रीन का उपयोग किया जाता है, जिसका उपयोग “स्वाइप जेश्चर” द्वारा किया जा सकता है। विशेष रूप से, मल्टी-टच स्क्रीन एक साथ कई स्वतंत्र फिंगरप्रिंटों का पता लगाने की पेशकश करती है, ताकि, उदाहरण के लिए, दो विकर्ण रूप से संलग्न उंगलियों के साथ, खिड़कियां बड़ी या छोटी हो सकती हैं।

कैमरा आधारित इशारा पहचान
बाहरी सेंसर वाले सिस्टम ज्यादातर कैमरा-आधारित सिस्टम होते हैं। कैमरे का उपयोग उपयोगकर्ता की तस्वीरें लेने के लिए किया जाता है। कैमरे के साथ और कई कैमरों के साथ दोनों प्रणालियां हैं, नए सिस्टम अक्सर 3 डी डेटा के साथ काम करते हैं जो या तो समय-समय पर उड़ान कैमरे या तथाकथित संरचित प्रकाश कैमरे पर काम करता है। कैमरा-आधारित तकनीक उपयोगकर्ता की मुद्रा का पता लगाने के लिए 2 डी और 3 डी छवि विश्लेषण तकनीकों पर भरोसा करती है। कैमरा-आधारित इशारा पहचान का उपयोग उदाहरण के लिए, गेम कंसोल से कनेक्ट आईटॉय के लिए गेम में किया जाता है। एक पूरी तरह से नया दृष्टिकोण स्टीरियोस्कोपी के माध्यम से इशारा नियंत्रण है, इसका लाभ यह है कि यह अवरक्त प्रकाश के बिना काम करता है और इस तरह सड़क पर काम करता है।

तकनीकी छवि विश्लेषण में, मूल रूप से प्रतिष्ठित होने के कई दृष्टिकोण हैं: या तो डेटाबेस प्रति 1000 से अधिक वीडियो विश्लेषणों के मेरिडियन के आधार पर बनाए गए प्रासंगिक संकेतों के साथ बनाया गया है। रिकॉर्ड किए गए नियंत्रण संकेतों को तब डेटाबेस से तुलना की जाती है और तदनुसार निर्धारित किया जाता है। उदाहरण के लिए, इस समाधान का उपयोग माइक्रोसॉफ्ट द्वारा किनेक्ट 3 डी कैमरा के साथ एक्सबॉक्स के साथ किया जाता है। विश्लेषण छवि और वीडियो जानकारी का उपयोग कर द्वि-आयामी अंतरिक्ष में किया जा सकता है। त्रि-आयामी अंतरिक्ष में एक वॉल्यूमेट्रिक गणना की बात करता है, उदाहरण के लिए, शरीर को NURBS या बहुभुज द्वारा दर्शाया जाता है। रीयल-टाइम 3 डी डेटा की गणना वर्तमान में विकास में है। इस डेटाबेस-आधारित विश्लेषण का नुकसान यह है कि इसे डेटाबेस से बहुत कंप्यूटिंग पावर की आवश्यकता होती है। वैकल्पिक रूप से, सॉफ्टवेयर एक सच्चे कंकाल पहचानकर्ता के साथ काम करता है, i। एच। कैमरा डेटा बॉडी से, हाथ और / या अंगुलियों को एक सरल कंकाल मॉडल द्वारा पूर्वनिर्धारित संकेतों को पहचाना जाता है और असाइन किया जाता है। यह समाधान इशारा और परिशुद्धता की एक बड़ी विविधता का वादा करता है, लेकिन तकनीकी रूप से अधिक मांग है।

आने वाले वर्षों में अनुसंधान और विकास का लक्ष्य एम्बेडेड सॉफ़्टवेयर के संदर्भ में इशारा पहचान को कार्यान्वित करना है, जो प्लेटफ़ॉर्म- और कैमरा-स्वतंत्र है और इसके लिए कम ऊर्जा की आवश्यकता होती है, और इसलिए इसका उपयोग मोबाइल टेलीफ़ोन, टेबलेट या नेविगेशन में भी किया जा सकता है सिस्टम।

2012 में, कई वाणिज्यिक विक्रेताओं ने घोषणा की कि वे इशारा पहचान उपकरणों के साथ बाजार में जाना चाहते हैं जो वर्तमान में उपलब्ध उपकरणों (विशेष रूप से Xbox के लिए किनेक्ट) से काफी बेहतर होना चाहिए। उदाहरण के लिए, सैमसंग ने लास वेगास में सीईएस 2012 में स्मार्ट टीवी का प्रतिनिधित्व किया है। एक और कंपनी लीपमोशन है, जहां द लीप के प्रचार वीडियो को समुदाय में आलोचना की गई थी, क्योंकि कुछ स्पष्ट दृश्य रिकॉर्ड किए गए थे। जर्मनी में, इशारा नियंत्रण ऑटोमोटिव उद्योग में एक विशेष विषय है, जहां विशेष रूप से स्थिर और मोबाइल सिस्टम की आवश्यकता होती है, जैसे गेस्टिगॉन द्वारा निर्मित, जो एक एम्बेडेड समाधान पर भी काम करते हैं। डिजिटल संकेत, मीडिया प्रौद्योगिकी, मीडिया कला और प्रदर्शन के क्षेत्र में 3 डी इशारा मान्यता भी लोकप्रिय है। इन क्षेत्रों और जेड में इशारा पहचान का उपयोग करने का एक आसान तरीका। उदाहरण के लिए, अन्य सॉफ़्टवेयर को नियंत्रित करना काइनेटिक स्पेस है। अन्य निर्माताओं में ओमेक, सॉफ़्टकिनेटिक और माइस्ट्रो इंटरएक्टिव शामिल हैं।

टचलेस प्रौद्योगिकी के प्रकार
इस प्रकार के इंटरफ़ेस जैसे स्मार्टफ़ोन, लैपटॉप, गेम्स और टेलीविज़न का उपयोग करने वाले कई डिवाइस हैं। यद्यपि टचलेस टेक्नोलॉजी ज्यादातर गेमिंग सॉफ्टवेयर में देखी जाती है, ब्याज अब ऑटोमोटिव और हेल्थकेयर इंडस्ट्रीज सहित अन्य क्षेत्रों में फैल रहा है। जल्द ही आने के लिए, वॉयस मान्यता से परे स्तरों में कारों में टचलेस प्रौद्योगिकी और इशारा नियंत्रण लागू किया जाएगा। बीएमडब्ल्यू श्रृंखला 7 देखें।

टचलेस प्रौद्योगिकी का भविष्य
दुनिया भर में बड़ी संख्या में कंपनियां हैं जो इशारा पहचान प्रौद्योगिकी का उत्पादन कर रही हैं, जैसे कि:

इंटेल कॉर्प
श्वेत पत्र: इंटेल के उपयोगकर्ता अनुभव अनुसंधान का अन्वेषण करें, जो दिखाता है कि कैसे टचलेस मल्टीफाएक्टर प्रमाणीकरण (एमएफए) स्वास्थ्य देखभाल संगठनों को चिकित्सकीय दक्षता, सुविधा और रोगी देखभाल में सुधार करते समय सुरक्षा जोखिमों को कम करने में मदद कर सकता है। यह स्पर्शहीन एमएफए समाधान दो कारक उपयोगकर्ता प्रमाणीकरण के लिए चेहरे की पहचान और डिवाइस पहचान क्षमताओं को जोड़ता है।

यूएस में माइक्रोसॉफ्ट कॉर्प
परियोजना का उद्देश्य सर्जिकल सेटिंग्स के भीतर टचलेस इंटरैक्शन के उपयोग का पता लगाने के लिए है, जिससे छवियों को कैमरे-आधारित इशारा पहचान प्रौद्योगिकी के उपयोग के माध्यम से संपर्क किए बिना नियंत्रित, नियंत्रित और छेड़छाड़ की अनुमति मिलती है। विशेष रूप से, परियोजना इन प्रणालियों के डिजाइन और तैनाती के लिए इन परिवेशों की चुनौतियों को समझने की कोशिश करती है, साथ ही उन तरीकों को स्पष्ट करती है जिनमें इन प्रौद्योगिकियों ने शल्य चिकित्सा अभ्यास को बदल दिया है। हालांकि हमारी प्राथमिक चिंताएं एस्पेसिस की स्थितियों को बनाए रखने के साथ हैं, इन टचलेस इशारा-आधारित प्रौद्योगिकियों का उपयोग अन्य संभावित उपयोग प्रदान करता है।

अंडाकार लैब्स
एल्लिप्टिक लैब्स सॉफ़्टवेयर सूट मौजूदा इयरपीस और माइक्रोफ़ोन का पुन: उपयोग करके इशारा और निकटता कार्यों को प्रदान करता है, जो पहले केवल ऑडियो के लिए उपयोग किया जाता था। स्मार्टफोन और टैबलेट में एकीकृत स्पीकर से हवा के माध्यम से अल्ट्रासाउंड सिग्नल हाथ / ऑब्जेक्ट / हेड के खिलाफ उछालते हैं और माइक्रोफोन द्वारा रिकॉर्ड किए जाते हैं, इन उपकरणों में भी एकीकृत होते हैं। इस तरह, एल्लिप्टिक लैब्स की तकनीक आपके हाथों के इशारे को पहचानती है और स्क्रीन पर ऑब्जेक्ट्स को स्थानांतरित करने के लिए उनका उपयोग करती है, वैसे ही चमगादड़ नेविगेट करने के लिए इकोलोकेशन का उपयोग करते हैं।

हालांकि, इस समय भविष्य में इन कंपनियों के लिए टचलेस प्रौद्योगिकी का सबसे आगे खड़ा है, वहीं कई अन्य कंपनियां और उत्पाद हैं जो वर्तमान में चल रहे हैं और इस नए क्षेत्र में भी मूल्य जोड़ सकते हैं। यहां कई उदाहरण दिए गए हैं:

टोबी रेक्स: स्वीडन से आंखों की ट्रैकिंग डिवाइस

एयरराइटिंग: तकनीक जो संदेश और ग्रंथों को हवा में लिखी जाने की अनुमति देती है

आंखों की दृष्टि: डिवाइस को भौतिक रूप से स्पर्श किए बिना स्क्रीन के नेविगेशन की अनुमति देता है

लीप मोशन: गति सेंसर डिवाइस

Myoelectric Armband: ब्लूटूथ उपकरणों के संचार के लिए अनुमति देता है

इनपुट डिवाइस
किसी व्यक्ति के आंदोलनों को ट्रैक करने और यह निर्धारित करने की क्षमता कि वे कौन से संकेत दे सकते हैं, विभिन्न उपकरणों के माध्यम से हासिल किया जा सकता है। गतिशील उपयोगकर्ता इंटरफेस (केयूआई) एक उभरते प्रकार के उपयोगकर्ता इंटरफेस हैं जो उपयोगकर्ताओं को ऑब्जेक्ट्स और निकायों की गति के माध्यम से कंप्यूटिंग उपकरणों के साथ बातचीत करने की अनुमति देते हैं। केयूआई के उदाहरणों में मूर्त उपयोगकर्ता इंटरफेस और गति-जागरूक गेम जैसे Wii और Microsoft’s Kinect, और अन्य इंटरैक्टिव प्रोजेक्ट शामिल हैं।

यद्यपि छवि / वीडियो आधारित इशारा पहचान में बड़ी मात्रा में शोध किया गया है, लेकिन कार्यान्वयन के बीच उपयोग किए जाने वाले औजारों और वातावरण में कुछ भिन्नता है।

वायर्ड दस्ताने। ये चुंबकीय या जड़ें ट्रैकिंग उपकरणों का उपयोग कर हाथों की स्थिति और घूर्णन के बारे में कंप्यूटर को इनपुट प्रदान कर सकते हैं। इसके अलावा, कुछ दस्ताने उच्च स्तर की सटीकता (5-10 डिग्री) के साथ उंगली झुकने का पता लगा सकते हैं, या यहां तक ​​कि उपयोगकर्ता को हप्पी प्रतिक्रिया भी प्रदान कर सकते हैं, जो स्पर्श की भावना का अनुकरण है। पहला वाणिज्यिक रूप से उपलब्ध हैंड-ट्रैकिंग दस्ताने-प्रकार डिवाइस डेटाग्लोव था, जो एक दस्ताने-प्रकार का उपकरण था जो हाथ की स्थिति, आंदोलन और उंगली झुकाव का पता लगा सकता था। यह हाथ के पीछे चलने वाले फाइबर ऑप्टिक केबल्स का उपयोग करता है। हल्के दालों को बनाया जाता है और जब उंगलियां झुकती हैं, तो छोटी दरारों के माध्यम से हल्की रिसाव होती है और नुकसान होता है, जिससे हाथ की मात्रा का अनुमान लगाया जाता है।
गहराई से जागरूक कैमरे। संरचित प्रकाश या समय-समय-उड़ान कैमरे जैसे विशेष कैमरों का उपयोग करके, कैमरे के माध्यम से एक छोटी सी सीमा पर क्या देखा जा रहा है, इसका गहराई से नक्शा उत्पन्न कर सकते हैं, और इस डेटा का उपयोग जो देखा जा रहा है उसका 3 डी प्रतिनिधित्व अनुमानित करने के लिए करें। ये उनकी छोटी रेंज क्षमताओं के कारण हाथों के संकेतों का पता लगाने के लिए प्रभावी हो सकते हैं।
स्टीरियो कैमरे दो कैमरों का उपयोग करना जिनके संबंध एक-दूसरे के साथ जानते हैं, कैमरे के आउटपुट द्वारा 3 डी प्रतिनिधित्व का अनुमान लगाया जा सकता है। कैमरे के रिश्तों को पाने के लिए, कोई लेक्सियन-पट्टी या इन्फ्रारेड एमिटर जैसे स्थिति निर्धारण संदर्भ का उपयोग कर सकता है। डायरेक्ट मोशन मापन (6 डी-विजन) इशारे के साथ संयोजन में सीधे पता लगाया जा सकता है।
इशारा-आधारित नियंत्रक। ये नियंत्रक शरीर के विस्तार के रूप में कार्य करते हैं ताकि जब इशारा किया जाता है, तो उनकी कुछ गति आसानी से सॉफ्टवेयर द्वारा कैप्चर की जा सकती है। उभरते हुए इशारे-आधारित गति कैप्चर का एक उदाहरण कंकाल हाथ ट्रैकिंग के माध्यम से है, जिसे आभासी वास्तविकता और उन्नत वास्तविकता अनुप्रयोगों के लिए विकसित किया जा रहा है। इस तकनीक का एक उदाहरण ट्रैकिंग कंपनियों यूसेन्स और गेस्टिगॉन द्वारा दिखाया गया है, जो उपयोगकर्ताओं को बिना किसी नियंत्रक के अपने आसपास के साथ बातचीत करने की अनुमति देता है।

इसका एक और उदाहरण माउस इशारा ट्रैकिंग है, जहां माउस की गति किसी व्यक्ति के हाथ से खींचे जाने वाले प्रतीक से संबंधित होती है, जैसे वाईआई रिमोट या मायो आर्म्बैंड या एमफोर्स विज़ार्ड कलाई बैंड, जो समय के साथ त्वरण में परिवर्तन का अध्ययन कर सकती है इशारों का प्रतिनिधित्व करने के लिए। एलजी इलेक्ट्रॉनिक्स मैजिक वंड, लूप और स्कूप जैसे डिवाइस हिलक्रिस्ट लैब्स ‘फ्रीस्पेस टेक्नोलॉजी का उपयोग करते हैं, जो एमईएमएस एक्सेलेरोमीटर, जीरोस्कोप और अन्य सेंसर का उपयोग कर्सर आंदोलन में जेस्चर का अनुवाद करने के लिए करता है। सॉफ्टवेयर मानव भूकंप और अनजान आंदोलन के लिए भी क्षतिपूर्ति करता है। ऑडियोक्यूब एक और उदाहरण हैं। इन स्मार्ट लाइट उत्सर्जक क्यूब्स के सेंसर का इस्तेमाल हाथों और उंगलियों के साथ-साथ आसपास के अन्य वस्तुओं को समझने के लिए किया जा सकता है, और डेटा को संसाधित करने के लिए इस्तेमाल किया जा सकता है। अधिकांश अनुप्रयोग संगीत और ध्वनि संश्लेषण में हैं, लेकिन अन्य क्षेत्रों में लागू किया जा सकता है।

सिंगल कैमरा इशारा पहचान के लिए एक मानक 2 डी कैमरा का उपयोग किया जा सकता है जहां संसाधन / पर्यावरण छवि-आधारित मान्यता के अन्य रूपों के लिए सुविधाजनक नहीं होगा। इससे पहले यह सोचा गया था कि एकल कैमरा स्टीरियो या गहराई से जागरूक कैमरे के रूप में प्रभावी नहीं हो सकता है, लेकिन कुछ कंपनियां इस सिद्धांत को चुनौती दे रही हैं। एक मानक 2 डी कैमरा का उपयोग कर सॉफ्टवेयर आधारित इशारा पहचान प्रौद्योगिकी जो मजबूत हाथ इशारे का पता लगा सकता है।
रडार। Google I / O 2015 में प्रोजेक्ट सोलि से पता चला। 13:30 से शुरू, Google I / O 2015 – थोड़ा बुरा। सुंदर। टेक और मानव। काम और प्यार एक नल। – यूट्यूब, और एक संक्षिप्त परिचय वीडियो, परियोजना सोलि में आपका स्वागत है – यूट्यूब

एल्गोरिदम
इनपुट डेटा के प्रकार के आधार पर, इशारा व्याख्या करने के लिए दृष्टिकोण विभिन्न तरीकों से किया जा सकता है। हालांकि, अधिकांश तकनीकें 3 डी समन्वय प्रणाली में प्रदर्शित प्रमुख पॉइंटर्स पर भरोसा करती हैं। इनकी सापेक्ष गति के आधार पर, इनपुट की गुणवत्ता और एल्गोरिदम के दृष्टिकोण के आधार पर इशारा उच्च सटीकता के साथ पता लगाया जा सकता है।
शरीर की गतिविधियों को समझने के लिए, उन्हें सामान्य गुणों और आंदोलनों के संदेश के अनुसार वर्गीकृत करना होगा। उदाहरण के लिए, साइन लैंग्वेज में प्रत्येक इशारा एक शब्द या वाक्यांश का प्रतिनिधित्व करता है। क्यूक द्वारा “विज़न-आधारित हैंड जेस्चर इंटरफेस” में मानव-कंप्यूटर इंटरैक्शन के लिए बहुत उपयुक्त लगता है कि वर्गीकरण का प्रस्ताव दिया गया है। इशारे की पूरी जगह पर कब्जा करने के लिए वह कई इंटरैक्टिव इशारा सिस्टम प्रस्तुत करता है:

जोड़ तोड़
Semaphoric
संवादी

कुछ साहित्य इशारा पहचान में 2 अलग-अलग दृष्टिकोणों को अलग करते हैं: एक 3 डी मॉडल आधारित और उपस्थिति-आधारित। सबसे महत्वपूर्ण विधि हथेली की स्थिति या संयुक्त कोण जैसे कई महत्वपूर्ण मानकों को प्राप्त करने के लिए शरीर के अंगों के प्रमुख तत्वों की 3 डी जानकारी का उपयोग करती है। दूसरी तरफ, उपस्थिति-आधारित सिस्टम प्रत्यक्ष व्याख्या के लिए छवियों या वीडियो का उपयोग करते हैं।

3 डी मॉडल आधारित एल्गोरिदम
3 डी मॉडल दृष्टिकोण वॉल्यूमेट्रिक या कंकाल मॉडल का उपयोग कर सकते हैं, या यहां तक ​​कि दोनों का संयोजन भी कर सकते हैं। कंप्यूटर एनीमेशन उद्योग और कंप्यूटर दृष्टि उद्देश्यों के लिए वॉल्यूमेट्रिक दृष्टिकोण का भारी उपयोग किया गया है। मॉडल आम तौर पर जटिल 3 डी सतहों से बनाए जाते हैं, जैसे कि एनयूआरबीएस या बहुभुज मेष।

इस विधि की कमी यह है कि बहुत कम्प्यूटेशनल गहन है, और वास्तविक समय विश्लेषण के लिए सिस्टम अभी भी विकसित किए जा रहे हैं। इस पल के लिए, एक और दिलचस्प दृष्टिकोण व्यक्ति के सबसे महत्वपूर्ण शरीर के अंगों (उदाहरण के लिए बाहों और गर्दन के लिए सिलेंडर, सिर के लिए गोलाकार) के लिए सरल आदिम वस्तुओं को मैप करना होगा और इन तरीकों का विश्लेषण एक-दूसरे के साथ करें। इसके अलावा, सुपर-क्वाड्रिक्स और सामान्यीकृत सिलेंडरों जैसी कुछ सार संरचनाएं शरीर के अंगों को अनुमानित करने के लिए और भी उपयुक्त हो सकती हैं। इस दृष्टिकोण के बारे में रोमांचक बात यह है कि इन वस्तुओं के लिए पैरामीटर काफी सरल हैं। इनके बीच संबंधों को बेहतर मॉडल करने के लिए, हम अपनी वस्तुओं के बीच बाधाओं और पदानुक्रमों का उपयोग करते हैं।

कंकाल-आधारित एल्गोरिदम
3 डी मॉडल की गहन प्रसंस्करण और कई पैरामीटर से निपटने के बजाय, कोई भी खंड कोण के साथ संयुक्त कोण पैरामीटर के सरलीकृत संस्करण का उपयोग कर सकता है। इसे शरीर के कंकाल प्रतिनिधित्व के रूप में जाना जाता है, जहां व्यक्ति के आभासी कंकाल की गणना की जाती है और शरीर के कुछ हिस्सों को कुछ हिस्सों में मैप किया जाता है। यहां विश्लेषण इन खंडों की स्थिति और अभिविन्यास और उनमें से प्रत्येक के बीच संबंध का उपयोग करके किया जाता है (उदाहरण के लिए जोड़ों और सापेक्ष स्थिति या अभिविन्यास के बीच कोण)

कंकाल मॉडल का उपयोग करने के लाभ:

एल्गोरिदम तेजी से होते हैं क्योंकि केवल प्रमुख पैरामीटर का विश्लेषण किया जाता है।
एक टेम्पलेट डेटाबेस के खिलाफ पैटर्न मिलान संभव है
मुख्य बिंदुओं का उपयोग करके पहचान कार्यक्रम शरीर के महत्वपूर्ण हिस्सों पर ध्यान केंद्रित करने की अनुमति देता है

उपस्थिति-आधारित मॉडल
ये मॉडल अब शरीर के स्थानिक प्रतिनिधित्व का उपयोग नहीं करते हैं, क्योंकि वे टेम्पलेट डेटाबेस का उपयोग कर सीधे छवियों या वीडियो से पैरामीटर प्राप्त करते हैं। कुछ शरीर के मानव भागों, विशेष रूप से हाथों के विकृत 2 डी टेम्पलेट्स पर आधारित होते हैं। विकृत टेम्पलेट ऑब्जेक्ट की रूपरेखा के लिए इंटरपोलेशन नोड्स के रूप में उपयोग किए जाने वाले ऑब्जेक्ट की रूपरेखा पर बिंदुओं के सेट होते हैं। सबसे सरल इंटरपोलेशन फ़ंक्शन में से एक रैखिक है, जो बिंदु सेट, बिंदु परिवर्तनशीलता पैरामीटर और बाहरी विकृतियों से औसत आकार करता है। ये टेम्पलेट-आधारित मॉडल ज्यादातर हाथ-ट्रैकिंग के लिए उपयोग किए जाते हैं, लेकिन सरल इशारा वर्गीकरण के लिए भी इसका उपयोग किया जा सकता है।

उपस्थिति-आधारित मॉडल का उपयोग करके पता लगाने वाले इशारे में एक दूसरा दृष्टिकोण इमेज दृश्यों को इशारा टेम्पलेट्स के रूप में उपयोग करता है। इस विधि के पैरामीटर या तो छवियां स्वयं हैं, या इनमें से कुछ विशेषताओं से व्युत्पन्न हैं। अधिकांश समय, केवल एक (मोनोस्कोपिक) या दो (स्टीरियोस्कोपिक) विचारों का उपयोग किया जाता है।

चुनौतियां
इशारा पहचान सॉफ्टवेयर की सटीकता और उपयोगिता से जुड़ी कई चुनौतियां हैं। छवि-आधारित इशारा पहचान के लिए उपयोग किए गए उपकरण और छवि शोर पर सीमाएं हैं। छवियों या वीडियो लगातार प्रकाश, या एक ही स्थान पर नहीं हो सकता है। पृष्ठभूमि या उपयोगकर्ताओं की विशिष्ट विशेषताओं में आइटम पहचान को और अधिक कठिन बना सकते हैं।

छवि-आधारित इशारा पहचान के लिए कार्यान्वयन की विविधता भी सामान्य उपयोग के लिए प्रौद्योगिकी की व्यवहार्यता के लिए मुद्दा पैदा कर सकती है। उदाहरण के लिए, एक कैमरे के लिए कैलिब्रेटेड एक एल्गोरिदम एक अलग कैमरे के लिए काम नहीं कर सकता है। पृष्ठभूमि शोर की मात्रा ट्रैकिंग और पहचान की कठिनाइयों का भी कारण बनती है, खासकर जब अवसर (आंशिक और पूर्ण) होता है। इसके अलावा, कैमरे से दूरी, और कैमरे के संकल्प और गुणवत्ता, पहचान सटीकता में भिन्नता भी पैदा करता है।

दृश्य सेंसर द्वारा मानव संकेतों को पकड़ने के लिए, मजबूत कंप्यूटर दृष्टि विधियों की भी आवश्यकता होती है, उदाहरण के लिए हाथ ट्रैकिंग और हाथ मुद्रा पहचान के लिए या सिर, चेहरे की अभिव्यक्तियों या नज़र की दिशा को पकड़ने के लिए।

“गोरिल्ला हाथ”
“गोरिल्ला आर्म” लंबवत उन्मुख टच स्क्रीन या हल्के कलम के उपयोग का दुष्प्रभाव था। लंबे समय तक उपयोग की अवधि में, उपयोगकर्ताओं की बाहों को थकान और / या असुविधा महसूस करना शुरू हो गया। 1 9 80 के दशक में प्रारंभिक लोकप्रियता के बावजूद इस प्रभाव ने टच-स्क्रीन इनपुट में गिरावट में योगदान दिया।

हाथ थकान और गोरिल्ला हाथ के दुष्प्रभाव को मापने के लिए, शोधकर्ताओं ने उपभोग सहनशक्ति नामक एक तकनीक विकसित की।