मशीन लर्निंग

मशीन लर्निंग (एमएल) कृत्रिम बुद्धि का एक क्षेत्र है जो कंप्यूटर सिस्टम को स्पष्ट रूप से प्रोग्राम किए बिना डेटा से “सीखने” की क्षमता (उदाहरण के लिए, एक विशिष्ट कार्य पर प्रदर्शन में सुधार करने की क्षमता) देने के लिए सांख्यिकीय तकनीकों का उपयोग करता है।

नाम मशीन लर्निंग 1 9 5 9 में आर्थर सैमुअल द्वारा बनाई गई थी। मशीन लर्निंग एल्गोरिदम के अध्ययन और निर्माण की पड़ताल करती है जो डेटा पर भविष्यवाणियों से सीख सकते हैं और भविष्यवाणी कर सकते हैं – ऐसे एल्गोरिदम नमूना इनपुट से मॉडल बनाने के माध्यम से डेटा संचालित भविष्यवाणियों या निर्णयों को बनाकर सख्ती से स्थिर कार्यक्रम निर्देशों का पालन करने से बचते हैं। मशीन लर्निंग कंप्यूटिंग कार्यों की एक श्रृंखला में नियोजित है जहां अच्छे प्रदर्शन के साथ स्पष्ट एल्गोरिदम डिजाइन और प्रोग्रामिंग मुश्किल या अक्षम है; उदाहरण अनुप्रयोगों में ईमेल फ़िल्टरिंग, नेटवर्क घुसपैठियों का पता लगाने, और कंप्यूटर दृष्टि शामिल हैं।

मशीन लर्निंग कम्प्यूटेशनल आंकड़ों से निकटता से संबंधित है (और अक्सर ओवरलैप), जो कंप्यूटर के उपयोग के माध्यम से पूर्वानुमान बनाने पर भी केंद्रित है। इसमें गणितीय अनुकूलन के साथ मजबूत संबंध हैं, जो क्षेत्र में विधियों, सिद्धांत और अनुप्रयोग डोमेन प्रदान करता है। मशीन सीखने को कभी-कभी डेटा खनन से भंग किया जाता है, जहां बाद वाला उपक्षेत्र अन्वेषणकारी डेटा विश्लेषण पर अधिक केंद्रित होता है और इसे असुरक्षित शिक्षा के रूप में जाना जाता है।

डेटा एनालिटिक्स के क्षेत्र में, मशीन लर्निंग एक जटिल विधि है जो जटिल मॉडल और एल्गोरिदम तैयार करने के लिए उपयोग की जाती है जो खुद को पूर्वानुमान के लिए उधार देती हैं; वाणिज्यिक उपयोग में, इसे भविष्यवाणी विश्लेषिकी के रूप में जाना जाता है। ये विश्लेषणात्मक मॉडल शोधकर्ताओं, डेटा वैज्ञानिकों, इंजीनियरों और विश्लेषकों को “विश्वसनीय, दोहराने योग्य निर्णयों और परिणामों का उत्पादन” करने और डेटा में ऐतिहासिक संबंधों और रुझानों से सीखने के माध्यम से “छिपी अंतर्दृष्टि” को उजागर करने की अनुमति देते हैं।

अवलोकन
टॉम एम मिशेल ने मशीन लर्निंग फ़ील्ड में अध्ययन किए गए एल्गोरिदम की व्यापक रूप से उद्धृत, अधिक औपचारिक परिभाषा प्रदान की: “एक कंप्यूटर प्रोग्राम को कार्य के कुछ वर्गों के संबंध में अनुभव ई से सीखने के लिए कहा जाता है टी और प्रदर्शन माप पी यदि कार्यों पर इसका प्रदर्शन टी में, जैसा कि पी द्वारा मापा जाता है, अनुभव ई के साथ सुधार करता है। ” जिन कार्यों में मशीन लर्निंग का संबंध है, उनकी परिभाषा संज्ञानात्मक शर्तों में फ़ील्ड को परिभाषित करने के बजाय मौलिक रूप से परिचालन परिभाषा प्रदान करती है। यह एलन ट्यूरिंग के अपने पेपर “कंप्यूटिंग मशीनरी एंड इंटेलिजेंस” में प्रस्ताव का पालन करता है, जिसमें सवाल “मशीनें सोच सकती हैं?” प्रश्न के साथ प्रतिस्थापित किया गया है “क्या मशीनें हम कर सकते हैं (सोचने वाली संस्थाओं के रूप में) कर सकते हैं?”। ट्यूरिंग के प्रस्ताव में विभिन्न विशेषताओं को एक सोच मशीन द्वारा रखा जा सकता है और एक बनाने में विभिन्न प्रभाव सामने आते हैं।

मशीन सीखने के कार्यों

मशीन सीखने के कार्यों को आम तौर पर कई व्यापक श्रेणियों में वर्गीकृत किया जाता है:

पर्यवेक्षित शिक्षा: कंप्यूटर को “शिक्षक” द्वारा दिए गए उदाहरण इनपुट और उनके वांछित आउटपुट के साथ प्रस्तुत किया जाता है, और लक्ष्य एक सामान्य नियम सीखना है जो आउटपुट में इनपुट को मैप करता है। विशेष मामलों के रूप में, इनपुट सिग्नल केवल आंशिक रूप से उपलब्ध हो सकता है, या विशेष प्रतिक्रिया तक सीमित हो सकता है।
अर्द्ध पर्यवेक्षित शिक्षा: कंप्यूटर को केवल एक अपूर्ण प्रशिक्षण सिग्नल दिया जाता है: लक्षित आउटपुट के कुछ (अक्सर कई) के साथ एक प्रशिक्षण सेट गुम हो जाता है।
सक्रिय शिक्षा: कंप्यूटर केवल सीमित उदाहरणों (बजट के आधार पर) के लिए प्रशिक्षण लेबल प्राप्त कर सकता है, और इसके लिए लेबल प्राप्त करने के लिए वस्तुओं की अपनी पसंद को अनुकूलित करना भी है। जब इंटरैक्टिव रूप से उपयोग किया जाता है, तो इसे लेबलिंग के लिए उपयोगकर्ता को प्रस्तुत किया जा सकता है।
अप्रशिक्षित शिक्षा: सीखने वाले एल्गोरिदम को कोई लेबल नहीं दिया जाता है, जिससे इसे अपने इनपुट में संरचना ढूंढने के लिए स्वयं ही छोड़ दिया जाता है। अप्रशिक्षित शिक्षा अपने आप में एक लक्ष्य हो सकती है (डेटा में छिपे हुए पैटर्न की खोज) या अंत (फीचर लर्निंग) के लिए साधन।
सुदृढ़ीकरण सीखना: डेटा (पुरस्कार और दंड के रूप में) को गतिशील वातावरण में प्रोग्राम के कार्यों के प्रति प्रतिक्रिया के रूप में दिया जाता है, जैसे वाहन चलाकर या प्रतिद्वंद्वी के खिलाफ खेल खेलना।

मशीन सीखने के अनुप्रयोग
मशीन सीखने के कार्यों का एक और वर्गीकरण तब होता है जब कोई मशीन-सीखा प्रणाली के वांछित आउटपुट को मानता है:
वर्गीकरण में, इनपुट को दो या दो से अधिक कक्षाओं में विभाजित किया जाता है, और शिक्षार्थी को ऐसे मॉडल का उत्पादन करना चाहिए जो इन वर्गों के एक या अधिक (बहु-लेबल वर्गीकरण) को अदृश्य इनपुट निर्दिष्ट करता हो। यह आम तौर पर पर्यवेक्षित तरीके से निपटाया जाता है। स्पैम फ़िल्टरिंग वर्गीकरण का एक उदाहरण है, जहां इनपुट ईमेल (या अन्य) संदेश होते हैं और कक्षाएं “स्पैम” और “स्पैम नहीं” होती हैं।
प्रतिगमन में, पर्यवेक्षित समस्या भी, आउटपुट अलग-अलग की बजाय निरंतर होते हैं।
क्लस्टरिंग में, इनपुट का एक सेट समूहों में बांटा जाना है। वर्गीकरण के विपरीत, समूह पहले से ज्ञात नहीं हैं, यह आम तौर पर एक असुरक्षित कार्य बनाते हैं।
घनत्व अनुमान कुछ जगहों में इनपुट का वितरण पाता है।
आयामी कमी उन्हें कम-आयामी अंतरिक्ष में मैप करके इनपुट को सरल बनाती है। विषय मॉडलिंग एक संबंधित समस्या है, जहां एक कार्यक्रम मानव भाषा दस्तावेजों की एक सूची दी जाती है और यह पता लगाने के लिए कार्य किया जाता है कि कौन से दस्तावेज़ समान विषयों को कवर करते हैं।

मशीन सीखने की समस्याओं की अन्य श्रेणियों में से, सीखने के लिए सीखना पिछले अनुभव के आधार पर अपनी खुद की अपरिवर्तनीय पूर्वाग्रह सीखता है। रोबोट सीखने के लिए विस्तृत विकास, सीखने की स्थितियों के अपने स्वयं के अनुक्रम (पाठ्यचर्या भी कहा जाता है) उत्पन्न करता है ताकि स्वायत्त आत्म-अन्वेषण और मानव शिक्षकों के साथ सामाजिक बातचीत के माध्यम से उपन्यास कौशल के प्रदर्शन को एकत्रित किया जा सके और सक्रिय शिक्षण, परिपक्वता, मोटर जैसे मार्गदर्शन तंत्र का उपयोग किया जा सके। सहकर्मी, और अनुकरण।

इतिहास और अन्य क्षेत्रों के संबंध
कंप्यूटर गेमिंग और कृत्रिम बुद्धि के क्षेत्र में एक अमेरिकी अग्रणी आर्थर सैमुअल ने 1 9 5 9 में आईबीएम में “मशीन लर्निंग” शब्द बनाया। एक वैज्ञानिक प्रयास के रूप में, कृत्रिम बुद्धि की खोज से मशीन सीखने में वृद्धि हुई। अकादमिक अनुशासन के रूप में पहले ही एआई के प्रारंभिक दिनों में, कुछ शोधकर्ताओं ने मशीनों से डेटा सीखने में रुचि रखते थे।उन्होंने विभिन्न प्रतीकात्मक तरीकों के साथ समस्या से संपर्क करने का प्रयास किया, साथ ही साथ “तंत्रिका नेटवर्क” कहा जाता था; ये अधिकतर अवधारणाएं और अन्य मॉडल थे जिन्हें बाद में आंकड़ों के सामान्यीकृत रैखिक मॉडल के पुनर्मिलन के रूप में पाया गया। संभाव्य तर्क भी नियोजित किया गया था, खासकर स्वचालित चिकित्सा निदान में।

हालांकि, तार्किक, ज्ञान आधारित दृष्टिकोण पर बढ़ते जोर ने एआई और मशीन सीखने के बीच एक गड़बड़ी की। संभाव्य प्रणाली डेटा अधिग्रहण और प्रतिनिधित्व की सैद्धांतिक और व्यावहारिक समस्याओं से पीड़ित थी। 1 9 80 तक, विशेषज्ञ प्रणाली एआई पर हावी हो गई थी, और आंकड़े पक्ष से बाहर थे। प्रतीकात्मक / ज्ञान-आधारित शिक्षा पर कार्य एआई के भीतर जारी रहा, जिससे अपरिवर्तनीय तर्क प्रोग्रामिंग की शुरुआत हुई, लेकिन शोध की अधिक सांख्यिकीय रेखा अब एआई के क्षेत्र के बाहर पैटर्न पहचान और सूचना पुनर्प्राप्ति में थी। एक ही समय में एआई और कंप्यूटर विज्ञान द्वारा तंत्रिका नेटवर्क अनुसंधान को छोड़ दिया गया था। हॉपफील्ड, रुमेलहार्ट और हिनटन समेत अन्य विषयों के शोधकर्ताओं द्वारा, यह लाइन एआई / सीएस क्षेत्र के बाहर “कनेक्शनवाद” के रूप में जारी रही थी। उनकी मुख्य सफलता 1 9 80 के दशक के मध्य में बैकप्रोपैगेशन के पुनर्निवेश के साथ हुई थी।

मशीन सीखना, एक अलग क्षेत्र के रूप में पुनर्गठित, 1 99 0 के दशक में बढ़ने लगा। इस क्षेत्र ने व्यावहारिक प्रकृति की हल करने योग्य समस्याओं से निपटने के लिए कृत्रिम बुद्धि प्राप्त करने से अपना लक्ष्य बदल दिया। इसने एआई से विरासत में प्राप्त प्रतीकात्मक दृष्टिकोण से दूर और आंकड़ों और संभाव्यता सिद्धांत से उधार विधियों और मॉडलों की ओर ध्यान केंद्रित किया। यह डिजिटलीकृत जानकारी की बढ़ती उपलब्धता और इंटरनेट के माध्यम से इसे वितरित करने की क्षमता से भी लाभान्वित हुआ।

मशीन लर्निंग और डेटा खनन अक्सर एक ही तरीके को नियोजित करते हैं और महत्वपूर्ण रूप से ओवरलैप करते हैं, लेकिन प्रशिक्षण सीखने से ज्ञात ज्ञात गुणों के आधार पर मशीन लर्निंग भविष्यवाणी पर केंद्रित होती है, डेटा खनन डेटा में (पहले) अज्ञात गुणों की खोज पर केंद्रित होता है (यह है डेटाबेस में ज्ञान की खोज का विश्लेषण चरण)। डेटा खनन कई मशीन सीखने के तरीकों का उपयोग करता है, लेकिन विभिन्न लक्ष्यों के साथ; दूसरी तरफ, मशीन सीखने से डेटा खनन विधियों को “असुरक्षित शिक्षा” या शिक्षार्थक सटीकता में सुधार के लिए प्रीप्रोकैसिंग चरण के रूप में भी कार्यरत किया जाता है। इन दो अनुसंधान समुदायों के बीच अधिकांश भ्रम (जिसमें अक्सर अलग सम्मेलन और अलग पत्रिकाओं होते हैं, ईसीएमएल पीकेडीडी एक बड़ा अपवाद होता है) उन बुनियादी मान्यताओं से आता है जिनके साथ वे काम करते हैं: मशीन सीखने में, आमतौर पर प्रदर्शन की क्षमता के संबंध में प्रदर्शन का मूल्यांकन किया जाता है ज्ञात ज्ञान को पुन: उत्पन्न करें, जबकि ज्ञान खोज और डेटा खनन (केडीडी) में मुख्य कार्य पहले अज्ञात ज्ञान की खोज है। ज्ञात ज्ञान के संबंध में मूल्यांकन, एक अनौपचारिक (असुरक्षित) विधि को अन्य पर्यवेक्षित तरीकों से आसानी से बेहतर प्रदर्शन किया जाएगा, जबकि एक सामान्य केडीडी कार्य में, प्रशिक्षण डेटा की अनुपलब्धता के कारण पर्यवेक्षित विधियों का उपयोग नहीं किया जा सकता है।

मशीन लर्निंग में अनुकूलन के साथ घनिष्ठ संबंध भी हैं: कई सीखने की समस्याएं उदाहरणों के प्रशिक्षण सेट पर कुछ हानि कार्य को कम करने के रूप में तैयार की जाती हैं। हानि कार्य प्रशिक्षित किए जाने वाले मॉडल की भविष्यवाणियों और वास्तविक समस्या के उदाहरणों के बीच विसंगति व्यक्त करते हैं (उदाहरण के लिए, वर्गीकरण में, कोई उदाहरण के लिए एक लेबल असाइन करना चाहता है, और मॉडल को एक सेट के प्री-असाइन किए गए लेबलों की सही भविष्यवाणी करने के लिए प्रशिक्षित किया जाता है उदाहरण)। दोनों क्षेत्रों के बीच का अंतर सामान्यीकरण के लक्ष्य से उत्पन्न होता है: जबकि ऑप्टिमाइज़ेशन एल्गोरिदम प्रशिक्षण सेट पर नुकसान को कम कर सकते हैं, मशीन सीखने अदृश्य नमूने पर होने वाली हानि को कम करने के लिए चिंतित है।

आंकड़ों से संबंध
मशीन सीखने और आंकड़े निकट से संबंधित क्षेत्र हैं। माइकल आई जॉर्डन के अनुसार, पद्धति सिद्धांतों से लेकर सैद्धांतिक उपकरणों तक, मशीन सीखने के विचारों के आंकड़ों में लंबे समय से इतिहास रहा है। उन्होंने डेटा क्षेत्र को समग्र क्षेत्र को कॉल करने के लिए प्लेसहोल्डर के रूप में भी सुझाव दिया।

लियो ब्रेमन ने दो सांख्यिकीय मॉडलिंग प्रतिमानों को प्रतिष्ठित किया: डेटा मॉडल और एल्गोरिदमिक मॉडल, जिसमें “एल्गोरिदमिक मॉडल” का अर्थ है रैंडम वन जैसे मशीन लर्निंग एल्गोरिदम।

कुछ सांख्यिकीविदों ने मशीन लर्निंग से तरीकों को अपनाया है, जिससे एक संयुक्त क्षेत्र होता है जिसे वे सांख्यिकीय शिक्षा कहते हैं।

सिद्धांत
एक शिक्षार्थी का मुख्य उद्देश्य अपने अनुभव से सामान्यीकृत करना है। इस संदर्भ में सामान्यीकरण एक सीखने की मशीन सेट करने के बाद नए, अदृश्य उदाहरण / कार्यों पर सटीक प्रदर्शन करने की क्षमता है। प्रशिक्षण उदाहरण कुछ आम तौर पर अज्ञात संभाव्यता वितरण (घटनाओं की जगह के प्रतिनिधि माना जाता है) से आते हैं और शिक्षार्थी को इस जगह के बारे में एक सामान्य मॉडल बनाना होता है जो इसे नए मामलों में पर्याप्त सटीक भविष्यवाणियों को उत्पन्न करने में सक्षम बनाता है।

मशीन लर्निंग एल्गोरिदम और उनके प्रदर्शन का कम्प्यूटेशनल विश्लेषण सैद्धांतिक कंप्यूटर विज्ञान की एक शाखा है जिसे कम्प्यूटेशनल लर्निंग थ्योरी के नाम से जाना जाता है। क्योंकि प्रशिक्षण सेट सीमित हैं और भविष्य अनिश्चित है, सीखने का सिद्धांत आम तौर पर एल्गोरिदम के प्रदर्शन की गारंटी नहीं देता है। इसके बजाय, प्रदर्शन पर संभाव्य सीमाएं काफी आम हैं। पूर्वाग्रह-भिन्नता विघटन सामान्यीकरण त्रुटि को मापने का एक तरीका है।

सामान्यीकरण के संदर्भ में सर्वोत्तम प्रदर्शन के लिए, परिकल्पना की जटिलता डेटा के अंतर्निहित कार्य की जटिलता से मेल खाना चाहिए। यदि परिकल्पना कार्य की तुलना में कम जटिल है, तो मॉडल ने डेटा को कम किया है। यदि प्रतिक्रिया में मॉडल की जटिलता में वृद्धि हुई है, तो प्रशिक्षण त्रुटि कम हो जाती है। लेकिन अगर परिकल्पना बहुत जटिल है, तो मॉडल अतिसंवेदनशील है और सामान्यीकरण गरीब होगा।

प्रदर्शन सीमाओं के अलावा, कम्प्यूटेशनल लर्निंग सिद्धांतवादी समय की जटिलता और सीखने की व्यवहार्यता का अध्ययन करते हैं। कम्प्यूटेशनल लर्निंग थ्योरी में, गणना को व्यवहार्य माना जाता है यदि यह बहुपद समय में किया जा सकता है।दो प्रकार के जटिलता के परिणाम हैं। सकारात्मक परिणाम दिखाते हैं कि बहुपद समय में कार्यों की एक निश्चित वर्ग सीखा जा सकता है। नकारात्मक परिणाम दिखाते हैं कि कुछ वर्ग बहुपद समय में नहीं सीखे जा सकते हैं।

दृष्टिकोण

निर्णय पेड़ सीखना
निर्णय पेड़ सीखने एक निर्णय पेड़ का उपयोग भविष्यवाणी मॉडल के रूप में करता है, जो वस्तु के लक्ष्य मूल्य के बारे में निष्कर्ष निकालने के लिए किसी वस्तु के बारे में अवलोकन करता है।

एसोसिएशन नियम सीखना
एसोसिएशन नियम सीखना बड़े डेटाबेस में चर के बीच दिलचस्प संबंधों की खोज करने का एक तरीका है।

कृत्रिम तंत्रिका प्रसार
एक कृत्रिम तंत्रिका नेटवर्क (एएनएन) सीखने वाले एल्गोरिदम, जिसे आमतौर पर “तंत्रिका नेटवर्क” (एनएन) कहा जाता है, एक सीखने वाला एल्गोरिदम है जो जैविक तंत्रिका नेटवर्क से बेहद प्रेरित है। कम्प्यूटेशंस कृत्रिम न्यूरॉन्स के एक दूसरे से जुड़े समूह के मामले में संरचित होते हैं, गणना के लिए एक कनेक्शनवादी दृष्टिकोण का उपयोग कर प्रोसेसिंग जानकारी।आधुनिक तंत्रिका नेटवर्क गैर-रैखिक सांख्यिकीय डेटा मॉडलिंग उपकरण हैं। आमतौर पर डेटा में पैटर्न खोजने के लिए इनपुट या आउटपुट के बीच जटिल रिश्तों को मॉडल करने के लिए या मनाए गए चर के बीच अज्ञात संयुक्त संभाव्यता वितरण में सांख्यिकीय संरचना को कैप्चर करने के लिए उपयोग किया जाता है।

ध्यान लगा के पढ़ना या सीखना
पिछले कुछ वर्षों में व्यक्तिगत उपयोग के लिए हार्डवेयर की कीमतों में गिरावट और जीपीयू के विकास ने गहरी शिक्षा की अवधारणा के विकास में योगदान दिया है जिसमें कृत्रिम तंत्रिका नेटवर्क में कई छिपी हुई परतें शामिल हैं। यह दृष्टिकोण मानव मस्तिष्क को दृष्टि और सुनवाई में प्रकाश और ध्वनि की प्रक्रिया के तरीके का मॉडल करने की कोशिश करता है।गहरी शिक्षा के कुछ सफल अनुप्रयोग कंप्यूटर दृष्टि और भाषण मान्यता हैं।

अपरिवर्तनीय तर्क प्रोग्रामिंग
इंटरेक्टिव लॉजिक प्रोग्रामिंग (आईएलपी) इनपुट उदाहरणों, पृष्ठभूमि ज्ञान और परिकल्पनाओं के लिए एक समान प्रतिनिधित्व के रूप में तर्क प्रोग्रामिंग का उपयोग करके सीखने के लिए एक दृष्टिकोण है। ज्ञात पृष्ठभूमि ज्ञान के एक एन्कोडिंग और तथ्यों के तार्किक डेटाबेस के रूप में प्रतिनिधित्व किए गए उदाहरणों का एक सेट देखते हुए, एक आईएलपी प्रणाली एक परिकल्पनात्मक तर्क कार्यक्रम प्राप्त करेगी जिसमें सभी सकारात्मक और कोई नकारात्मक उदाहरण शामिल नहीं होंगे। अपरिवर्तनीय प्रोग्रामिंग एक संबंधित क्षेत्र है जो किसी भी प्रकार की प्रोग्रामिंग भाषाओं को अनुमानित कार्यक्रमों (जैसे न केवल तर्क प्रोग्रामिंग) का प्रतिनिधित्व करने के लिए मानता है।

समर्थन वेक्टर मशीन
समर्थन वेक्टर मशीन (एसवीएम) वर्गीकरण और प्रतिगमन के लिए उपयोग की जाने वाली संबंधित पर्यवेक्षित शिक्षण विधियों का एक सेट है। प्रशिक्षण उदाहरणों के एक सेट को देखते हुए, प्रत्येक को दो श्रेणियों में से एक के रूप में चिह्नित किया जाता है, एक एसवीएम प्रशिक्षण एल्गोरिदम एक मॉडल बनाता है जो भविष्यवाणी करता है कि कोई नया उदाहरण एक श्रेणी या दूसरे में आता है या नहीं।

क्लस्टरिंग
क्लस्टर विश्लेषण सबसेट्स (क्लस्टर्स कहा जाता है) में अवलोकनों के एक सेट का असाइनमेंट है ताकि एक ही क्लस्टर के भीतर अवलोकन कुछ पूर्वनिर्धारित मानदंड या मानदंडों के समान हों, जबकि विभिन्न समूहों से खींचे गए अवलोकन भिन्न हैं। विभिन्न क्लस्टरिंग तकनीक डेटा की संरचना पर अलग-अलग धारणाएं बनाती हैं, जिन्हें अक्सर कुछ समानता मीट्रिक द्वारा परिभाषित किया जाता है और उदाहरण के लिए आंतरिक कॉम्पैक्टनेस (समान क्लस्टर के सदस्यों के बीच समानता) और अलग-अलग क्लस्टर के बीच अलगाव द्वारा मूल्यांकन किया जाता है। अन्य विधियां अनुमानित घनत्व और ग्राफ कनेक्टिविटी पर आधारित हैं। क्लस्टरिंग असुरक्षित शिक्षा का एक तरीका है, और सांख्यिकीय डेटा विश्लेषण के लिए एक आम तकनीक है।

Bayesian नेटवर्क
एक Bayesian नेटवर्क, विश्वास नेटवर्क या निर्देशित विश्वकोश ग्राफिकल मॉडल एक संभाव्य ग्राफिकल मॉडल है जो एक निर्देशित विश्वकोश ग्राफ (डीएजी) के माध्यम से यादृच्छिक चर और उनके सशर्त स्वतंत्रता के एक सेट का प्रतिनिधित्व करता है। उदाहरण के लिए, एक Bayesian नेटवर्क रोगों और लक्षणों के बीच संभाव्य संबंधों का प्रतिनिधित्व कर सकता है। लक्षणों को देखते हुए, विभिन्न बीमारियों की उपस्थिति की संभावनाओं की गणना करने के लिए नेटवर्क का उपयोग किया जा सकता है। कुशल एल्गोरिदम मौजूद हैं जो अनुमान और सीखने का प्रदर्शन करते हैं।

प्रतिनिधित्व सीखना
कई सीखने वाले एल्गोरिदम, अधिकतर असुरक्षित सीखने वाले एल्गोरिदम, प्रशिक्षण के दौरान प्रदान किए गए इनपुट के बेहतर प्रतिनिधित्व की खोज करने का लक्ष्य रखते हैं। शास्त्रीय उदाहरणों में प्रमुख घटक विश्लेषण और क्लस्टर विश्लेषण शामिल हैं। प्रतिनिधित्व सीखने वाले एल्गोरिदम अक्सर अपने इनपुट में जानकारी को संरक्षित करने का प्रयास करते हैं लेकिन इसे एक ऐसे तरीके से बदलते हैं जो इसे वर्गीकरण या भविष्यवाणियों से पहले प्री-प्रोसेसिंग चरण के रूप में उपयोगी बनाता है, जो अज्ञात डेटा उत्पन्न वितरण से आने वाले इनपुट के पुनर्निर्माण की अनुमति देता है, जबकि उस वितरण के तहत अनिवार्य रूप से कॉन्फ़िगरेशन के लिए आवश्यक रूप से वफादार नहीं होना चाहिए।

कई गुना सीखने वाले एल्गोरिदम इस तरह की बाधा के तहत ऐसा करने का प्रयास करते हैं कि सीखा प्रतिनिधित्व कम-आयामी है। स्पैस कोडिंग एल्गोरिदम इस तरह की बाधा के तहत ऐसा करने का प्रयास करते हैं कि सीखा प्रतिनिधित्व स्पष्ट है (इसमें कई शून्य हैं)। मल्टीलाइनर सबस्पेस लर्निंग एल्गोरिदम का लक्ष्य बहु-आयामी डेटा के लिए टेंसर प्रस्तुतियों से सीधे निम्न-आयामी प्रतिनिधित्वों को सीखना है, बिना उन्हें (उच्च-आयामी) वैक्टरों में दोबारा लगाए। गहरी सीखने वाले एल्गोरिदम निम्न स्तर के गुणों (या उत्पन्न) के संदर्भ में परिभाषित उच्च स्तर, अधिक सारणी सुविधाओं के साथ प्रतिनिधित्व के कई स्तरों, या सुविधाओं का पदानुक्रम खोजते हैं। यह तर्क दिया गया है कि एक बुद्धिमान मशीन वह है जो एक ऐसे प्रतिनिधित्व को सीखती है जो देखे गए डेटा की व्याख्या करने वाले भिन्नता के अंतर्निहित कारकों को विचलित करती है।

समानता और मीट्रिक सीखना
इस समस्या में, सीखने की मशीन को उदाहरणों के जोड़े दिए जाते हैं जिन्हें समान समान वस्तुओं के समान और जोड़े माना जाता है। इसके बाद उसे एक समानता कार्य (या एक दूरी मीट्रिक फ़ंक्शन) सीखने की आवश्यकता होती है जो भविष्यवाणी कर सकती है कि नई वस्तुएं समान हैं या नहीं। इसे कभी-कभी सिफारिश प्रणाली में उपयोग किया जाता है।

स्पैनिश शब्दकोश सीखना
इस विधि में, एक डाटाम को आधार कार्यों के रैखिक संयोजन के रूप में दर्शाया जाता है, और गुणांक को स्पैस माना जाता है। एक्स को डी-आयामी डेटाम होने दें, डी को मैट्रिक्स द्वारा विज्ञापन दें, जहां डी का प्रत्येक स्तंभ आधार आधार का प्रतिनिधित्व करता है। आर गणितीय रूप से एक्स का प्रतिनिधित्व करने के लिए गुणांक है, स्पैस शब्दकोश सीखने का मतलब है हल करना  जहां आर स्पैस है। आम तौर पर बोलते हुए, एन को एक अलग प्रतिनिधित्व के लिए आजादी की अनुमति देने के लिए डी से बड़ा माना जाता है।

स्पैर प्रस्तुतियों के साथ एक शब्दकोश सीखना दृढ़ता से एनपी-हार्ड है और लगभग हल करना भी मुश्किल है। स्पैस डिक्शनरी सीखने के लिए एक लोकप्रिय हेरिस्टिक विधि के-एसवीडी है।

स्पैस शब्दकोश सीखने कई संदर्भों में लागू किया गया है। वर्गीकरण में, समस्या यह निर्धारित करना है कि पहले से अदृश्य डेटाम कौन से वर्ग हैं। मान लें कि प्रत्येक वर्ग के लिए एक शब्दकोश पहले ही बनाया जा चुका है। फिर कक्षा के साथ एक नया डाटाम जुड़ा हुआ है कि यह इसी तरह के शब्दकोश द्वारा सबसे अच्छा प्रतिनिधित्व किया जाता है। छवि डी-शोरिंग में स्पैस डिक्शनरी लर्निंग भी लागू की गई है। मुख्य विचार यह है कि एक स्वच्छ छवि पैच को छवि शब्दकोश द्वारा थोड़े से दर्शाया जा सकता है, लेकिन शोर नहीं कर सकता है।

आनुवंशिक एल्गोरिदम
एक आनुवंशिक एल्गोरिदम (जीए) एक खोज हेरिस्टिक है जो प्राकृतिक चयन की प्रक्रिया की नकल करता है, और किसी दिए गए समस्या के अच्छे समाधान खोजने की आशा में नए जीनोटाइप उत्पन्न करने के लिए उत्परिवर्तन और क्रॉसओवर जैसी विधियों का उपयोग करता है। मशीन लर्निंग में, जेनेटिक एल्गोरिदम को 1 9 80 और 1 99 0 के दशक में कुछ उपयोग मिले। इसके विपरीत, जेनेटिक और विकासवादी एल्गोरिदम के प्रदर्शन को बेहतर बनाने के लिए मशीन लर्निंग तकनीकों का उपयोग किया गया है।

नियम आधारित मशीन सीखना
नियम-आधारित मशीन लर्निंग किसी भी मशीन लर्निंग विधि के लिए एक सामान्य शब्द है जो ज्ञान, संग्रह या लागू करने के लिए “नियम” को पहचानता है, सीखता है या विकसित करता है। नियम-आधारित मशीन शिक्षार्थी की परिभाषित विशेषता संबंधपरक नियमों के एक सेट की पहचान और उपयोग है जो सामूहिक रूप से सिस्टम द्वारा प्राप्त ज्ञान का प्रतिनिधित्व करती है। यह अन्य मशीन शिक्षार्थियों के विपरीत है जो आम तौर पर एक एकल मॉडल की पहचान करते हैं जिसे भविष्यवाणी करने के लिए सार्वभौमिक रूप से किसी भी उदाहरण पर लागू किया जा सकता है। नियम-आधारित मशीन सीखने के दृष्टिकोण में सीखने वर्गीकरण प्रणाली, एसोसिएशन नियम सीखने, और कृत्रिम प्रतिरक्षा प्रणाली शामिल हैं।

सीखने वर्गीकरण प्रणाली
लर्निंग क्लासिफायरफायर सिस्टम (एलसीएस) नियम-आधारित मशीन लर्निंग एल्गोरिदम का एक परिवार है जो एक खोज घटक (उदाहरण के लिए आम तौर पर आनुवंशिक एल्गोरिदम) को एक सीखने वाले घटक के साथ जोड़ता है (या तो पर्यवेक्षित शिक्षा, मजबूती सीखने, या असुरक्षित शिक्षा प्रदर्शन)। वे संदर्भ-निर्भर नियमों के एक समूह की पहचान करना चाहते हैं जो पूर्वानुमान बनाने के लिए सामूहिक रूप से ज्ञान को व्यवस्थित रूप से संग्रहीत और लागू करते हैं।

अनुप्रयोगों
मशीन सीखने के लिए आवेदनों में शामिल हैं:

कृषि
स्वचालित प्रमेय साबित करना
अनुकूली वेबसाइटें
प्रभावी कंप्यूटिंग
जैव सूचना विज्ञान
मस्तिष्क मशीन इंटरफेस
Cheminformatics
वर्गीकृत डीएनए अनुक्रम
कम्प्यूटेशनल शरीर रचना
कंप्यूटर नेटवर्क
दूरसंचार
ऑब्जेक्ट मान्यता सहित कंप्यूटर दृष्टि
क्रेडिट कार्ड धोखाधड़ी का पता लगाना
सामान्य खेल खेल रहा है
सूचना पुनर्प्राप्ति
इंटरनेट धोखाधड़ी का पता लगाने
अभिकलनात्मक भाषाविज्ञान
विपणन
मशीन सीखने का नियंत्रण
मशीन धारणा
स्वचालित चिकित्सा निदान
कम्प्यूटेशनल अर्थशास्त्र
बीमा
प्राकृतिक भाषा प्रसंस्करण
प्राकृतिक भाषा समझ
अनुकूलन और metaheuristic
ऑनलाइन विज्ञापन
अनुशंसा प्रणाली
रोबोट लोकोमोशन
खोज यन्त्र
भावना विश्लेषण (या राय खनन)
अनुक्रम खनन
सॉफ्टवेयर इंजीनियरिंग
भाषण और हस्तलेख मान्यता
वित्तीय बाजार विश्लेषण
संरचनात्मक स्वास्थ्य निगरानी
सिंटेक्टिक पैटर्न मान्यता
समय श्रृंखला पूर्वानुमान
उपयोगकर्ता व्यवहार विश्लेषण
मशीन अनुवाद

2006 में, ऑनलाइन मूवी कंपनी नेटफ्लिक्स ने पहली बार “नेटफ्लिक्स पुरस्कार” प्रतियोगिता आयोजित की ताकि उपयोगकर्ता प्राथमिकताओं की भविष्यवाणी करने और कम से कम 10% की मौजूदा सिनेमैच फिल्म अनुशंसा एल्गोरिदम पर सटीकता में सुधार करने के लिए एक कार्यक्रम ढूंढ सके। टीमों के सहयोग से एटी एंड टी लैब्स-रिसर्च के शोधकर्ताओं की एक संयुक्त टीम बिग कैओस एंड प्रोगैमैटिक थ्योरी ने 200 9 में ग्रैंड पुरस्कार जीतने के लिए एक मिलियन मॉडल का निर्माण किया। पुरस्कार से सम्मानित होने के कुछ ही समय बाद, नेटफ्लिक्स को एहसास हुआ कि दर्शकों की रेटिंग उनके देखने के पैटर्न (“सबकुछ एक सिफारिश है”) का सबसे अच्छा संकेतक नहीं था और उन्होंने तदनुसार उनकी सिफारिश इंजन बदल दिया।

2010 में वॉल स्ट्रीट जर्नल ने फर्म विद्रोह अनुसंधान और वित्तीय संकट की भविष्यवाणी करने के लिए मशीन लर्निंग के उनके उपयोग के बारे में लिखा था।

2012 में, सन माइक्रोसिस्टम्स के सह-संस्थापक विनोद खोसला ने भविष्यवाणी की थी कि अगले दो दशकों में 80% मेडिकल डॉक्टरों की नौकरियां स्वचालित मशीन लर्निंग मेडिकल डायग्नोस्टिक सॉफ़्टवेयर में खो जाएंगी।

2014 में, यह बताया गया है कि आर्ट हिस्ट्री पेंटिंग का अध्ययन करने के लिए कला इतिहास में एक मशीन लर्निंग एल्गोरिदम लागू किया गया है, और यह कलाकारों के बीच पहले अपरिचित प्रभावों को प्रकट कर सकता है।

सीमाएं
यद्यपि मशीन सीखना कुछ क्षेत्रों में परिवर्तनीय रहा है, प्रभावी मशीन सीखना मुश्किल है क्योंकि पैटर्न ढूंढना कठिन होता है और अक्सर पर्याप्त प्रशिक्षण डेटा उपलब्ध नहीं होता है; नतीजतन, कई मशीन-लर्निंग प्रोग्राम अक्सर अपेक्षित मूल्य देने में विफल रहते हैं। इसके लिए कई कारण हैं: (उपयुक्त) डेटा की कमी, डेटा तक पहुंच की कमी, डेटा पूर्वाग्रह, गोपनीयता समस्याएं, बुरी तरह से चुने हुए कार्यों और एल्गोरिदम, गलत उपकरण और लोग, संसाधनों की कमी, और मूल्यांकन की समस्याएं।

2018 में, उबर से एक स्व-ड्राइविंग कार एक पैदल यात्री का पता लगाने में असफल रही, जो दुर्घटना में मारे गए।आईबीएम वाटसन प्रणाली के साथ हेल्थकेयर में मशीन लर्निंग का उपयोग करने के प्रयास वर्षों और अरबों निवेश के बाद भी वितरित करने में नाकाम रहे।

पक्षपात
विशेष रूप से मशीन सीखने के दृष्टिकोण विभिन्न डेटा पूर्वाग्रहों से पीड़ित हो सकते हैं। आपके वर्तमान ग्राहकों पर प्रशिक्षित एक मशीन लर्निंग सिस्टम केवल नए ग्राहक समूहों की ज़रूरतों की भविष्यवाणी करने में सक्षम नहीं हो सकता है जो प्रशिक्षण डेटा में प्रदर्शित नहीं होते हैं। मानव निर्मित डेटा पर प्रशिक्षित होने पर, मशीन सीखने से समाज में पहले से मौजूद संवैधानिक और बेहोश पूर्वाग्रहों को चुनने की संभावना है। डेटा से सीखा भाषा मॉडल मानव-जैसी पूर्वाग्रहों को दिखाया गया है। आपराधिक जोखिम मूल्यांकन के लिए उपयोग की जाने वाली मशीन लर्निंग सिस्टम काले लोगों के खिलाफ पक्षपातपूर्ण पाया गया है। 2015 में, Google फ़ोटो अक्सर काले लोगों को गोरिल्ला के रूप में टैग करती थीं, और 2018 में यह अभी भी ठीक से हल नहीं हुआ था, लेकिन Google अभी भी प्रशिक्षण डेटा से सभी गोरिल्ला को हटाने के लिए कामकाज का उपयोग कर रहा था, और इस प्रकार वास्तविक गोरिल्ला को पहचानने में सक्षम नहीं था सब। गैर-सफेद लोगों को पहचानने के साथ इसी तरह के मुद्दे कई अन्य प्रणालियों में पाए गए हैं। 2016 में, माइक्रोसॉफ्ट ने ट्विटर से सीखा एक चैटबॉट का परीक्षण किया, और यह जल्दी से नस्लवादी और कामुक भाषा को उठाया। ऐसी चुनौतियों के कारण, मशीन सीखने के प्रभावी उपयोग को अन्य डोमेन में अपनाया जा सकता है।

मॉडल आकलन
वर्गीकरण मशीन सीखने के मॉडल को होल्डआउट विधि जैसी सटीकता अनुमान तकनीकों द्वारा सत्यापित किया जा सकता है, जो एक प्रशिक्षण और परीक्षण सेट (पारंपरिक रूप से 2/3 प्रशिक्षण सेट और 1/3 परीक्षण सेट पदनाम) में डेटा को विभाजित करता है और प्रशिक्षण मॉडल के प्रदर्शन का मूल्यांकन करता है परीक्षण सेट तुलनात्मक रूप से, एन-फ़ोल्ड-क्रॉस-सत्यापन विधि यादृच्छिक रूप से के सबसेट में डेटा को विभाजित करती है जहां डेटा के के -1 उदाहरण मॉडल को प्रशिक्षित करने के लिए उपयोग किए जाते हैं जबकि केटी इंस्टेंस का उपयोग प्रशिक्षण मॉडल की अनुमानित क्षमता का परीक्षण करने के लिए किया जाता है। होल्डआउट और क्रॉस-सत्यापन विधियों के अलावा, बूटस्ट्रैप, जो डाटासेट से प्रतिस्थापन के साथ एन उदाहरणों का नमूना देता है, का उपयोग मॉडल सटीकता का आकलन करने के लिए किया जा सकता है।

समग्र सटीकता के अतिरिक्त, जांचकर्ता अक्सर क्रमशः सही सकारात्मक दर (टीपीआर) और सही नकारात्मक दर (टीएनआर) का अर्थ संवेदनशीलता और विशिष्टता की रिपोर्ट करते हैं। इसी तरह, जांचकर्ता कभी-कभी झूठी सकारात्मक दर (एफपीआर) के साथ-साथ झूठी नकारात्मक दर (एफएनआर) की रिपोर्ट करते हैं। हालांकि, ये दरें अनुपात हैं जो उनके अंक और denominators प्रकट करने में विफल रहता है। कुल ऑपरेटिंग विशेषता (टीओसी) एक मॉडल की नैदानिक ​​क्षमता व्यक्त करने के लिए एक प्रभावी तरीका है। टीओसी पहले उल्लिखित दरों के अंकुशक और denominators दिखाता है, इस प्रकार टीओसी सामान्य रूप से प्रयुक्त रिसीवर ऑपरेटिंग विशेषता (आरओसी) और आरओसी के संबंधित क्षेत्र वक्र (एयूसी) के तहत अधिक जानकारी प्रदान करता है।

आचार विचार
मशीन लर्निंग नैतिक प्रश्नों का एक मेजबान बन गया है। जिन प्रणालियों को पूर्वाग्रहों से एकत्रित डेटासेट पर प्रशिक्षित किया जाता है, वे इन पूर्वाग्रहों को उपयोग (एल्गोरिदमिक पूर्वाग्रह) पर प्रदर्शित कर सकते हैं, इस प्रकार सांस्कृतिक पूर्वाग्रहों को डिजिटाइज कर सकते हैं। उदाहरण के लिए, नस्लीय भर्ती नीतियों के साथ एक फर्म से नौकरी भर्ती डेटा का उपयोग करने से पिछले सफल आवेदकों की समानता के खिलाफ नौकरी आवेदकों को स्कोर करके पूर्वाग्रह को डुप्लिकेट करने वाली मशीन लर्निंग सिस्टम हो सकती है। सिस्टम द्वारा उपयोग किए जाने वाले एल्गोरिदमिक नियमों के डेटा और दस्तावेज़ीकरण का जिम्मेदार संग्रह इस प्रकार मशीन सीखने का एक महत्वपूर्ण हिस्सा है।

चूंकि भाषा में पूर्वाग्रह होते हैं, भाषा निगम पर प्रशिक्षित मशीनों को भी पूर्वाग्रह सीखना होगा।

नैतिक चुनौतियों के अन्य रूप, व्यक्तिगत पूर्वाग्रह से संबंधित नहीं, स्वास्थ्य देखभाल में अधिक देखे जाते हैं। स्वास्थ्य देखभाल पेशेवरों के बीच चिंताएं हैं कि इन प्रणालियों को जनता के हित में डिजाइन नहीं किया जा सकता है, बल्कि आय उत्पन्न करने वाली मशीनों के रूप में। यह संयुक्त राज्य अमेरिका में विशेष रूप से सच है जहां स्वास्थ्य देखभाल में सुधार करने के लिए एक सतत नैतिक दुविधा है, लेकिन मुनाफा भी बढ़ रहा है। उदाहरण के लिए, एल्गोरिदम को अनावश्यक परीक्षण या दवा के साथ मरीजों को प्रदान करने के लिए डिज़ाइन किया जा सकता है जिसमें एल्गोरिदम के स्वामित्व मालिकों का हिस्सा होता है। स्वास्थ्य देखभाल में मशीन सीखने की बड़ी संभावना है पेशेवरों को निदान, दवा, और यहां तक ​​कि योजना बनाने के लिए पेशेवरों को एक महान उपकरण प्रदान करना मरीजों के लिए वसूली पथ, लेकिन यह तब तक नहीं होगा जब तक कि पहले बताए गए व्यक्तिगत पूर्वाग्रहों तक नहीं, और इन “लालच” पूर्वाग्रहों को संबोधित किया जाता है।

सॉफ्टवेयर
विभिन्न प्रकार के मशीन लर्निंग एल्गोरिदम युक्त सॉफ़्टवेयर सूट में निम्नलिखित शामिल हैं:

नि: शुल्क और मुक्त स्रोत सॉफ्टवेयर
CNTK
Deeplearning4j
ELKI
एच 2 ओ
महावत
लकड़ी का हथौड़ा
mlpack
MXNet
OpenNN
नारंगी
scikit सीखने
शोगुन
स्पार्क एमएलआईबीबी
TensorFlow
मशाल / PyTorch
वेका / एमओए
Yooreeka

मुक्त और मुक्त स्रोत संस्करणों के साथ मालिकाना सॉफ्टवेयर
KNIME
RapidMiner

मालिकाना सॉफ्टवेयर
अमेज़ॅन मशीन लर्निंग
एंगॉस नॉलेजस्टूडियो
Ayasdi
आईबीएम डेटा विज्ञान अनुभव
Google भविष्यवाणी API
आईबीएम एसपीएसएस मॉडलर
केएक्सईएन मॉडलर
LIONsolver
मेथेमेटिका
MATLAB
अजगर
माइक्रोसॉफ्ट एज़ूर मशीन लर्निंग
तंत्रिका डिजाइनर
NeuroSolutions
ओरेकल डेटा खनन
ओरेकल एआई प्लेटफार्म क्लाउड सेवा
RCASE
एसएएस एंटरप्राइज़ माइनर
SequenceL
Splunk
सांख्यिकी डेटा माइनर