अप्रशिक्षित, पर्यवेक्षित और अर्ध-पर्यवेक्षित शिक्षण


27

मशीन लर्निंग के संदर्भ में, क्या अंतर है

  • अप्रशिक्षित शिक्षा
  • पर्यवेक्षित शिक्षण और
  • अर्ध-पर्यवेक्षित शिक्षा?

और देखने के लिए कुछ मुख्य एल्गोरिथम दृष्टिकोण क्या हैं?


8
सबसे पहले, विकि से दो पंक्तियाँ: "कंप्यूटर विज्ञान में, अर्ध-पर्यवेक्षणीय सीखने की मशीन सीखने की तकनीक का एक वर्ग है जो प्रशिक्षण के लिए लेबल और लेबल किए गए डेटा दोनों का उपयोग करता है - आमतौर पर लेबल किए गए डेटा की एक छोटी मात्रा में बड़ी मात्रा में बिना लेबल के डेटा होता है। अर्ध-पर्यवेक्षित शिक्षण बिना किसी अध्ययन (बिना किसी लेबल प्रशिक्षण डेटा) और पर्यवेक्षित शिक्षण (पूरी तरह से लेबल प्रशिक्षण के साथ) के बीच पड़ता है। " क्या उससे मदद हुई?

"अल्गोरिदमिक दृष्टिकोण" के साथ आपके मन में क्या है? मैंने अपने उत्तर में आवेदनों के कुछ उदाहरण दिए हैं, कि क्या आप ढूंढ रहे हैं?
पीटर स्मिट

जवाबों:


20

आमतौर पर, मशीन सीखने की समस्याओं को वर्गीकरण, भविष्यवाणी या मॉडलिंग के लिए फ़ंक्शन आकलन पर बदलाव माना जा सकता है।

में देखरेख सीखने एक इनपुट (के साथ सुसज्जित है , , ...,) और निर्गम ( , , ...,) और एक समारोह है कि एक generalizable फैशन में इस व्यवहार का अनुमान लगाती है ढूँढने में चुनौती दी है। आउटपुट एक क्लास लेबल (वर्गीकरण में) या एक वास्तविक संख्या (प्रतिगमन में) हो सकता है - ये पर्यवेक्षित शिक्षण में "पर्यवेक्षण" हैं।x1x2y1y2

सीखने के मामले में, आधार मामले में, आपको इनपुट , , ... प्राप्त होता है , लेकिन न तो आउटपुट को लक्षित करता है, न ही इसके वातावरण से पुरस्कार प्रदान किए जाते हैं। समतल किए गए स्थान की समस्या (वर्गीकृत, या पूर्वानुमान) और आपकी पृष्ठभूमि के ज्ञान के आधार पर, आप विभिन्न विधियों का उपयोग कर सकते हैं: घनत्व का अनुमान (भविष्यवाणी के लिए कुछ अंतर्निहित पीडीएफ का अनुमान लगाते हुए), के-मतलब क्लस्टरिंग (अप्रतिबंधित वास्तविक मूल्यवान डेटा का वर्गीकरण), के- मोड क्लस्टरिंग (गैर वर्गीकृत वर्गीकृत डेटा को वर्गीकृत करना), आदि।x1x2

अर्ध-पर्यवेक्षित शिक्षण में लेबल और अनलिस्टेड डेटा पर फ़ंक्शन आकलन शामिल है। यह दृष्टिकोण इस तथ्य से प्रेरित है कि लेबल किए गए डेटा को उत्पन्न करने के लिए अक्सर महंगा होता है, जबकि गैर-सूचीबद्ध डेटा आमतौर पर नहीं होता है। यहां चुनौती में ज्यादातर तकनीकी सवाल शामिल हैं कि इस फैशन में मिश्रित डेटा का इलाज कैसे किया जाए। अर्ध-पर्यवेक्षित शिक्षण विधियों के बारे में अधिक जानकारी के लिए यह अर्ध-पर्यवेक्षित शिक्षण साहित्य सर्वेक्षण देखें।

इन प्रकार के सीखने के अलावा, ऐसे अन्य भी हैं, जैसे सुदृढीकरण सीखने के लिए जिससे सीखने की विधि अपने वातावरण के साथ क्रियाओं , , का उत्पादन करती है । । .. कि पुरस्कार या दंड , , ...a1a2r1r2


1
आपके उत्तर का यह अर्थ है कि अधिगम की देखरेख अर्ध-पर्यवेक्षित अधिगम के लिए बेहतर है, जहाँ कभी संभव है। क्या वो सही है? यदि नहीं, तो अर्ध-पर्यवेक्षणीय शिक्षा कब बेहतर हो सकती है?
n

@ naught101 आप उसके जवाब से कैसे पढ़ते हैं? जॉन जो कहता है, मैं उससे सहमत हूं, लेकिन आप जो कहेंगे, उसके विपरीत कहूंगा, अर्थात् अर्ध-पर्यवेक्षणीय शिक्षण जहां संभव हो, पर्यवेक्षण अधिगम के लिए बेहतर है। अर्थात्, यदि आपके पास कुछ लेबल किए गए डेटा और कुछ अनलिस्टेड डेटा (आमतौर पर लेबल किए गए डेटा की मात्रा से बहुत अधिक है), तो आप बेहतर यह करेंगे कि यदि आप केवल लेबल किए गए डेटा का उपयोग कर सकें, तो आप सभी डेटा का उपयोग कर सकते हैं। अर्ध-पर्यवेक्षित अधिगम का उपयोग करने का पूरा बिंदु पर्यवेक्षित अधिगम या अनुपयोगी अधिगम को करते हुए प्राप्त प्रदर्शन को पार करना है।
हैलोगूडीबाई

@HelloGoodbye: क्योंकि अर्ध-पर्यवेक्षित सीखने के लिए निर्दिष्ट एकमात्र लाभ यह है कि यह कुछ मामलों में सस्ता है, लेकिन इसे और अधिक चुनौतीपूर्ण होने का अतिरिक्त ड्रा बैक मिला है। यह मेरे लिए उचित प्रतीत होता है कि पूरी तरह से पर्यवेक्षित शिक्षण आसान होगा, और अधिक सटीक (सभी अन्य चीजें समान हो), यह देखते हुए कि अधिक जमीनी सच्चाई डेटा की आपूर्ति की जाती है। इसलिए मैं सिर्फ उन उदाहरणों के लिए पूछ रहा था, जहां दोनों के बीच चुनाव को देखते हुए, अर्ध-पर्यवेक्षित को प्राथमिकता दी जाएगी। आप टिप्पणी करते हैं, इससे कोई मतलब नहीं है, लेकिन क्या कोई ऐसा मामला है जहां सभी डेटा लेबल किए गए हैं और आप अभी भी अर्ध-पर्यवेक्षणीय पसंद करेंगे?
naught101

@ naught101 मुझे लगता है कि यदि सभी डेटा को लेबल किया जाता है, तो आप सामान्य पर्यवेक्षित सीखने का उपयोग करने के बजाय अर्ध-पर्यवेक्षित सीखने का उपयोग करके बहुत अधिक नहीं जीतते हैं। जब आपके पास बहुत सारे अनलिस्टेड डेटा होते हैं और सेमी-सुपरवाइज्ड लर्निंग होता है, तो मुख्य कारण आपको बेहतर प्रदर्शन दिखाई देता है, क्योंकि आप ट्रांसफर लर्निंग करते हैं और अनलिस्टेड डेटा से भी अनुभव प्राप्त करने में सक्षम होते हैं।
हैलोगूडीबाई

@ naught101 हालांकि, नेटवर्क को आउटपुट डेटा (यानी एक ऑटोएन्कोडर को लागू करना, जो एक प्रकार का अप्रशिक्षित शिक्षण है) को लागू करने से जितना संभव हो सके इनपुट डेटा को पुन: पेश करने का कार्य देकर, नेटवर्क को डेटा के अच्छे प्रतिनिधित्व को सीखने के लिए मजबूर किया जाता है। यह एक तरह के नियमितीकरण के रूप में कार्य कर सकता है, जो बदले में भी फायदेमंद साबित हो सकता है। तो शायद सामान्य पर्यवेक्षणीय सीखने के बजाय अर्ध-पर्यवेक्षित सीखने का उपयोग करने की एक छोटी जीत हो सकती है, भले ही सभी डेटा लेबल हो। हालांकि यह प्रभाव कितना बड़ा है, मुझे नहीं पता।
हैलोगूडीबाई

13

अनसुनी हुई पढ़ाई

अप्रशिक्षित शिक्षा वह है जब आपके पास प्रशिक्षण के लिए कोई लेबल डेटा उपलब्ध नहीं है। इसके उदाहरण अक्सर क्लस्टरिंग विधियां हैं।

पर्यवेक्षित अध्ययन

इस मामले में आपका प्रशिक्षण डेटा लेबल किए गए डेटा से मौजूद है। आपके द्वारा यहां हल की गई समस्या अक्सर लेबल के बिना डेटा बिंदुओं के लेबल की भविष्यवाणी कर रही है।

सेमी-सुपरवाइज्ड लर्निंग

इस स्थिति में लेबल किए गए डेटा और अनलिस्टेड डेटा दोनों का उपयोग किया जाता है। उदाहरण के लिए इसका उपयोग डीप विश्वास नेटवर्क में किया जा सकता है, जहां कुछ परतें डेटा की संरचना (अनसुनी) सीख रही हैं और एक परत का उपयोग वर्गीकरण बनाने के लिए किया जाता है (पर्यवेक्षित डेटा के साथ प्रशिक्षित)


7

मुझे नहीं लगता कि इसके बारे में सोचने का सबसे अच्छा तरीका पर्यवेक्षित / अनसुनी है। बुनियादी डेटा खनन के लिए, यह सोचना बेहतर है कि आप क्या करने की कोशिश कर रहे हैं। चार मुख्य कार्य हैं:

  1. भविष्यवाणी। यदि आप एक वास्तविक संख्या की भविष्यवाणी कर रहे हैं, तो इसे प्रतिगमन कहा जाता है। यदि आप पूरी संख्या या वर्ग की भविष्यवाणी कर रहे हैं, तो इसे वर्गीकरण कहा जाता है।

  2. मॉडलिंग। मॉडलिंग भविष्यवाणी के समान है, लेकिन मॉडल मनुष्यों द्वारा समझ में आता है। तंत्रिका नेटवर्क और समर्थन वेक्टर मशीनें महान काम करती हैं, लेकिन समझदार मॉडल [1] का उत्पादन नहीं करती हैं। निर्णय पेड़ और क्लासिक रेखीय प्रतिगमन आसानी से समझने वाले मॉडल के उदाहरण हैं।

  3. समानता। यदि आप विशेषताओं के प्राकृतिक समूहों को खोजने की कोशिश कर रहे हैं, तो इसे कारक विश्लेषण कहा जाता है। यदि आप टिप्पणियों के प्राकृतिक समूहों को खोजने की कोशिश कर रहे हैं, तो इसे क्लस्टरिंग कहा जाता है।

  4. संघ। यह सहसंबंध की तरह है, लेकिन विशाल बाइनरी डेटासेट के लिए।

[१] जाहिरा तौर पर गोल्डमैन सैक्स ने भविष्यवाणी के लिए महान तंत्रिका नेटवर्क के टन बनाए, लेकिन तब कोई भी उन्हें समझ नहीं पाया था, इसलिए उन्हें तंत्रिका नेटवर्क को समझाने की कोशिश करने के लिए अन्य कार्यक्रमों को लिखना पड़ा।


क्या आप GS कहानी पर अधिक जानकारी दे सकते हैं? (मुझे यकीन नहीं है कि मैं आपकी टिप्पणी पर सीधे टिप्पणी क्यों कर सकता हूं)
YA

मुझे ठीक से याद नहीं है कि मैं कहाँ पढ़ता हूँ, लेकिन यहाँ ऐ @ जीएस पर कुछ और जानकारी दी गई है: hplusmagazine.com/2009/08/06/…
नील मैकग्यूगन

मेरी यह भावना है कि 1,2 एक पर्यवेक्षित सेटिंग में सीखने का वर्णन करते हैं और 3,4 एक अनिश्चित सेटिंग में रहते हैं। इसके अलावा: क्या होगा यदि आप भविष्यवाणी करने के लिए समानताओं की तलाश करते हैं? क्या वह मॉडलिंग माना जाता है?
मि। त्सजोलर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.