पर्यवेक्षित शिक्षण और अनुपलब्ध सीखने के बीच अंतर क्या है? [बन्द है]


283

आर्टिफिशियल इंटेलिजेंस और मशीन लर्निंग के संदर्भ में, पर्यवेक्षित और अनुपयोगी शिक्षण में क्या अंतर है? क्या आप एक उदाहरण के साथ एक बुनियादी, आसान व्याख्या प्रदान कर सकते हैं?

जवाबों:


501

चूंकि आप यह बहुत ही बुनियादी सवाल पूछते हैं, इसलिए ऐसा लगता है कि यह निर्दिष्ट करने के लायक है कि मशीन लर्निंग क्या है।

मशीन लर्निंग एल्गोरिदम का एक वर्ग है जो डेटा-चालित है, अर्थात "सामान्य" एल्गोरिदम के विपरीत यह वह डेटा है जो "बताता है" कि "अच्छा उत्तर" क्या है। उदाहरण: छवियों में चेहरे का पता लगाने के लिए एक काल्पनिक गैर-मशीन लर्निंग एल्गोरिदम यह परिभाषित करने की कोशिश करेगा कि एक चेहरा क्या है (गोल त्वचा जैसी रंग की डिस्क, अंधेरे क्षेत्र के साथ जहां आप आंखों आदि की उम्मीद करते हैं)। एक मशीन लर्निंग एल्गोरिदम में ऐसी कोडित परिभाषा नहीं होगी, लेकिन "सीख-दर-उदाहरण" होगा: आप चेहरे और नहीं-चेहरों की कई छवियां दिखाएंगे और एक अच्छा एल्गोरिथ्म अंततः सीखेंगे और भविष्यवाणी करने में सक्षम होंगे कि क्या एक अनदेखी है या नहीं। छवि एक चेहरा है।

चेहरे का पता लगाने के इस विशेष उदाहरण की निगरानी की जाती है , जिसका अर्थ है कि आपके उदाहरणों को लेबल किया जाना चाहिए , या स्पष्ट रूप से कहें कि कौन से चेहरे हैं और कौन से नहीं हैं।

एक असुरक्षित एल्गोरिथ्म में आपके उदाहरणों को लेबल नहीं किया जाता है , अर्थात आप कुछ भी नहीं कहते हैं। बेशक, इस तरह के एक मामले में एल्गोरिथ्म ही नहीं "आविष्कार" कर सकते हैं क्या एक चेहरा है, लेकिन यह करने के लिए कोशिश कर सकते हैं क्लस्टर को विभिन्न समूहों में डेटा, जैसे यह भेद कर सकते हैं कि चेहरे परिदृश्य, जो घोड़ों से बहुत अलग हैं से बहुत अलग हैं।

चूंकि एक अन्य उत्तर में इसका उल्लेख है (हालांकि, एक गलत तरीके से): पर्यवेक्षण के "मध्यवर्ती" रूप हैं, अर्थात अर्ध-पर्यवेक्षित और सक्रिय शिक्षण । तकनीकी रूप से, ये पर्यवेक्षित तरीके हैं जिनमें बड़ी संख्या में लेबल किए गए उदाहरणों से बचने के लिए कुछ "स्मार्ट" तरीके हैं। सक्रिय सीखने में, एल्गोरिथ्म खुद तय करता है कि आपको किस चीज़ पर लेबल लगाना चाहिए (जैसे कि यह एक परिदृश्य और घोड़े के बारे में बहुत निश्चित हो सकता है, लेकिन यह आपको पुष्टि करने के लिए कह सकता है कि क्या गोरिल्ला वास्तव में एक चेहरे की तस्वीर है)। अर्ध-पर्यवेक्षणीय सीखने में, दो अलग-अलग एल्गोरिदम हैं जो लेबल किए गए उदाहरणों से शुरू होते हैं, और फिर एक दूसरे को "बताने" के लिए जिस तरह से वे बड़ी संख्या में अनलिस्टेड डेटा के बारे में सोचते हैं। इस "चर्चा" से वे सीखते हैं।


@ChuckTesta नहीं, यह पूरी तरह से अलग है। हम ऑनलाइन सक्रिय शिक्षण के बारे में कुछ शोध भी पा सकते हैं।
shn

@ChuckTesta Active Learning ऑनलाइन लर्निंग का सबसेट है। ऑनलाइन लर्निंग के मामले में, एल्गोरिथ्म एक क्रमिक क्रम (स्ट्रीम) में डेटा को बैच लर्निंग के विपरीत प्राप्त करता है जहां एल्गोरिथ्म संपूर्ण डेटासेट पर समग्र रूप से सीखता है। इसके अतिरिक्त, सक्रिय शिक्षण में एल्गोरिथ्म यह तय करता है कि आने वाले डेटा बिंदु किससे सीखें (क्वेरी यह लेबल ओरेकल से है)। सीखने की लागत की कमी (क्वेरी बजट की उपस्थिति) के मामले में, सक्रिय शिक्षण आम तौर पर कई ऑनलाइन शिक्षण एल्गोरिदम को बेहतर बनाता है।
लालची कोडर

55

पर्यवेक्षित शिक्षण वह है जब आप अपने एल्गोरिथ्म को फीड करने वाले डेटा को "टैग" या "लेबल" करते हैं, जिससे आपके तर्क को निर्णय लेने में मदद मिलती है।

उदाहरण: बेम फ़िल्टरिंग, जहां आपको परिणामों को परिशोधित करने के लिए स्पैम के रूप में एक आइटम फ़्लैग करना होगा।

अनउपलब्ध शिक्षण एल्गोरिदम के प्रकार हैं जो कच्चे डेटा के अलावा किसी भी बाहरी आदानों के बिना सहसंबंधों को खोजने की कोशिश करते हैं।

उदाहरण: डेटा माइनिंग क्लस्टरिंग एल्गोरिदम।


33

पर्यवेक्षित अध्ययन

ऐसे अनुप्रयोग जिनमें प्रशिक्षण डेटा में इनपुट वैक्टर के उदाहरण शामिल होते हैं, उनके अनुरूप लक्ष्य वैक्टरों को पर्यवेक्षित शिक्षण समस्याओं के रूप में जाना जाता है।

अशिक्षित शिक्षा

अन्य पैटर्न मान्यता समस्याओं में, प्रशिक्षण डेटा में किसी भी समान लक्ष्य मानों के बिना इनपुट वैक्टर x का एक सेट होता है। इस तरह की अनिश्चित सीखने की समस्याओं में लक्ष्य डेटा के भीतर समान उदाहरणों के समूहों की खोज करना हो सकता है, जहां इसे क्लस्टरिंग कहा जाता है

पैटर्न मान्यता और मशीन लर्निंग (बिशप, 2006)


2
क्या आप कृपया इनपुट वैक्टर बनाम लक्ष्य वैक्टर के बीच वर्णन करेंगे?
दुष्ट लाड

20

पर्यवेक्षित शिक्षण में, इनपुट xअपेक्षित परिणाम के साथ प्रदान किया जाता है y(यानी, इनपुट होने पर मॉडल का उत्पादन करना चाहिए x), जिसे अक्सर संबंधित इनपुट का "वर्ग" (या "लेबल") कहा जाता है x

अप्रशिक्षित सीखने में, उदाहरण xका "वर्ग" प्रदान नहीं किया जाता है। इसलिए, बिना पढ़े हुए डेटा सेट में "छिपी हुई संरचना" खोजने के बारे में अनपेक्षित रूप से सोचा जा सकता है।

पर्यवेक्षित शिक्षण में शामिल हैं:

  • वर्गीकरण (1R, Naive Bayes, निर्णय ट्री लर्निंग एल्गोरिदम, जैसे ID3 CART, और इसी तरह)

  • संख्यात्मक मूल्य भविष्यवाणी

अप्रकाशित सीखने के दृष्टिकोण में शामिल हैं:

  • क्लस्टरिंग (K- साधन, श्रेणीबद्ध क्लस्टरिंग)

  • एसोसिएशन नियम सीखना


13

उदाहरण के लिए, बहुत बार एक तंत्रिका नेटवर्क के प्रशिक्षण को सीखने की निगरानी की जाती है: आप नेटवर्क को बता रहे हैं कि कौन सा वर्ग आपके द्वारा खिलाए जाने वाले फ़ीचर वेक्टर से मेल खाता है।

क्लस्टरिंग अप्रमाणित शिक्षा है: आप एल्गोरिथ्म को यह तय करने देते हैं कि सामान्य गुणों को साझा करने वाले वर्गों में नमूनों को कैसे समूह में रखा जाए।

अप्रशिक्षित सीखने का एक और उदाहरण कोहेनन के स्वयं के मानचित्रण का आयोजन है


12

मैं आपको एक उदाहरण बता सकता हूं।

मान लीजिए आपको पहचानने की जरूरत है कि कौन सी गाड़ी एक कार है और कौन सी मोटरसाइकिल है।

में निगरानी सीखने के मामले में, अपने इनपुट (प्रशिक्षण) डाटासेट जरूरतों लेबल की जाती, वह है, अपने इनपुट (प्रशिक्षण) डेटासेट में हर इनपुट तत्व के लिए, आप अगर यह एक कार या एक मोटर साइकिल का प्रतिनिधित्व करता है निर्दिष्ट करना चाहिए।

में चलते किसी सीखने के मामले में, आप आदानों लेबल नहीं है। समान मॉडल / गुणों के आधार पर अप्रकाशित मॉडल समूहों को इनपुट क्लस्टर में आधारित करता है। तो, इस मामले में, "कार" जैसे कोई लेबल नहीं हैं।


6

पर्यवेक्षित अध्ययन

सुपरवाइज्ड लर्निंग पहले से ही सही वर्गीकरण के साथ डेटा स्रोत से डेटा सैंपल के प्रशिक्षण पर आधारित है। ऐसी तकनीकों का उपयोग फीडफोर्वर्ड या मल्टीलेयर परसेप्ट्रॉन (एमएलपी) मॉडल में किया जाता है। इन MLP की तीन विशिष्ट विशेषताएं हैं:

  1. छिपे हुए न्यूरॉन्स की एक या अधिक परतें जो नेटवर्क के इनपुट या आउटपुट परतों का हिस्सा नहीं हैं जो नेटवर्क को किसी भी समस्या को जानने और हल करने में सक्षम बनाती हैं
  2. न्यूरोनल गतिविधि में परावर्तित होने वाली अछ्वुतता भिन्न होती है और
  3. नेटवर्क का इंटरकनेक्शन मॉडल कनेक्टिविटी के उच्च स्तर को प्रदर्शित करता है।

प्रशिक्षण के माध्यम से सीखने के साथ ये विशेषताएं कठिन और विविध समस्याओं को हल करती हैं। पर्यवेक्षित ANN मॉडल में प्रशिक्षण के माध्यम से सीखना भी त्रुटि backpropagation एल्गोरिथ्म के रूप में कहा जाता है। त्रुटि सुधार-शिक्षण एल्गोरिथ्म इनपुट-आउटपुट नमूनों के आधार पर नेटवर्क को प्रशिक्षित करता है और त्रुटि संकेत पाता है, जो गणना की गई आउटपुट और वांछित आउटपुट का अंतर है और न्यूरॉन्स के synaptic भार को समायोजित करता है जो त्रुटि के उत्पाद के लिए आनुपातिक है। संकेत और अन्तर्ग्रथनी भार का इनपुट उदाहरण। इस सिद्धांत के आधार पर, दो चरणों में त्रुटि वापस प्रसार शिक्षा होती है:

अग्रवर्ती पारण:

यहां, नेटवर्क के लिए इनपुट वेक्टर प्रस्तुत किया गया है। यह इनपुट सिग्नल नेटवर्क के माध्यम से न्यूरॉन द्वारा आगे, न्यूरॉन का प्रचार करता है और आउटपुट सिग्नल के रूप में नेटवर्क के आउटपुट छोर पर उभरता है: आउटपुट न्यूरॉन द्वारा परिभाषित न्यूरॉन का प्रेरित स्थानीय क्षेत्र है y(n) = φ(v(n))जहां आउटपुट लेयर ओ (एन) की गणना की जाती है। वांछित प्रतिक्रिया की तुलना में और उस न्यूरॉन के लिए त्रुटि पाता है । इस पास के दौरान नेटवर्क का सिनैप्टिक वेट समान रहता है।v(n)v(n) =Σ w(n)y(n).d(n)e(n)

पिछड़ा पास:

त्रुटि संकेत जो उस परत के आउटपुट न्यूरॉन में उत्पन्न होता है, नेटवर्क के माध्यम से पिछड़ा हुआ होता है। यह प्रत्येक परत में प्रत्येक न्यूरॉन के लिए स्थानीय ढाल की गणना करता है और नेटवर्क के अन्तर्ग्रथनी भार को डेल्टा नियम के अनुसार परिवर्तनों से गुजरने की अनुमति देता है:

Δw(n) = η * δ(n) * y(n).

इस पुनरावर्ती संगणना को जारी रखा गया है, नेटवर्क के अभिसरण होने तक प्रत्येक इनपुट पैटर्न के लिए पश्चगामी पास के साथ फॉरवर्ड पास।

एक ANN का पर्यवेक्षित शिक्षण प्रतिमान कुशल है और यह कई रैखिक और गैर-रैखिक समस्याओं जैसे कि वर्गीकरण, पौधे नियंत्रण, पूर्वानुमान, भविष्यवाणी, रोबोटिक्स आदि के समाधान ढूंढता है।

अनसुनी हुई पढ़ाई

स्व-संगठित तंत्रिका नेटवर्क, अनलेबेड इनपुट डेटा में छिपे हुए पैटर्न की पहचान करने के लिए अप्रकाशित शिक्षण एल्गोरिथ्म का उपयोग करना सीखते हैं। यह अनुपलब्धता संभावित समाधान का मूल्यांकन करने के लिए एक त्रुटि संकेत प्रदान किए बिना जानकारी सीखने और व्यवस्थित करने की क्षमता को संदर्भित करता है। अनुपयोगी शिक्षण में लर्निंग एल्गोरिदम के लिए दिशा की कमी कुछ समय के लिए फायदेमंद हो सकती है, क्योंकि यह एल्गोरिथम को उन पैटर्नों के लिए वापस देखने की अनुमति देता है जिन्हें पहले नहीं माना गया है। स्व-व्यवस्थित मानचित्र (एसओएम) की मुख्य विशेषताएं हैं:

  1. यह एक या दो आयामी मानचित्र में मनमाने आयाम के एक आने वाले सिग्नल पैटर्न को बदल देता है और इस परिवर्तन को अनुकूल रूप से करता है
  2. पंक्तियों और स्तंभों में व्यवस्थित न्यूरॉन्स से मिलकर एकल कम्प्यूटेशनल परत के साथ नेटवर्क फीडफोवर्ड संरचना का प्रतिनिधित्व करता है। प्रतिनिधित्व के प्रत्येक चरण में, प्रत्येक इनपुट सिग्नल को उसके उचित संदर्भ में रखा जाता है और,
  3. सूचनाओं के निकट संबंधित टुकड़ों से निपटने वाले न्यूरॉन्स एक साथ करीब हैं और वे सिनैप्टिक कनेक्शन के माध्यम से संवाद करते हैं।

कम्प्यूटेशनल परत को प्रतिस्पर्धी परत भी कहा जाता है क्योंकि परत में न्यूरॉन्स सक्रिय होने के लिए एक-दूसरे के साथ प्रतिस्पर्धा करते हैं। इसलिए, इस लर्निंग एल्गोरिदम को प्रतिस्पर्धी एल्गोरिथम कहा जाता है। SOM में Unsupervised एल्गोरिथ्म तीन चरणों में काम करता है:

प्रतियोगिता का चरण:

प्रत्येक इनपुट पैटर्न के xलिए, नेटवर्क को प्रस्तुत किया जाता है, अन्तर्ग्रथनी भार के साथ आंतरिक उत्पाद wकी गणना की जाती है और प्रतिस्पर्धी परत में न्यूरॉन्स को एक भेदभावपूर्ण कार्य मिलता है जो न्यूरॉन्स और अन्तर्ग्रथनी भार वेक्टर के बीच प्रतिस्पर्धा को प्रेरित करता है जो यूक्लिडियन दूरी में इनपुट वेक्टर के करीब है प्रतियोगिता में विजेता के रूप में घोषित किया जाता है। उस न्यूरॉन को सबसे अच्छा मिलान न्यूरॉन कहा जाता है,

i.e. x = arg min ║x - w║.

सहकारी चरण:

जीतने वाला न्यूरॉन hसहयोग करने वाले न्यूरॉन्स के एक टोपोलॉजिकल पड़ोस का केंद्र निर्धारित करता है । यह dसहकारी न्यूरॉन्स के बीच पार्श्व बातचीत द्वारा किया जाता है । यह टोपोलॉजिकल पड़ोस एक समय अवधि में इसका आकार कम कर देता है।

अनुकूली चरण:

उपयुक्त अन्तर्ग्रथनी भार समायोजन के माध्यम से इनपुट पैटर्न के संबंध में भेदभावपूर्ण कार्य के अपने व्यक्तिगत मूल्यों को बढ़ाने के लिए जीतने वाले न्यूरॉन और उसके पड़ोस के न्यूरॉन्स को सक्षम करता है,

 Δw = ηh(x)(x –w).

प्रशिक्षण पैटर्न की बार-बार प्रस्तुति पर, अन्तर्ग्रथनी वेट वैक्टर पड़ोस अद्यतन के कारण इनपुट पैटर्न के वितरण का पालन करते हैं और इस प्रकार एएनएन पर्यवेक्षक के बिना सीखता है।

स्व-आयोजन मॉडल स्वाभाविक रूप से न्यूरो-जैविक व्यवहार का प्रतिनिधित्व करता है, और इसलिए इसका उपयोग कई वास्तविक दुनिया अनुप्रयोगों में किया जाता है जैसे क्लस्टरिंग, भाषण मान्यता, बनावट विभाजन, वेक्टर कोडिंग आदि।

संदर्भ।


5

मैंने हमेशा अनिश्चित और पर्यवेक्षित सीखने के बीच अंतर को मनमाना और थोड़ा भ्रमित करने वाला पाया है। दो मामलों के बीच कोई वास्तविक अंतर नहीं है, इसके बजाय कई स्थितियों में एक एल्गोरिथ्म में कम या ज्यादा 'पर्यवेक्षण' हो सकता है। अर्ध-पर्यवेक्षित अधिगम का अस्तित्व एक स्पष्ट उदाहरण है जहाँ रेखा धुंधली है।

मैं एल्गोरिथ्म के बारे में प्रतिक्रिया देने के बारे में सोचता हूं कि क्या समाधान पसंद किए जाने चाहिए। एक पारंपरिक पर्यवेक्षित सेटिंग के लिए, जैसे स्पैम का पता लगाना, आप एल्गोरिथ्म को बताते हैं "प्रशिक्षण सेट पर कोई गलती न करें" ; एक पारंपरिक अनुपयोगी सेटिंग के लिए, जैसे कि क्लस्टरिंग, आप एल्गोरिथ्म को बताते हैं "अंक जो एक दूसरे के करीब हैं वे एक ही क्लस्टर में होने चाहिए" । यह सिर्फ इतना होता है कि, प्रतिक्रिया का पहला रूप उत्तरार्द्ध की तुलना में बहुत अधिक विशिष्ट है।

संक्षेप में, जब कोई कहता है कि 'पर्यवेक्षण' किया गया है, तो वर्गीकरण के बारे में सोचें, जब वे कहते हैं कि 'अप्रकाशित' क्लस्टरिंग के बारे में सोचते हैं और इससे परे इसके बारे में बहुत अधिक चिंता न करने का प्रयास करें।


2
भेद वास्तव में अच्छी तरह से परिभाषित और सरल है। देखें डेविड रोबल्स का जवाब।
बायर

3
यह परिभाषा ठीक है जहां तक ​​यह जाता है, लेकिन यह बहुत संकीर्ण है। अर्ध-पर्यवेक्षित शिक्षा क्या है? यह पर्यवेक्षित और अप्रमाणित दोनों है। Bayesian inference में एक पूर्व पर कंडीशनिंग के बारे में क्या? निश्चित रूप से यह पर्यवेक्षण का एक रूप है। संरेखित वाक्य युग्मों के सेट के (a (unsupervised)) भाषा मॉडल और (पर्यवेक्षित प्रकार?) के साथ मशीनी अनुवाद में किस तरह के प्रयोग के बारे में बताया गया है? 'पर्यवेक्षण' आगमनात्मक पूर्वाग्रह का एक और रूप है।
स्टंपचेन

1
मैं आपकी बात देख रहा हूं, और यह काफी रोचक है। हालांकि, मैं उतना चिंता नहीं करूंगा। क्लासिक अनप्रूव्ड / सुपरवाइज्ड डिस्टिंक्शन ज्यादातर मामलों में मिलता है।
बायर

4

मशीन लर्निंग: यह एल्गोरिदम के अध्ययन और निर्माण की खोज करता है जो डेटा पर भविष्यवाणियां कर सकता है और भविष्यवाणी कर सकता है। कतिपय के रूप में सख्ती से पालन करने के बजाय डेटा-संचालित भविष्यवाणियों या निर्णयों को आउटपुट के रूप में व्यक्त करने के लिए उदाहरण इनपुट से एक मॉडल बनाकर काम करते हैं। कार्यक्रम निर्देश।

पर्यवेक्षित शिक्षण: यह लेबल प्रशिक्षण डेटा से किसी फ़ंक्शन का संदर्भ लेने का मशीन शिक्षण कार्य है। प्रशिक्षण डेटा में प्रशिक्षण उदाहरणों का एक सेट होता है। पर्यवेक्षित शिक्षण में, प्रत्येक उदाहरण एक इनपुट ऑब्जेक्ट (आमतौर पर एक वेक्टर) और एक वांछित आउटपुट वैल्यू (जिसे सुपरवाइजर सिग्नल भी कहा जाता है) से युक्त एक जोड़ी है। एक पर्यवेक्षित शिक्षण एल्गोरिथ्म प्रशिक्षण डेटा का विश्लेषण करता है और एक अनुमानित फ़ंक्शन का उत्पादन करता है, जिसका उपयोग नए उदाहरणों को मैप करने के लिए किया जा सकता है।

कंप्यूटर को उदाहरण के इनपुट और उनके वांछित आउटपुट के साथ प्रस्तुत किया जाता है, जो एक "शिक्षक" द्वारा दिया जाता है, और लक्ष्य एक सामान्य नियम को सीखना है जो आउटपुट के लिए मैप करता है। विशेष रूप से, एक पर्यवेक्षित शिक्षण एल्गोरिथ्म इनपुट डेटा और ज्ञात प्रतिक्रियाओं का एक ज्ञात सेट लेता है। डेटा (आउटपुट) के लिए, और नए डेटा की प्रतिक्रिया के लिए उचित पूर्वानुमान उत्पन्न करने के लिए एक मॉडल को प्रशिक्षित करता है।

बिना सीखे पढ़ाई: यह बिना शिक्षक के सीख रहा है। एक मूल बात जो आप डेटा के साथ करना चाह सकते हैं वह है कल्पना करना। यह मशीन के कार्य को सीखने का कार्य है जो अनलेब किए गए डेटा से छिपी संरचना का वर्णन करता है। चूँकि शिक्षार्थी को दिए गए उदाहरण गैर-सूचीबद्ध हैं, इसलिए संभावित समाधान का मूल्यांकन करने के लिए कोई त्रुटि या इनाम संकेत नहीं है। यह पर्यवेक्षित शिक्षण से अप्रशिक्षित शिक्षा को अलग करता है। अनउपलब्ध शिक्षण उन प्रक्रियाओं का उपयोग करता है जो पैटर्न के प्राकृतिक विभाजन को खोजने का प्रयास करते हैं।

बिना पढ़े हुए सीखने के साथ, भविष्यवाणी के परिणामों के आधार पर कोई प्रतिक्रिया नहीं होती है, अर्थात, आपको ठीक करने के लिए कोई शिक्षक नहीं है। अनसुर्विलाइज्ड सीखने के तरीकों के बारे में कोई लेबल उदाहरण प्रदान नहीं किया गया है और सीखने की प्रक्रिया के दौरान आउटपुट की कोई धारणा नहीं है। नतीजतन, यह पैटर्न को खोजने या इनपुट डेटा के समूहों की खोज करने के लिए सीखने की योजना / मॉडल पर निर्भर है

जब आपको अपने मॉडल को प्रशिक्षित करने के लिए बड़ी मात्रा में डेटा की आवश्यकता हो, और प्रयोग और खोज करने की इच्छा और क्षमता, और निश्चित रूप से एक चुनौती जो कि अधिक स्थापित तरीकों से अच्छी तरह से हल नहीं हुई है। इसे सीखने के लिए आपको अनुपयोगी शिक्षण विधियों का उपयोग करना चाहिए। पर्यवेक्षित शिक्षण की तुलना में बड़े और अधिक जटिल मॉडल सीखना संभव है। इस पर एक अच्छा उदाहरण है


4

सुपरवाइज्ड लर्निंग: कहते हैं कि एक बच्चा किंडर-गार्डन जाता है। यहाँ शिक्षक उसे 3 खिलौने-घर, गेंद और कार दिखाता है। अब शिक्षक उसे 10 खिलौने देता है। वह उन्हें अपने पिछले अनुभव के आधार पर घर, गेंद और कार के 3 बॉक्स में वर्गीकृत करेगा। इसलिए कुछ सेट के लिए सही उत्तर प्राप्त करने के लिए पहले शिक्षकों द्वारा बच्चों की देखरेख की जाती थी। तब उसका परीक्षण अज्ञात खिलौनों पर किया गया। आ

अप्रशिक्षित शिक्षा: फिर से बालवाड़ी उदाहरण। बच्चे को 10 खिलौने दिए जाते हैं। उन्होंने कहा कि इसी तरह के लोगों को खंडित किया जाता है। इसलिए आकार, आकार, रंग, फ़ंक्शन आदि जैसी सुविधाओं के आधार पर वह 3 समूहों को ए, बी, सी और समूह बनाने का प्रयास करेगा। bb

शब्द पर्यवेक्षण का मतलब है कि आप उत्तर देने में मदद करने के लिए मशीन को पर्यवेक्षण / निर्देश दे रहे हैं। एक बार जब यह निर्देश सीख लेता है, तो यह आसानी से नए मामले के लिए भविष्यवाणी कर सकता है।

Unsupervised का अर्थ है कि कोई भी पर्यवेक्षण या निर्देश नहीं है कि कैसे उत्तर / लेबल और मशीन का पता लगाएं, हमारे डेटा में कुछ पैटर्न खोजने के लिए अपनी बुद्धि का उपयोग करेंगे। यहां यह भविष्यवाणी नहीं करेगा, यह सिर्फ उन समूहों को खोजने की कोशिश करेगा जिनके पास समान डेटा है।


4

पहले से ही कई उत्तर हैं जो मतभेदों के बारे में विस्तार से बताते हैं। मुझे ये gifs कोडे अकादमी पर मिले और वे अक्सर मुझे अंतरों को प्रभावी ढंग से समझाने में मदद करते हैं।

पर्यवेक्षित अध्ययन

यहां छवि विवरण दर्ज करें ध्यान दें कि प्रशिक्षण छवियों में यहां लेबल हैं और मॉडल छवियों के नाम सीख रहा है।

अनसुनी हुई पढ़ाई

यहां छवि विवरण दर्ज करें ध्यान दें कि यहां जो कुछ भी किया जा रहा है वह सिर्फ समूह (क्लस्टरिंग) है और यह कि मॉडल किसी भी छवि के बारे में कुछ भी नहीं जानता है।


4

एक तंत्रिका नेटवर्क के सीखने की एल्गोरिथ्म या तो देखरेख की जा सकती है या अनुपयोगी हो सकती है।

यदि वांछित आउटपुट पहले से ही जाना जाता है, तो एक तंत्रिका जाल को पर्यवेक्षित सीखने के लिए कहा जाता है। उदाहरण: पैटर्न एसोसिएशन

तंत्रिका जाल जो अप्रशिक्षित सीखते हैं, उनके पास ऐसा कोई लक्ष्य आउटपुट नहीं है। यह निर्धारित नहीं किया जा सकता है कि सीखने की प्रक्रिया का परिणाम कैसा दिखेगा। सीखने की प्रक्रिया के दौरान, इस तरह के एक तंत्रिका जाल की इकाइयां (वजन मान) दिए गए इनपुट मूल्यों के आधार पर, एक निश्चित सीमा के अंदर "व्यवस्थित" होती हैं। लक्ष्य मूल्य सीमा के कुछ क्षेत्रों में समान इकाइयों को एक साथ समूहित करना है। उदाहरण: पैटर्न वर्गीकरण


3

सुपरवाइज़्ड लर्निंग, ने एक जवाब के साथ डेटा दिया।

स्पैम / स्पैम नहीं के रूप में लेबल किए गए ईमेल को देखते हुए, स्पैम फ़िल्टर सीखें।

मधुमेह या नहीं होने वाले रोगियों के डेटासेट को देखते हुए, नए रोगियों को मधुमेह या नहीं होने के रूप में वर्गीकृत करना सीखें।

बिना किसी सीख के, बिना किसी उत्तर के डेटा दिए, पीसी को चीजों को समूहित करने दें।

वेब पर पाए जाने वाले समाचार लेखों के एक सेट को देखते हुए, एक ही कहानी के बारे में लेखों के समूह को सेट करें।

कस्टम डेटा के डेटाबेस को देखते हुए, स्वचालित रूप से बाज़ार क्षेत्रों और समूह ग्राहकों को विभिन्न बाज़ार क्षेत्रों में खोजते हैं।

संदर्भ


3

पर्यवेक्षित अध्ययन

इसमें, नेटवर्क को प्रशिक्षित करने के लिए उपयोग किया जाने वाला प्रत्येक इनपुट पैटर्न आउटपुट पैटर्न से जुड़ा होता है, जो लक्ष्य या वांछित पैटर्न होता है। एक शिक्षक को सीखने की प्रक्रिया के दौरान उपस्थित होने के लिए माना जाता है, जब नेटवर्क के गणना किए गए आउटपुट और सही अपेक्षित आउटपुट के बीच तुलना निर्धारित की जाती है, त्रुटि का निर्धारण करने के लिए। फिर त्रुटि का उपयोग नेटवर्क मापदंडों को बदलने के लिए किया जा सकता है, जिसके परिणामस्वरूप प्रदर्शन में सुधार होता है।

अनसुनी हुई पढ़ाई

इस शिक्षण पद्धति में, लक्ष्य आउटपुट को नेटवर्क में प्रस्तुत नहीं किया जाता है। यह ऐसा है जैसे कि वांछित पैटर्न प्रस्तुत करने के लिए कोई शिक्षक नहीं है और इसलिए, सिस्टम इनपुट पैटर्न में संरचनात्मक सुविधाओं की खोज और अनुकूलन करके अपनी खुद की सीखता है।


3

सुपरवाइज्ड लर्निंग : आप सही जवाब के साथ इनपुट के रूप में विभिन्न लेबल वाले उदाहरण डेटा देते हैं। यह एल्गोरिथ्म इससे सीखेगा, और इसके बाद इनपुट के आधार पर सही परिणामों की भविष्यवाणी करना शुरू कर देगा। उदाहरण : ईमेल स्पैम फ़िल्टर

अनसुनीकृत लर्निंग : आप केवल डेटा देते हैं और कुछ भी नहीं बताते हैं - जैसे लेबल या सही उत्तर। एल्गोरिथम डेटा में पैटर्न का स्वचालित रूप से विश्लेषण करता है। उदाहरण : Google समाचार


3

मैं इसे सरल रखने की कोशिश करूंगा।

सुपरवाइज्ड लर्निंग: सीखने की इस तकनीक में, हमें एक डेटा सेट दिया जाता है और सिस्टम पहले से ही डेटा सेट के सही आउटपुट को जानता है। तो यहाँ, हमारा सिस्टम अपने स्वयं के मूल्य की भविष्यवाणी करके सीखता है। फिर, यह एक लागत समारोह का उपयोग करके सटीकता की जांच करता है कि वास्तविक उत्पादन के लिए इसकी भविष्यवाणी कितनी करीब थी।

अप्रशिक्षित अधिगम: इस दृष्टिकोण में, हमें इस बात का बहुत कम या कोई ज्ञान नहीं है कि हमारा परिणाम क्या होगा। इसलिए इसके बजाय, हम उस संरचना से डेटा प्राप्त करते हैं जहां हम परिवर्तनशील के प्रभाव को नहीं जानते हैं। हम डेटा में वेरिएबल के बीच संबंध के आधार पर डेटा को क्लस्टर करके संरचना बनाते हैं। यहाँ, हमारे पास हमारी भविष्यवाणी के आधार पर प्रतिक्रिया नहीं है।


2

पर्यवेक्षित अध्ययन

आपके पास इनपुट x और लक्ष्य आउटपुट टी है। तो आप लापता हिस्सों को सामान्य करने के लिए एल्गोरिथ्म को प्रशिक्षित करते हैं। इसकी देखरेख की जाती है क्योंकि लक्ष्य दिया जाता है। आप एल्गोरिथ्म बता रहे पर्यवेक्षक हैं: उदाहरण के लिए x, आपको आउटपुट टी चाहिए!

अशिक्षित शिक्षा

हालाँकि आमतौर पर इस दिशा में विभाजन, क्लस्टरिंग और कम्प्रेशन को गिना जाता है, फिर भी मुझे इसके लिए एक अच्छी परिभाषा के साथ आने का कठिन समय है।

एक उदाहरण के रूप में संपीड़न के लिए ऑटो-एनकोडर लेते हैं । जबकि आपके पास केवल इनपुट x दिया गया है, यह मानव इंजीनियर है जो एल्गोरिथ्म को बताता है कि लक्ष्य भी x है। तो कुछ अर्थों में, यह पर्यवेक्षित सीखने से अलग नहीं है।

और क्लस्टरिंग और विभाजन के लिए, मुझे यकीन नहीं है कि यह वास्तव में मशीन लर्निंग की परिभाषा फिट बैठता है (देखें अन्य प्रश्न )।


2

सुपरवाइज्ड लर्निंग: आपने डेटा लेबल किया है और उससे सीखना है। उदाहरण के लिए मूल्य के साथ घर का डेटा और फिर मूल्य की भविष्यवाणी करना सीखें

अनउपलब्ध शिक्षण: आपको प्रवृत्ति ढूंढनी होगी और फिर भविष्यवाणी करनी होगी, कोई पूर्व लेबल नहीं दिया गया है। उदाहरण के लिए कक्षा में अलग-अलग लोग और फिर एक नया व्यक्ति आता है ताकि यह नया छात्र किस समूह से संबंधित हो।


1

में प्रबंधित सीखना हम जानते हैं कि इनपुट और आउटपुट होना चाहिए। उदाहरण के लिए, कारों का एक सेट दिया गया। हमें यह पता लगाना होगा कि कौन से लाल हैं और कौन से नीले।

जबकि, Unsupervised Learning वह है जहां हमें बहुत कम या बिना किसी विचार के जवाब का पता लगाना है कि आउटपुट कैसा होना चाहिए। उदाहरण के लिए, एक शिक्षार्थी एक मॉडल का निर्माण करने में सक्षम हो सकता है जो पता लगाता है कि जब लोग चेहरे के पैटर्न और शब्दों जैसे "आप किस बारे में मुस्कुरा रहे हैं?" के आधार पर मुस्कुरा रहे हैं।


1

पर्यवेक्षित शिक्षण प्रशिक्षण के दौरान सीखने के आधार पर एक नए आइटम को एक प्रशिक्षित लेबल में लेबल कर सकता है। आपको बड़ी संख्या में प्रशिक्षण डेटा सेट, सत्यापन डेटा सेट और परीक्षण डेटा सेट प्रदान करने की आवश्यकता है। यदि आप लेबल के साथ प्रशिक्षण डेटा के साथ अंकों की पिक्सेल छवि वैक्टर प्रदान करते हैं, तो यह संख्याओं की पहचान कर सकता है।

अनसुचित शिक्षण को डेटा-सेट के प्रशिक्षण की आवश्यकता नहीं होती है। अनियोजित शिक्षण में यह इनपुट वैक्टर में अंतर के आधार पर वस्तुओं को विभिन्न समूहों में समूहित कर सकता है। यदि आप अंकों के पिक्सेल छवि वैक्टर प्रदान करते हैं और इसे 10 श्रेणियों में वर्गीकृत करने के लिए कहते हैं, तो ऐसा हो सकता है। लेकिन यह जानता है कि इसे कैसे लेबल करना है क्योंकि आपने प्रशिक्षण लेबल प्रदान नहीं किए हैं।


1

पर्यवेक्षित शिक्षण मूल रूप से है जहाँ आपके पास इनपुट चर (x) और आउटपुट चर (y) हैं और इनपुट से आउटपुट तक मानचित्रण फ़ंक्शन को जानने के लिए एल्गोरिदम का उपयोग करते हैं। इसका कारण जिसे हम पर्यवेक्षण के रूप में कहते हैं, क्योंकि एल्गोरिथ्म प्रशिक्षण डाटासेट से सीखता है, एल्गोरिथ्म प्रशिक्षण डेटा पर भविष्यवाणियां करता है। पर्यवेक्षित के दो प्रकार हैं- वर्गीकरण और प्रतिगमन। वर्गीकरण तब होता है जब आउटपुट चर हां / ना, सही / गलत की तरह श्रेणी होता है। प्रतिगमन तब होता है जब आउटपुट वास्तविक मान होता है जैसे व्यक्ति की ऊंचाई, तापमान आदि।

संयुक्त राष्ट्र पर्यवेक्षित शिक्षण वह जगह है जहां हमारे पास केवल इनपुट डेटा (एक्स) है और कोई आउटपुट चर नहीं है। इसे एक अप्रशिक्षित अधिगम कहा जाता है क्योंकि ऊपर दी गई पर्यवेक्षित अधिगम के विपरीत कोई सही उत्तर नहीं है और कोई शिक्षक नहीं है। डेटा में दिलचस्प संरचना को खोजने और प्रस्तुत करने के लिए एल्गोरिदम को अपने स्वयं के डेविस पर छोड़ दिया जाता है।

अप्रशिक्षित शिक्षा के प्रकार क्लस्टरिंग और एसोसिएशन हैं।


1

सुपरवाइज्ड लर्निंग मूल रूप से एक ऐसी तकनीक है जिसमें प्रशिक्षण डेटा जिसमें से मशीन सीखती है, पहले से ही लेबल होती है, जिसे एक सरल सम विषम संख्या में मान लिया जाता है, जहाँ आपने पहले ही प्रशिक्षण के दौरान डेटा को वर्गीकृत कर लिया है। इसलिए यह "LABELED" डेटा का उपयोग करता है।

इसके विपरीत अनसुचित शिक्षा एक ऐसी तकनीक है जिसमें मशीन स्वयं डेटा का लेबल लगाती है। या आप इसके मामले को तब कह सकते हैं जब मशीन खरोंच से सीखती है।


1

सरल पर्यवेक्षित शिक्षण में में मशीन सीखने की समस्या का प्रकार होता है जिसमें हमारे पास कुछ लेबल होते हैं और उन लेबलों का उपयोग करके हम एल्गोरिथ्म को लागू करते हैं जैसे कि उदासीनता और वर्गीकरण। क्लैसिफिकेशन को लागू किया जाता है जहां हमारा आउटपुट 0 या 1 के रूप में होता है, सच / गलत, हाँ नही। और प्रतिगमन लागू किया जाता है, जहां एक वास्तविक मूल्य ऐसे मूल्य के घर में रखा जाता है

Unsupervised Learning एक प्रकार की मशीन लर्निंग समस्या है जिसमें हमारे पास कोई लेबल नहीं होता है अर्थात हमारे पास केवल कुछ डेटा होते हैं, अनस्ट्रक्चर्ड डेटा और हमें विभिन्न unsupervised एल्गोरिथ्म का उपयोग करके डेटा (डेटा का समूह) को क्लस्टर करना होता है


1

सुपरवाइज्ड मशीन लर्निंग

"प्रशिक्षण एल्गोरिथ्म से सीखने वाले एल्गोरिथम की प्रक्रिया और आउटपुट की भविष्यवाणी करता है।"

प्रशिक्षण डेटा (लंबाई) के सीधे आनुपातिक अनुमानित उत्पादन की सटीकता

पर्यवेक्षित शिक्षण वह जगह है जहाँ आपके पास इनपुट चर (x) (प्रशिक्षण डाटासेट) और एक आउटपुट चर (Y) (परीक्षण डाटासेट) है और आप इनपुट से आउटपुट तक मानचित्रण फ़ंक्शन को सीखने के लिए एक एल्गोरिथ्म का उपयोग करते हैं।

Y = f(X)

प्रमुख प्रकार:

  • वर्गीकरण (असतत y- अक्ष)
  • भविष्य कहनेवाला (निरंतर y- अक्ष)

एल्गोरिदम:

  • वर्गीकरण एल्गोरिदम:

    Neural Networks  
    Naïve Bayes classifiers  
    Fisher linear discriminant  
    KNN 
    Decision Tree 
    Super Vector Machines
    
  • भविष्य कहनेवाला एल्गोरिदम:

    Nearest  neighbor  
    Linear Regression,Multi Regression 
    

उपयेाग क्षेत्र:

  1. ईमेल को स्पैम के रूप में वर्गीकृत करना
  2. रोगी को बीमारी है या नहीं यह वर्गीकृत करना
  3. आवाज की पहचान

  4. एचआर चुनें विशेष उम्मीदवार का चयन करें या नहीं

  5. शेयर बाजार की कीमत की भविष्यवाणी करें


1

पर्यवेक्षित अध्ययन :

एक पर्यवेक्षित शिक्षण एल्गोरिथ्म प्रशिक्षण डेटा का विश्लेषण करता है और एक अनुमानित फ़ंक्शन का उत्पादन करता है, जिसका उपयोग नए उदाहरणों को मैप करने के लिए किया जा सकता है।

  1. हम प्रशिक्षण डेटा प्रदान करते हैं और हम एक निश्चित इनपुट के लिए सही आउटपुट जानते हैं
  2. हम इनपुट और आउटपुट के बीच संबंध जानते हैं

समस्या की श्रेणियाँ:

प्रतिगमन: एक निरंतर आउटपुट के भीतर परिणाम => कुछ निरंतर फ़ंक्शन के लिए मैप इनपुट चर।

उदाहरण:

किसी व्यक्ति की तस्वीर को देखते हुए, उसकी आयु की भविष्यवाणी करें

वर्गीकरण: असतत आउटपुट => इनपुट इनपुट चर को असतत श्रेणियों में परिणामित करता है

उदाहरण:

क्या यह ट्यूमर कैंसर है?

पर्यवेक्षित अध्ययन

अप्रशिक्षित शिक्षा:

अनसेप्डाइज़्ड लर्निंग टेस्ट डेटा से सीखता है जिसे लेबल, वर्गीकृत या वर्गीकृत नहीं किया गया है। अनपर्सिव लर्निंग, डेटा में सामान्यताओं की पहचान करता है और डेटा के प्रत्येक नए टुकड़े में ऐसी सामान्यताओं की उपस्थिति या अनुपस्थिति के आधार पर प्रतिक्रिया करता है।

  1. हम डेटा में चर के बीच संबंधों के आधार पर डेटा को क्लस्टर करके इस संरचना को प्राप्त कर सकते हैं।

  2. भविष्यवाणी के परिणामों के आधार पर कोई प्रतिक्रिया नहीं है।

समस्या की श्रेणियाँ:

क्लस्टरिंग: वस्तुओं के एक सेट को इस तरह से समूहीकृत करने का कार्य है कि एक ही समूह में वस्तुओं (एक क्लस्टर कहा जाता है) अधिक समान (कुछ अर्थों में) अन्य समूहों (क्लस्टर) में उन लोगों की तुलना में एक दूसरे के समान है

उदाहरण:

1,000,000 अलग-अलग जीनों का एक संग्रह लें, और इन जीनों को स्वचालित रूप से उन समूहों में समूह बनाने का एक तरीका खोजें जो किसी तरह समान हैं या विभिन्न चर, जैसे जीवन काल, स्थान, भूमिकाएं, और इसी तरह से संबंधित हैं

अशिक्षित शिक्षा

लोकप्रिय उपयोग के मामले यहां सूचीबद्ध हैं।

डेटा माइनिंग में वर्गीकरण और क्लस्टरिंग के बीच अंतर?

संदर्भ:

पर्यवेक्षित अध्ययन

Unsupervised_learning

मशीन-विद्या प्रांगण से

towardsdatascience


1

पर्यवेक्षित अध्ययन

यहां छवि विवरण दर्ज करें

अनसुनी हुई पढ़ाई

यहां छवि विवरण दर्ज करें

उदाहरण:

पर्यवेक्षित अध्ययन:

  • सेब के साथ एक बैग
  • नारंगी के साथ एक बैग

    => निर्माण मॉडल

  • सेब और संतरे का एक मिश्रित बैग।

    => कृपया वर्गीकरण करें

अप्रशिक्षित शिक्षण:

  • सेब और संतरे का एक मिश्रित बैग।

    => निर्माण मॉडल

  • एक और मिश्रित बैग

    => कृपया वर्गीकरण करें


1

सरल शब्दों में .. :) यह मेरी समझ है, सही करने के लिए स्वतंत्र महसूस करें। पर्यवेक्षित शिक्षण है, हम जानते हैं कि हम प्रदान किए गए डेटा के आधार पर क्या भविष्यवाणी कर रहे हैं। इसलिए हमारे पास डेटासेट में एक कॉलम है, जिसे प्रेडिकेट करने की आवश्यकता है। अनउपलब्ध शिक्षण है, हम प्रदान किए गए डेटासेट से अर्थ निकालने की कोशिश करते हैं। हमें इस बात की स्पष्टता नहीं है कि क्या भविष्यवाणी की जानी चाहिए। तो सवाल यह है कि हम ऐसा क्यों करते हैं? .. :) उत्तर है - अनसुनी शिक्षा का परिणाम समूह / समूह (समान डेटा एक साथ) है। इसलिए यदि हमें कोई नया डेटा प्राप्त होता है तो हम उस पहचाने गए क्लस्टर / समूह के साथ जुड़ते हैं और समझते हैं कि यह सुविधाएँ हैं।

मुझे आशा है कि यह आपकी मदद करेगा।


1

पर्यवेक्षित अध्ययन

पर्यवेक्षित अधिगम वह है जहां हम कच्चे इनपुट के आउटपुट को जानते हैं, अर्थात डेटा को लेबल किया जाता है ताकि मशीन लर्निंग मॉडल के प्रशिक्षण के दौरान यह समझ में आ जाए कि उसे आउटपुट में क्या पता लगाना है, और यह प्रशिक्षण के दौरान सिस्टम को निर्देशित करेगा। उस आधार पर पूर्व-लेबल की गई वस्तुओं का पता लगाएं यह उन समान वस्तुओं का पता लगाएगा जिन्हें हमने प्रशिक्षण में प्रदान किया है।

यहां एल्गोरिदम से पता चल जाएगा कि डेटा की संरचना और पैटर्न क्या है। वर्गीकरण के लिए पर्यवेक्षित शिक्षण का उपयोग किया जाता है

एक उदाहरण के रूप में, हमारे पास एक अलग वस्तु हो सकती है, जिनकी आकृतियाँ वर्गाकार, वृत्त, त्रिकोणीय हैं। हमारा कार्य उसी प्रकार की आकृतियों को व्यवस्थित करना है जिस तरह से लेबल किए गए डेटासेट में सभी आकृतियों को लेबल किया गया है, और हम उस डेटासेट पर मशीन लर्निंग मॉडल को प्रशिक्षित करेंगे, प्रशिक्षण तिथियों के आधार पर यह आकृतियों का पता लगाना शुरू कर देगा।

अप्रशिक्षित शिक्षण

अनसुपरिज्ड लर्निंग एक अन-लेग्ड लर्निंग है जहां अंतिम परिणाम ज्ञात नहीं है, यह डेटासेट को क्लस्टर करेगा और ऑब्जेक्ट के समान गुणों के आधार पर यह ऑब्जेक्ट्स को अलग-अलग गुच्छा पर विभाजित करेगा और ऑब्जेक्ट्स का पता लगाएगा।

यहां एल्गोरिदम कच्चे डेटा में विभिन्न पैटर्न की खोज करेगा, और इसके आधार पर यह डेटा को क्लस्टर करेगा। क्लस्टरिंग के लिए अन-सुपरवाइज्ड लर्निंग का उपयोग किया जाता है।

एक उदाहरण के रूप में, हमारे पास कई आकृतियों के वर्ग, वृत्त, त्रिकोण की अलग-अलग वस्तुएं हो सकती हैं, इसलिए यह ऑब्जेक्ट गुणों के आधार पर गुच्छों को बना देगा, यदि किसी वस्तु के चार पक्ष हैं तो वह इसे वर्ग मान लेगी, और यदि इसके तीन पक्ष त्रिकोण हैं और यदि सर्कल की तुलना में कोई भी पक्ष नहीं है, तो यहां डेटा को लेबल नहीं किया गया है, यह विभिन्न आकृतियों का पता लगाने के लिए खुद ही सीख जाएगा


1

मशीन लर्निंग एक ऐसा क्षेत्र है जहां आप मशीन को मानव व्यवहार की नकल करने के लिए बनाने की कोशिश कर रहे हैं।

आप एक बच्चे की तरह मशीन को प्रशिक्षित करते हैं। जिस तरह से मनुष्य सीखते हैं, सुविधाओं की पहचान करते हैं, पैटर्न को पहचानते हैं और खुद को प्रशिक्षित करते हैं, उसी तरह आप विभिन्न सुविधाओं के साथ डेटा खिलाकर मशीन को प्रशिक्षित करते हैं। मशीन एल्गोरिथ्म डेटा के भीतर पैटर्न की पहचान करता है और इसे विशेष श्रेणी में वर्गीकृत करता है।

मशीन लर्निंग को मोटे तौर पर दो श्रेणी में विभाजित किया गया है, पर्यवेक्षित और अनुपयोगी शिक्षण।

पर्यवेक्षित अधिगम वह अवधारणा है जहाँ आपके पास संबंधित लक्ष्य मान (आउटपुट) के साथ इनपुट वेक्टर / डेटा है। दूसरी ओर अप्रशिक्षित अधिगम वह अवधारणा है, जहाँ आपके पास केवल इनपुट वैक्टर / डेटा है जो बिना किसी समान लक्ष्य मान के है।

पर्यवेक्षित अधिगम का एक उदाहरण हस्तलिखित अंकों की मान्यता है जहां आपके पास संबंधित अंक [0-9] के साथ अंकों की छवि होती है, और अनुपयोगी सीखने का एक उदाहरण ग्राहकों को व्यवहार खरीदकर समूहीकृत करना है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.