'कमजोर शिक्षार्थी' से क्या अभिप्राय है?


34

क्या कोई मुझे बता सकता है कि 'कमजोर शिक्षार्थी' वाक्यांश का क्या मतलब है? क्या यह एक कमजोर परिकल्पना माना जाता है? मैं एक कमजोर शिक्षार्थी और एक कमजोर क्लासिफायर के बीच के संबंध को लेकर उलझन में हूं। क्या दोनों समान हैं या कुछ अंतर है?

Adaboost एल्गोरिथ्म में, T=10। उसका क्या मतलब है? हम क्यों चयन करते हैं T=10?


1
साइट पर आपका स्वागत है, @vrushali। मैंने इसे अंग्रेजी में चिकनी बनाने के लिए संपादित किया; कृपया सुनिश्चित करें कि यह अभी भी कहता है कि आपका क्या मतलब है। इसके अलावा, मुझे यकीन नहीं है कि प्रश्नों का दूसरा सेट (एडोबॉस्ट के बारे में) प्रश्नों के पहले सेट के समान है; उन्हें अलग-अलग धागों में अलग करने के लिए अधिक समझदारी हो सकती है।
गूँग - मोनिका

जवाबों:


35

एक 'कमजोर' शिक्षार्थी (क्लासफ़िश, प्रेडिक्टर, आदि) सिर्फ एक है जो अपेक्षाकृत खराब प्रदर्शन करता है - इसकी सटीकता मौका से ऊपर है, लेकिन सिर्फ मुश्किल से। वहाँ अक्सर है, लेकिन हमेशा नहीं, जोड़ा निहितार्थ है कि यह कम्प्यूटेशनल रूप से सरल है। कमजोर शिक्षार्थी यह भी बताता है कि एल्गोरिथ्म के कई उदाहरणों को "मजबूत" कलाकारों की टुकड़ी बनाने के लिए एक साथ (बूस्टिंग, बैगिंग आदि के माध्यम से) पूल किया जा रहा है।

इसका उल्लेख मूल AdaBoost पेपर फ्रायंड और शेपायर द्वारा किया गया है:

शायद इन अनुप्रयोगों में सबसे आश्चर्यजनक "बूस्टिंग" के लिए एक नए अनुप्रयोग की व्युत्पत्ति है, अर्थात, एक "कमजोर" पीएसी लर्निंग एल्गोरिदम को परिवर्तित करना जो मनमाने ढंग से उच्च सटीकता के साथ यादृच्छिक अनुमान लगाने की तुलना में बस थोड़ा बेहतर प्रदर्शन करता है। - (फ्रंड एंड शेपायर, 1995)

लेकिन मुझे लगता है कि यह वाक्यांश वास्तव में इससे भी पुराना है - मैंने 1980 के दशक से माइकल केर्न्स द्वारा एक शब्द पेपर (?) का उल्लेख किया है।

एक कमजोर शिक्षार्थी का क्लासिक उदाहरण एक निर्णय स्टंप है, एक स्तर का निर्णय वृक्ष (1 आर या वनआर एक और आमतौर पर इस्तेमाल किया जाने वाला कमजोर शिक्षार्थी है; यह काफी हद तक समान है)। एसवीएम को एक 'कमजोर शिक्षार्थी' कहना कुछ अजीब होगा, यहां तक ​​कि ऐसी स्थितियों में भी जब यह खराब प्रदर्शन करता है, लेकिन एक एकल निर्णय लेने वाले को कमजोर शिक्षार्थी कहना भी पूरी तरह से उचित होगा, जब वह आश्चर्यजनक रूप से अच्छा प्रदर्शन करे।


Adaboost एक पुनरावृत्त एल्गोरिथ्म है और आमतौर पर पुनरावृत्तियों या "राउंड" की संख्या को दर्शाता है। एल्गोरिथ्म डेटा पर एक कमजोर शिक्षार्थी को प्रशिक्षित / परीक्षण करके शुरू करता है, प्रत्येक उदाहरण को समान रूप से भारित करता है। जिन उदाहरणों को गलत तरीके से समझा जाता है वे अगले दौर (ओं) के लिए अपने वजन को बढ़ाते हैं, जबकि जो सही तरीके से वर्गीकृत किए जाते हैं उनका वजन कम हो जाता है।T

मुझे यकीन नहीं है कि बारे में कुछ भी जादुई है । 1995 के पेपर में, टी को एक मुफ्त पैरामीटर के रूप में दिया गया है (यानी, आप इसे स्वयं सेट करते हैं)।T=10T


जहाँ तक मुझे पता है एक DecisionStump 1Rule से अलग है। एक निर्णय स्टंप हमेशा एक द्वि-स्तरीय वृक्ष होता है (नाममात्र और संख्यात्मक दोनों विशेषताओं के लिए)। 1 नियम में 2 से अधिक बच्चे (नाममात्र और संख्यात्मक दोनों के लिए) हो सकते हैं और संख्यात्मक विशेषताओं के लिए एक मूल्य से द्विआधारी विभाजन की तुलना में अधिक जटिल परीक्षण हो सकता है। WEKA में भी, 2 अलग-अलग कार्यान्वयन हैं: DecisionStump और OneR।
रापायो

हम्मम ... मुझे लगता है कि तुम सही हो। मूल 1R पेपर कहता है "1-नियम नामक इस पेपर में विशिष्ट प्रकार के नियम, एक गुण के आधार पर किसी वस्तु को वर्गीकृत करने वाले नियम हैं (अर्थात, वे 1-स्तरीय निर्णय वृक्ष हैं।" लेकिन निर्णय पेड़ कर सकते हैं। बहुत सारे तरीकों से लागू किया जा सकता है। मैं इसे स्पष्ट रूप से संपादित करूँगा।
मैट क्रूस

एक मूल OneR कार्यान्वयन भी है: CRR पर OneR पैकेज: CRAN.R-project.org/package=OneR , यहाँ विगनेट है : cran.r-project.org/web/packages/OneR/vignettes/OneR। html (पूर्ण प्रकटीकरण: मैं इस पैकेज का लेखक हूं)।
वॉनजेड

7

कमजोर शिक्षार्थी एक शिक्षार्थी है जो प्रशिक्षण डेटा पर वितरण को हमेशा मौका से बेहतर करेगा, जब वह डेटा को लेबल करने की कोशिश करता है। मौका से बेहतर करने का मतलब है कि हमारे पास हमेशा एक त्रुटि दर है जो 1/2 से कम है।

XY

HxY

यह अंततः कमजोर शिक्षार्थियों को बेहतर बनाता है और उन्हें मजबूत शिक्षार्थियों में परिवर्तित करता है।

अधिक जानकारी के लिए https://youtu.be/zUXJb1hdU0k


सीवी में आपका स्वागत है। चूंकि आप यहां नए हैं, इसलिए आप हमारे दौरे को ले सकते हैं , जिसमें नए उपयोगकर्ताओं के लिए जानकारी है। । यह उत्तर कुछ नया प्रदान नहीं करता है या पिछले उत्तरों में सुधार नहीं करता है। क्या आपको लगता है कि पिछले वाले में कुछ गायब है?
TEG - मोनिका

यह 1/2 से नीचे क्यों होना चाहिए। यदि त्रुटि दर 1/2 से ऊपर है, तो यह कमजोर क्लासिफायरियर होना चाहिए।
कोड पोप

@CodePope, मुझे आपकी बात मिल गई, लेकिन वास्तव में "कमजोर शिक्षार्थी" को औपचारिक रूप से ऐसे शब्दों में परिभाषित किया गया है। मैं किसी भी मॉडल से सहमत हूं, जिसमें 50% से अधिक त्रुटि है, साथ ही खराब और कमजोर भी है। लेकिन वैज्ञानिकों द्वारा परिभाषित औपचारिक परिभाषाओं की बात करें तो एक कमजोर शिक्षार्थी वह है जिसकी त्रुटि 1/2 या 50% से कम है।
अनीश सिंह वालिया

1

कमजोर शिक्षार्थी कमजोर क्लासिफायर, या कमजोर भविष्यवक्ता के समान है। विचार यह है कि आप एक क्लासिफायरियर का उपयोग करते हैं, जो कि, ठीक है ... यह अच्छा नहीं है, लेकिन कम से कम यादृच्छिक से बेहतर है। लाभ यह है कि ओवरफिटिंग में क्लासिफायर मजबूत होगा। बेशक आप सिर्फ एक का उपयोग नहीं करते हैं, लेकिन उनमें से एक बड़ा सेट, प्रत्येक एक यादृच्छिक से थोड़ा बेहतर है। आपके द्वारा उनका चयन / संयोजन करने का सही तरीका, कार्यप्रणाली / एल्गोरिथ्म पर निर्भर करता है, जैसे AdaBoost।

कमज़ोर क्लासिफायर के रूप में व्यवहार में आप किसी एकल फीचर पर एक साधारण सीमा की तरह उपयोग करते हैं। यदि सुविधा थ्रेशोल्ड से ऊपर है तो आप भविष्यवाणी करते हैं कि यह सकारात्मकता से संबंधित है अन्यथा आप तय करते हैं कि यह नकारात्मक से संबंधित है। टी = 10 के बारे में निश्चित नहीं है, क्योंकि कोई संदर्भ नहीं है, लेकिन मैं यह मान सकता हूं कि यह किसी विशेषता को थ्रेसहोल्ड करने पर एक उदाहरण है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.