जब कोई AdaBoost का उपयोग करना चाहेगा?


14

जैसा कि मैंने AdaBoost क्लासिफायर के बारे में बार-बार काम पर बताया है, मैं चाहता था कि यह कैसे काम करता है और जब कोई इसका उपयोग करना चाहता है, तो उसे बेहतर अनुभव मिल सकता है। मैं आगे बढ़ चुका हूं और इस पर बहुत सारे कागजात और ट्यूटोरियल पढ़े हैं जो मुझे Google पर मिले, लेकिन क्लासिफायर के कुछ पहलू हैं जिन्हें समझने में मुझे अब भी परेशानी हो रही है:

  1. अधिकांश ट्यूटोरियल मैंने कई क्लासिफायर के सबसे अच्छे भारित संयोजन को खोजने के रूप में AdaBoost की बात की है। मुझे यह अर्थपूर्ण लग रहा है। क्या मतलब नहीं है कार्यान्वयन (यानी MALLET) जहां AdaBoost केवल एक कमजोर शिक्षार्थी को स्वीकार करने लगता है। इसका कोई मतलब कैसे बनता है? यदि AdaBoost को केवल एक ही क्लासिफायर प्रदान किया जाता है, तो क्या यह 1 के वजन के साथ वापस उसी क्लासिफायर में वापस नहीं आना चाहिए? यह पहली कक्षा से नए क्लासिफायर का उत्पादन कैसे करता है?

  2. जब कोई वास्तव में AdaBoost का उपयोग करना चाहेगा? मैंने पढ़ा है कि यह सर्वश्रेष्ठ आउट-ऑफ-द-बॉक्स क्लासीफायर में से एक माना जाता है, लेकिन जब मैं एक MaxEnt क्लासिफायर को बढ़ाने की कोशिश करता हूं तो मुझे 70% + के साथ एफ-स्कोर मिल रहा था, AdaBoost इसकी हत्या करता है और मुझे f देता है। 15% की तरह बहुत उच्च रिकॉल और इसके बजाय बहुत कम परिशुद्धता के साथ स्कोर। इसलिए अब मैं उलझन में हूं। मैं कब AdaBoost का उपयोग करना चाहूंगा? यदि संभव हो तो मैं कड़ाई से सांख्यिकीय जवाब के बजाय एक सहज ज्ञान युक्त खोज कर रहा हूं।

जवाबों:


11

Adaboost विभिन्न मानकों के साथ एक ही क्लासिफायरियर के कई उदाहरणों का उपयोग कर सकता है। इस प्रकार, पहले से तैयार रैखिक क्लासिफायरियर को नॉनलाइनियर क्लासिफायर में जोड़ा जा सकता है। या, AdaBoost के रूप में लोग इसे रखना पसंद करते हैं, कई कमजोर शिक्षार्थी एक मजबूत शिक्षार्थी बना सकते हैं। एक अच्छी तस्वीर यहाँ मिल सकती है , तल पर।

असल में, यह किसी भी अन्य लर्निंग एल्गोरिदम के साथ जाता है: कुछ डेटासेट पर यह काम करता है, कुछ पर यह नहीं करता है। यकीन है कि वहाँ डेटासेट हैं, जहां यह excels। और शायद आपने अभी तक सही कमजोर शिक्षार्थी को नहीं चुना है। क्या आपने लॉजिस्टिक रिग्रेशन की कोशिश की? क्या आपने देखा कि शिक्षार्थियों को जोड़ने के दौरान निर्णय की सीमाएँ कैसे विकसित होती हैं? शायद आप बता सकते हैं कि क्या गलत हो रहा है।


(+1)। अतिरिक्त टिप्पणी: यहां तक ​​कि कमजोर शिक्षार्थियों के मापदंडों में अंतर नहीं करने के लिए, व्यवहार (यानी वे जो भविष्यवाणी करते हैं) जब डेटासेट की संरचना (जैसा कि बूस्टिंग में किया जाता है) बदलता है।
स्टीफ़न

MaxEnt लॉजिस्टिक रिग्रेशन है। कल्पना करना कि निर्णय सीमाएँ कैसे विकसित होती हैं, वास्तव में काफी उपयोगी होंगी। ऐसा करने के बारे में कोई कैसे जा सकता है? इसके अलावा, मुझे अभी भी समझ में नहीं आया है कि कैसे AdaBoost अभी भी काम करता है जब इसे केवल एक फीचर सेट और एक क्लासिफायर टाइप (MALLI में) दिया जाता है। मेरे लिए, यह पूरी तरह से सहज ज्ञान युक्त लगता है।
यूलियाप्रो

बस अपने डाटासेट की साजिश है। अतिरिक्त, एक ग्रिड की साजिश करें जहां आप प्रत्येक बिंदु के लिए एक रंग चुनते हैं कि यह आपके सिस्टम द्वारा कैसे वर्गीकृत किया जा रहा है। यह केवल 2 डी के लिए अच्छा काम करता है, मुझे लगता है। आप अभी भी सबसे महत्वपूर्ण कुल्हाड़ियों या कुछ और की साजिश कर सकते हैं। यदि आपके पास केवल एक फीचर सेट और एक क्लासिफायरियर है, तो यह केवल एक क्लासिफायरियर तक घटता है। मैं इस धारणा के तहत था, कि अधिकतम एन्ट्रापी एक प्रतिमान थी न कि एक ठोस वर्गीकरणकर्ता। वैसे भी।
bayerj
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.