मैं एक मशीन लर्निंग कोर्स का अध्ययन कर रहा हूं और व्याख्यान स्लाइड में वह जानकारी है जो मुझे अनुशंसित पुस्तक के साथ विरोधाभास लगती है।
समस्या निम्न है: तीन वर्गीकरण हैं:
- क्लासिफायर A थ्रेसहोल्ड की निचली श्रेणी में बेहतर प्रदर्शन प्रदान करता है,
- उच्च श्रेणी के थ्रेसहोल्ड में बेहतर प्रदर्शन प्रदान करने वाला क्लासिफायर B
- क्लासिफायर सी जो हमें एक पी-सिक्का फ्लिप करके और दो क्लासिफायरियर से चयन करके मिलता है।
आरओसी वक्र पर देखे गए क्लासिफायर सी का प्रदर्शन क्या होगा?
व्याख्यान में कहा गया है कि सिर्फ इस सिक्के को उछालने से, हमें क्लासिफायर ए और बी के आरओसी वक्र के जादुई " उत्तल पतवार " मिलने वाले हैं।
मुझे यह बात समझ में नहीं आती। बस एक सिक्का उछालने से, हम जानकारी कैसे प्राप्त कर सकते हैं?
व्याख्यान स्लाइड
किताब क्या कहती है
अनुशंसित पुस्तक ( डेटा खनन ... इयान एच। विटन द्वारा, आइब फ्रैंक और मार्क ए। हॉल ) दूसरी ओर कहा गया है कि:
इसे देखने के लिए, विधि A के लिए एक विशेष संभाव्यता कटऑफ चुनें, जो क्रमशः t और fA की सही और झूठी सकारात्मक दर देता है, और पद्धति B के लिए एक और कटऑफ जो tB और fB देता है। यदि आप इन दो योजनाओं का उपयोग यादृच्छिकता पर p और q के साथ करते हैं, जहाँ p + q = 1 है, तो आपको p की सही और झूठी सकारात्मक दरें मिलेंगी। टीए + क्यू। टीबी और पी। एफए + क्यू। अमेरिकन प्लान। यह बिंदु (tA, fA) और (tB, fB) को मिलाने वाली सीधी रेखा पर स्थित एक बिंदु का प्रतिनिधित्व करता है, और p और q भिन्न करके आप इन दो बिंदुओं के बीच की पूरी रेखा का पता लगा सकते हैं।
मेरी समझ में, पुस्तक जो कहती है वह यह है कि वास्तव में जानकारी हासिल करने और उत्तल पतवार तक पहुंचने के लिए हमें बस एक पी-कॉइन को फ़्लिप करने की तुलना में अधिक उन्नत कुछ करने की आवश्यकता है।
AFAIK, सही तरीका (जैसा कि पुस्तक द्वारा सुझाया गया है) निम्नलिखित है:
- हमें क्लासिफायर A के लिए एक इष्टतम सीमा Oa मिलनी चाहिए
- हमें क्लासिफायर बी के लिए एक इष्टतम थ्रेशोल्ड ओबी खोजना चाहिए
C को निम्नानुसार परिभाषित करें:
- यदि टी <ओए, टी के साथ क्लासिफायर ए का उपयोग करें
- यदि t> Ob, t के साथ classifier B का उपयोग करते हैं
- यदि Oa <t <Ob, जहाँ हम Oa और Ob के बीच एक रेखीय संयोजन के रूप में प्रायिकता द्वारा Oa और B को Ob के साथ Classifier A के साथ लेते हैं।
क्या ये सही है? यदि हाँ, तो स्लाइड के सुझाव की तुलना में कुछ महत्वपूर्ण अंतर हैं।
- यह एक साधारण सिक्का नहीं है, लेकिन एक अधिक उन्नत एल्गोरिथ्म है जिसे मैन्युअल रूप से परिभाषित बिंदुओं की आवश्यकता होती है और हम किस क्षेत्र में आते हैं इसके आधार पर चुनता है।
- यह कभी भी ओए और ओब के बीच थ्रेशोल्ड वैल्यू वाले क्लासिफायर ए और बी का उपयोग नहीं करता है।
क्या आप मुझे इस समस्या को समझा सकते हैं और इसे समझने का सही तरीका क्या है , अगर मेरी समझ सही नहीं थी?
क्या होगा अगर हम सिर्फ एक पी-सिक्का फ्लिप करेंगे जैसे स्लाइड का सुझाव होगा? मुझे लगता है कि हम एक आरओसी वक्र प्राप्त करेंगे जो ए और बी के बीच है, लेकिन किसी दिए गए बिंदु पर बेहतर से बेहतर "कभी नहीं"।
जहां तक मैं देख सकता हूं, मुझे वास्तव में समझ नहीं आ रहा है कि स्लाइड कैसे सही हो सकती है। बाएं हाथ की ओर संभाव्य गणना मेरे लिए मायने नहीं रखती है।
अद्यतन: उत्तल पतवार विधि का आविष्कार करने वाले मूल लेखक द्वारा लिखा गया लेख मिला: http://www.bmva.org/bmvc/1998/pdf/p082.pdf