मल्टी-क्लास बूस्टेड क्लासिफायर को कैलिब्रेट करना


19

मैंने अलेक्जेंड्रू निकुलेस्कु-मिज़िल और रिच कारूआना के पेपर " बूस्टिंग से कैलिब्रेटेड प्रोबेबिलिटीज प्राप्त करना " और इस धागे में चर्चा को पढ़ा है । हालाँकि, मुझे अभी भी अपने मल्टी-क्लास बूस्टिंग क्लासिफ़ायर (निर्णय स्टंप के साथ कोमल-बूस्ट) के उत्पादन को जांचने के लिए लॉजिस्टिक या प्लाट की स्केलिंग को समझने और लागू करने में परेशानी हो रही है ।

मैं सामान्यीकृत रैखिक मॉडल से कुछ हद तक परिचित हूं, और मुझे लगता है कि मैं समझता हूं कि बाइनरी केस में लॉजिस्टिक और प्लाट के अंशांकन तरीके कैसे काम करते हैं, लेकिन मुझे यकीन नहीं है कि मैं कागज में वर्णित विधि को बहु-श्रेणी के मामले में कैसे बढ़ाऊं।

मैं जिस क्लासिफायर का उपयोग कर रहा हूं, वह निम्नलिखित है:

  • = वोट की संख्या उस वर्ग के लिए वर्गीकारक डाले जे नमूने के लिए मैं कि वर्गीकृत किया जा रहा हैमैंजेजेमैं
  • = अनुमानित वर्गyमैं

इस बिंदु पर मेरे पास निम्नलिखित प्रश्न हैं:

Q1: क्या मुझे संभावनाओं का अनुमान लगाने के लिए एक बहुराष्ट्रीय लॉगिन का उपयोग करने की आवश्यकता है? या क्या मैं अभी भी लॉजिस्टिक रिग्रेशन के साथ ऐसा कर सकता हूं (जैसे 1-बनाम-सभी फैशन में)?

Q2: मुझे बहु-स्तरीय मामले के लिए मध्यवर्ती लक्ष्य चर (जैसे प्लॉट के स्केलिंग में) को कैसे परिभाषित करना चाहिए?

Q3: मुझे लगता है कि यह पूछने के लिए बहुत कुछ हो सकता है, लेकिन क्या कोई इस समस्या के लिए छद्म कोड को स्केच करने के लिए तैयार होगा? (अधिक व्यावहारिक स्तर पर, मैं मतलाब के समाधान में दिलचस्पी रखता हूं)।


1
बड़ा सवाल। मुझे आश्चर्य है कि आप अंशांकन का निर्माण कैसे करें, भले ही आप योजना के बाकी हिस्सों में 1 का उपयोग करें। यदि आप 1 मॉडल को बनाम बाकी (और के क्लास हैं) का उपयोग करते हैं, तो क्या आपको किसी तरह से उन्हें सामान्य बनाना चाहिए, ताकि वे 1 को योग करें (उदाहरण के लिए सभी कैलिब्रेटेड प्रायिकता को सभी के योग से विभाजित करें)?
B_Miner

जवाबों:


9

यह मेरे लिए व्यावहारिक रुचि का विषय है और इसलिए मैंने थोड़ा शोध किया है। यहां दो लेखक हैं जो इन मामलों में एक संदर्भ के रूप में सूचीबद्ध हैं।

  1. सटीक मल्टीस्केल्स संभावना अनुमानों में क्लासिफायर स्कोर को बदलना
  2. प्रायिकता अनुमानों को युग्मित करके बाइनरी को कम करना

यहां दी गई तकनीक का उल्लेख बहुसंस्कृति समस्या को एक बाइनरी एक (जैसे एक बनाम बाकी, एकेए एक बनाम सभी) को कम करने के लिए है, बाइनरी स्कोर / संभावनाओं को स्पष्ट करने के लिए प्लैट (अधिमानतः परीक्षण सेट का उपयोग करके) जैसी तकनीक का उपयोग करें फिर कागजात में चर्चा के रूप में एक तकनीक का उपयोग करके इन्हें मिलाएं (एक "युग्मन" की एक Hastie एट अल प्रक्रिया का एक विस्तार है)। पहले लिंक में, द्विआधारी संभावनाओं को सामान्य करने के लिए सबसे अच्छे परिणाम पाए गए थे कि वे 1 को योग करते हैं।

मैं अन्य सलाह सुनना पसंद करूंगा और यदि इनमें से किसी भी tnnhiqes को आर में आरोपित किया गया है।


उत्तर में वर्णित लिंक पुराने हैं। नवीनतम लिंक हैं: citeseerx.ist.psu.edu/viewdoc/… citeseerx.ist.psu.edu/viewdoc/…
चंद्र

यहाँ पर क्रॉस का संदर्भ है चूहे ।stackexchange.com
questions/

इस जवाब को गूंज रहा है। इसने मुझे कुछ समय के लिए रोक दिया लेकिन ज़द्रोज़नी और एल्कान द्वारा किया गया पेपर उपयोगी साबित हुआ।
सिंगोलोलो
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.