मैं एक वर्गीकरण समस्या से कैसे संपर्क कर सकता हूँ जहाँ वर्गों में से एक को 'दूसरों में से नहीं' द्वारा परिभाषित किया गया है


9

मान लीजिए कि मुझे तीन वर्गों में दिलचस्पी है c1, c2, c3। लेकिन मेरे डेटासेट में वास्तव में कई और वास्तविक कक्षाएं हैं(cj)j=4n

स्पष्ट उत्तर एक नई कक्षा को परिभाषित करना है c^4 यह सभी वर्गों को संदर्भित करता है cj, j>3 लेकिन मुझे संदेह है कि नमूनों में से यह एक अच्छा विचार नहीं है c^4 दुर्लभ होगा और एक दूसरे के समान नहीं होगा।

कल्पना करने के लिए कि मैं क्या कहने की कोशिश कर रहा हूं, मान लें कि मेरे पास निम्नलिखित दो चर स्थान और कक्षाएं हैं c1, c2, c3, c^4=j=4ncjक्रमशः लाल, तिल, हरे और काले रंग में दर्शाया गया है। यह है कि मुझे संदेह है कि मेरा डेटा कैसा दिखेगा।

यहाँ छवि विवरण दर्ज करें

क्या इस समस्या से निपटने का कोई मानक तरीका है? सबसे कुशल क्लासिफायरियर और क्या होगा?


एक बनाम बाकी का उपयोग करने पर विचार करें en.wikipedia.org/wiki/Multiclass_classification#One-vs.-rest
DaL

1
आप पॉजिटिव-अनलिस्टेड मॉडल्स को एक्सप्लोर करना चाह सकते हैं । यह एक ऐसी ही समस्या की तरह दिखता है, सिवाय इसके कि यह बहुस्तरीय है, अधिकांश पु समस्याओं के रूप में द्विआधारी नहीं है।
रिकार्डो क्रूज़

जवाबों:


4

मैं एक दो कदम दृष्टिकोण का उपयोग करेगा, के विचार का उपयोग कर c4^ कक्षा का उल्लेख किया।

पहले चरण में, यह तय करने के लिए कि क्या कोई नमूना वर्ग का है, बाइनरी क्लासिफायरफ़ायर (संपूर्ण डेटासेट पर प्रशिक्षित) का उपयोग करें c4^(यानी किसी गैर-दिलचस्प वर्ग में)। इसके लिए, चरण आप बाहरी तरीकों का भी पता लगा सकते हैं , यदि "दिलचस्प" कक्षाओं में संबंधित नमूने बाकी की तुलना में बहुत अलग हैं।

यदि परिणाम नकारात्मक है, तो अगले चरण पर जाएं, एक नया क्लासिफायरर केवल कक्षाओं में संबंधित नमूनों पर प्रशिक्षित होता है c1,c2,c3 और उस भविष्यवाणी को अपने अंतिम एक के रूप में उपयोग करें।

मुझे लगता है कि पहले चरण के रूप में एक साधारण क्लस्टरिंग दृष्टिकोण का उपयोग करनाcentj=xiD:yi=jxixiD:yi=j1 प्रत्येक के लिए c1,c2,c3,c4^), अभी भी उपयोगी होगा।


बोगस सुझाव बहुत अच्छा है यदि आपके पास बहुत अधिक वर्ग ओवरलैप नहीं है। अन्यथा, मल्टी-लेबल मॉडल के साथ जाएं।
रिकार्डो क्रूज़

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.