क्या SVM असंतुलित डेटासेट को संभालता है? असंतुलित डेटासेट को संभालने वाला कोई भी पैरामीटर (जैसे C, या misclassification लागत) है?
क्या SVM असंतुलित डेटासेट को संभालता है? असंतुलित डेटासेट को संभालने वाला कोई भी पैरामीटर (जैसे C, या misclassification लागत) है?
जवाबों:
असंतुलित डेटा सेट के लिए हम आम तौर पर प्रति वर्ग गर्भपात दंड को बदलते हैं। इसे क्लास-वेटेड एसवीएम कहा जाता है, जो निम्नलिखित को कम करता है:
वैल्यू है, जबकि अब हमारे पास 2 है। अल्पसंख्यक वर्ग के लिए गर्भपात दंड को बहुसंख्यक वर्ग की तुलना में बड़ा चुना जाता है।
इस दृष्टिकोण को काफी पहले पेश किया गया था, यह 1997 के कागज में उदाहरण के लिए उल्लिखित है:
एडगर ओसुना, रॉबर्ट फ्रंड और फेडेरिको गिरोसी। समर्थन वेक्टर मशीनें: प्रशिक्षण और अनुप्रयोग। तकनीकी रिपोर्ट AIM-1602, 1997. ( पीडीएफ )
यह पूरी तरह से एक मानक एसवीएम के साथ प्रशिक्षण के बराबर है प्रशिक्षण सेट में हर सकारात्मक दो बार शामिल करने के बाद।
एसवीएम असंतुलित वर्ग आवृत्तियों के साथ डेटासेट से निपटने में सक्षम हैं। कई कार्यान्वयन आपको सकारात्मक और नकारात्मक वर्गों के लिए सुस्त दंड (सी) के लिए एक अलग मूल्य रखने की अनुमति देते हैं (जो वर्ग आवृत्तियों को बदलने के लिए समान रूप से बराबर है)। मैं एक परीक्षण सेट पर सामान्यीकरण प्रदर्शन को अधिकतम करने के लिए इन मापदंडों के मूल्यों को निर्धारित करने की सिफारिश करूंगा जहां कक्षा की आवृत्ति वे हैं जो आप परिचालन उपयोग में देखने की उम्मीद करते हैं।
मैं उन कई लोगों में से एक था, जिन्होंने इस पर पत्र लिखे, यहाँ मेरा है , मैं देखूंगा कि क्या मुझे हाल ही में कुछ और मिल सकता है / बेहतर। वर्पोउलोस, कैम्पबेल और क्रिस्टियानिनी (1999) आज़माएं ।