मैं अपने डेटासेट पर सपोर्ट वेक्टर मशीनों (एसवीएम) का उपयोग करने का प्रयास करना चाहता हूं। इससे पहले कि मैं इस समस्या का प्रयास करूँ, मुझे चेतावनी दी गई थी कि एसवीएम बेहद असंतुलित आंकड़ों पर अच्छा प्रदर्शन नहीं करते हैं। मेरे मामले में, मेरे पास 95-98% 0 और 2-5% 1 के रूप में हो सकता है।
मैंने उन संसाधनों को खोजने की कोशिश की जो विरल / असंतुलित डेटा पर एसवीएम का उपयोग करने के बारे में बात करते थे, लेकिन सभी मुझे मिल सकते थे 'स्पार्स वीवीएम' (जो थोड़ी मात्रा में समर्थन वैक्टर का उपयोग करते हैं)।
मैं उम्मीद कर रहा था कि कोई व्यक्ति संक्षेप में समझा सकता है:
- इस तरह के डेटासेट के साथ SVM को कितनी अच्छी उम्मीद होगी
- जो, यदि कोई हो, संशोधनों को एसवीएम एल्गोरिथ्म में किया जाना चाहिए
- कौन से संसाधन / कागजात इस पर चर्चा करते हैं