मैं वर्तमान में निम्नलिखित कोड के साथ स्किकिट सीख रहा हूं:
clf = svm.SVC(C=1.0, tol=1e-10, cache_size=600, kernel='rbf', gamma=0.0,
class_weight='auto')
और फिर 7 अलग-अलग लेबल वाले डेटा के सेट के लिए फिट और भविष्यवाणी करें। मुझे एक अजीब आउटपुट मिला। कोई बात नहीं जो मान्यता तकनीक को पार करता है मैं सत्यापन सेट पर पूर्वानुमानित लेबल का उपयोग करता हूं वह हमेशा लेबल 7 होने वाला है।
मैं पूर्ण डिफ़ॉल्ट एक ( svm.SVC()
) सहित कुछ अन्य मापदंडों का प्रयास करता हूं, लेकिन जब तक मैं जिस कर्नेल विधि का उपयोग करता हूं वह rbf
इसके बजाय है poly
या linear
यह सिर्फ काम नहीं करेगा, जबकि यह वास्तव में poly
और के लिए ठीक काम करता है linear
।
इसके अलावा मैंने पहले ही सत्यापन डेटा के बजाय ट्रेन डेटा पर भविष्यवाणी करने की कोशिश की है और यह पूरी तरह से फिट है।
क्या किसी को पहले इस तरह की समस्या दिखाई देती है और पता है कि यहां क्या चल रहा है?
मैं अपने वर्ग वितरण पर कभी विस्तार से नहीं देखता, लेकिन मुझे पता है कि यह लगभग ३०% होना चाहिए, at, १४% ४ हैं।
मैं एक मैनुअल 1-बनाम-बाकी कार्यान्वयन का भी प्रयास करता हूं और यह अभी भी मददगार नहीं है।