मैंने कई विशेषताओं (1000 से अधिक) के साथ सबसे अधिक 150 उदाहरणों (प्रशिक्षण और परीक्षण में विभाजित) में एक डेटासेट युक्त है। मुझे क्लासिफायर की तुलना करने और चयन के तरीकों को चुनने की आवश्यकता है जो डेटा पर अच्छा प्रदर्शन करते हैं। इसलिए, मैं तीन वर्गीकरण विधियों (J48, NB, SVM) और 2 सुविधा चयन विधियों (CFS, WrapperSubset) का उपयोग विभिन्न खोज विधियों (लालची, बेस्टफ्रस्ट) के साथ कर रहा हूं।
तुलना करते समय, मैं प्रशिक्षण सटीकता (5 गुना क्रॉस-फोल्डिंग) और परीक्षण सटीकता देख रहा हूं।
यहाँ J48 और CFS-BestFirst के परिणामों में से एक है:
{"सटीकताप्रदर्शन": 95.83, "सटीकताTest": 98.21}
कई परिणाम इस तरह हैं, और एसवीएम पर कई परिणाम हैं जो इंगित करते हैं कि परीक्षण सटीकता प्रशिक्षण (प्रशिक्षण: 60%, परीक्षण: 98%) की तुलना में बहुत अधिक है
मैं इस प्रकार के परिणामों की सार्थक व्याख्या कैसे कर सकता हूं? अगर यह कम था, तो मैं कहूंगा कि यह बहुत अधिक है। क्या इस मामले में सभी परिणामों को देखकर पूर्वाग्रह और विचरण के बारे में कुछ कहा जाना है? मैं इस वर्गीकरण को सार्थक बनाने के लिए क्या कर सकता हूं, जैसे प्रशिक्षण और परीक्षण सेटों का पुन: चयन करना या सभी डेटा पर क्रॉस-मान्यता का उपयोग करना।
मेरे पास 73 प्रशिक्षण और 58 परीक्षण उदाहरण हैं। कुछ जवाबों में यह जानकारी नहीं थी जब वे पोस्ट किए गए थे।