वे चर / सुविधा चयन क्या हैं जो आप बाइनरी वर्गीकरण के लिए पसंद करते हैं जब सीखने के सेट में टिप्पणियों की तुलना में कई अधिक चर / फ़ीचर होते हैं? यहाँ उद्देश्य यह है कि सबसे अच्छा वर्गीकरण त्रुटि को कम करने वाली सुविधा चयन प्रक्रिया क्या है।
हम कर सकते हैं अंकन को ठीक स्थिरता के लिए: के लिए , चलो टिप्पणियों के सीखने सेट हो समूह से । तो लर्निंग सेट का आकार है। हमने को सुविधाओं की संख्या (यानी फीचर स्पेस का आयाम) निर्धारित किया है। चलो निरूपित का समन्वय वें ।
यदि आप विवरण नहीं दे सकते हैं तो कृपया पूर्ण संदर्भ दें।
EDIT (निरंतर अद्यतन): प्रक्रियाएं नीचे दिए गए उत्तरों में प्रस्तावित हैं
- लालची आगे का चयन बाइनरी वर्गीकरण के लिए परिवर्तनीय चयन प्रक्रिया
- बाइनरी वर्गीकरण के लिए पिछड़े उन्मूलन चर चयन प्रक्रिया
- बाइनरी वर्गीकरण के लिए महानगर स्कैनिंग / MCMC चर चयन प्रक्रिया
- बाइनरी वर्गीकरण के लिए दंडित लॉजिस्टिक प्रतिगमन चर चयन प्रक्रिया
चूंकि यह सामुदायिक विकि है, इसलिए अधिक चर्चा और अद्यतन हो सकता है
मेरे पास एक टिप्पणी है: एक निश्चित अर्थ में, आप सभी एक ऐसी प्रक्रिया देते हैं जो चर के आदेश की अनुमति देती है, लेकिन चर चयन नहीं (आप सुविधाओं की संख्या का चयन करने के तरीके पर काफी स्पष्ट हैं, मुझे लगता है कि आप सभी क्रॉस सत्यापन का उपयोग करते हैं?) क्या आप सुधार कर सकते हैं? इस दिशा में जवाब? (जैसा कि यह सामुदायिक विकी है, आपको चर की संख्या का चयन करने के बारे में जानकारी जोड़ने के लिए उत्तर लिखने की आवश्यकता नहीं है? मैंने इस दिशा में एक प्रश्न खोला है यहाँ बहुत उच्च आयाम में क्रॉस सत्यापन है (संख्या का चयन करने के लिए? बहुत उच्च आयामी वर्गीकरण में प्रयुक्त चर) )