मैं फीचर चयन के बारे में सीख रहा हूं। मैं देख सकता हूं कि मॉडल निर्माण के लिए यह महत्वपूर्ण और उपयोगी क्यों होगा। लेकिन आइए पर्यवेक्षित शिक्षण (वर्गीकरण) कार्यों पर ध्यान दें। वर्गीकरण कार्यों के लिए फीचर चयन महत्वपूर्ण क्यों है?
मैं देख रहा हूँ कि बहुत सारे साहित्य फीचर चयन और पर्यवेक्षित शिक्षण के लिए इसके उपयोग के बारे में लिखे गए हैं, लेकिन यह मुझे पहेली बना देता है। फीचर का चयन पहचान के बारे में है कि कौन सी सुविधाओं को फेंकना है। सहज रूप से, कुछ सुविधाओं को फेंकना आत्म-पराजय लगता है: यह जानकारी को दूर फेंक रहा है। ऐसा लगता है कि जानकारी फेंकने में मदद नहीं करनी चाहिए।
और अगर कुछ सुविधाओं को हटाने से भी मदद मिलती है, अगर हम कुछ सुविधाओं को फेंक रहे हैं और फिर एक पर्यवेक्षित शिक्षण एल्गोरिथ्म में बाकी को खिला रहे हैं, तो हमें खुद को ऐसा करने की आवश्यकता क्यों है, बजाय पर्यवेक्षित सीखने के एल्गोरिथम को संभालने की अनुमति देने की? यदि कुछ सुविधा सहायक नहीं है, तो क्या किसी भी सभ्य पर्यवेक्षित शिक्षण एल्गोरिथ्म को स्पष्ट रूप से पता नहीं लगाना चाहिए और उस मॉडल का उपयोग करना सीखना चाहिए जो उस सुविधा का उपयोग नहीं करता है?
इसलिए सहज रूप से मैंने उम्मीद की होगी कि फीचर का चयन एक व्यर्थ अभ्यास होगा जो कभी मदद नहीं करता है और कभी भी चोट पहुंचा सकता है। लेकिन यह तथ्य कि यह बहुत व्यापक रूप से उपयोग किया जाता है और इसके बारे में लिखा जाता है, मुझे संदेह है कि मेरी अंतर्ज्ञान दोषपूर्ण है। क्या कोई भी अंतर्ज्ञान प्रदान कर सकता है कि सुविधा का चयन उपयोगी और महत्वपूर्ण क्यों है, जब पर्यवेक्षित शिक्षण किया जाता है? यह मशीन सीखने के प्रदर्शन में सुधार क्यों करता है? क्या यह निर्भर करता है कि मैं किस क्लासिफायर का उपयोग करता हूं?