फीचर इंजीनियरिंग के बारे में मेरा एक व्यावहारिक सवाल है ... कहते हैं कि मैं लॉजिस्टिक रिग्रेशन का उपयोग करके घर की कीमतों की भविष्यवाणी करना चाहता हूं और ज़िप कोड सहित सुविधाओं का एक गुच्छा इस्तेमाल किया है। फिर फीचर महत्व की जाँच करके, मुझे पता है कि ज़िप एक बहुत अच्छी सुविधा है, इसलिए मैंने ज़िप के आधार पर कुछ और सुविधाएँ जोड़ने का फैसला किया - उदाहरण के लिए, मैं जनगणना ब्यूरो में जाता हूं और औसत आय, जनसंख्या, स्कूलों की संख्या और संख्या प्राप्त करता हूं प्रत्येक ज़िप के अस्पतालों। इन चार नई विशेषताओं के साथ, मुझे अब मॉडल का प्रदर्शन बेहतर लगता है। इसलिए मैं और भी अधिक जिप-संबंधी विशेषताएं जोड़ता हूं ... और यह चक्र आगे और आगे बढ़ता है। आखिरकार इन ज़िप-संबंधित सुविधाओं में मॉडल का प्रभुत्व होगा, है ना?
मेरे सवाल:
- क्या यह पहली बार में ऐसा करने का मतलब है?
- यदि हाँ, तो मुझे कैसे पता चलेगा कि इस चक्र को रोकने का अच्छा समय कब है?
- यदि नहीं, तो क्यों नहीं?