सामान्य डेटा-आधारित चर चयन प्रक्रियाएं (उदाहरण के लिए, आगे, पिछड़े, स्टेपवाइज, सभी सबसेट) अवांछनीय गुणों वाले मॉडल का उत्पादन करते हैं, जिनमें शामिल हैं:
- गुणांक शून्य से दूर पक्षपाती।
- मानक त्रुटियां जो बहुत छोटी हैं और आत्मविश्वास अंतराल जो बहुत संकीर्ण हैं।
- परीक्षण के आँकड़े और पी-मान जिनका विज्ञापित अर्थ नहीं है।
- मॉडल फिट के अनुमान जो अत्यधिक आशावादी हैं।
- शामिल शब्द जो अर्थहीन हो सकते हैं (जैसे, निचले क्रम की शर्तों का बहिष्करण)।
फिर भी, चर चयन प्रक्रिया बनी रहती है। चर चयन के साथ समस्याओं को देखते हुए, ये प्रक्रियाएं क्यों आवश्यक हैं? उनके उपयोग को क्या प्रेरित करता है?
चर्चा शुरू करने के लिए कुछ प्रस्ताव ...।
- व्याख्यात्मक प्रतिगमन गुणांक की इच्छा? (कई आईवीएस के साथ एक मॉडल में गुमराह?)
- अप्रासंगिक चर द्वारा शुरू किए गए विचरण को समाप्त करें?
- स्वतंत्र चर के बीच अनावश्यक सहसंयोजक / अतिरेक को हटा दें?
- पैरामीटर अनुमानों की संख्या कम करें (शक्ति, नमूना आकार के मुद्दे)
क्या अन्य हैं? क्या चर चयन तकनीकों द्वारा समस्याओं को संबोधित किया जाता है जो चर चयन प्रक्रियाओं की समस्याओं की तुलना में कम या ज्यादा महत्वपूर्ण है? इनका उपयोग कब किया जाना चाहिए? इनका उपयोग कब नहीं किया जाना चाहिए?