मुझे लगता है कि यह दृष्टिकोण गलत है, लेकिन शायद यह अधिक उपयोगी होगा यदि मैं समझाता हूं कि क्यों। बड़ी संख्या में चर के बारे में कुछ जानकारी दी गई सर्वश्रेष्ठ मॉडल जानना चाहते हैं जो काफी समझ में आता है। इसके अलावा, यह एक ऐसी स्थिति है जिसमें लोग खुद को नियमित रूप से खोजने लगते हैं। इसके अलावा, प्रतिगमन पर कई पाठ्यपुस्तकें (और पाठ्यक्रम) स्टेप वाइज चयन विधियों को कवर करती हैं, जिसका अर्थ है कि उन्हें वैध होना चाहिए। दुर्भाग्य से, वे नहीं हैं, और इस स्थिति और लक्ष्य की जोड़ी को सफलतापूर्वक नेविगेट करने में काफी मुश्किल है। निम्नलिखित स्वचालित स्टेपवाइज मॉडल चयन प्रक्रियाओं (फ्रैंक हार्ले के लिए जिम्मेदार और यहां से कॉपी की गई ) के साथ समस्याओं की एक सूची है :
- यह आर-स्क्वैयर मानों को पैदावार करता है जो उच्च पक्षपाती हैं।
- प्रिंटआउट पर प्रत्येक चर के बगल में उद्धृत एफ और ची-चुकता परीक्षणों का दावा किया गया वितरण नहीं है।
- विधि प्रभाव और अनुमानित मूल्यों के लिए आत्मविश्वास अंतराल पैदा करती है जो झूठी संकीर्ण हैं; ऑल्टमैन और एंडरसन (1989) देखें।
- यह पी-वैल्यू देता है जिसका उचित अर्थ नहीं है, और उनके लिए उचित सुधार एक कठिन समस्या है।
- यह पक्षपाती प्रतिगमन गुणांक देता है जिसमें संकोचन की आवश्यकता होती है (शेष चर के लिए गुणांक बहुत अधिक है, देखें तिब्शीरानी [1996])।
- यह कोलिनियरिटी की उपस्थिति में गंभीर समस्याएं हैं।
- यह विधियों (उदाहरण के लिए, नेस्टेड मॉडल के लिए एफ परीक्षण) पर आधारित है, जिनका उपयोग निर्धारित किए गए परिकल्पनाओं का परीक्षण करने के लिए किया गया था।
- नमूना आकार बढ़ाने से बहुत मदद नहीं मिलती है; डर्कसेन और केसेलमैन (1992) देखें।
- यह हमें समस्या के बारे में नहीं सोचने की अनुमति देता है।
- इसमें बहुत सारे कागज का उपयोग होता है।
सवाल यह है कि इन प्रक्रियाओं के बारे में इतना बुरा क्या है / ये समस्याएं क्यों होती हैं? ज्यादातर लोग हैं जो एक बुनियादी प्रतिगमन पाठ्यक्रम ले लिया है की अवधारणा से परिचित हैं मतलब के लिए प्रतिगमन , तो यह है कि मैं क्या इन मुद्दों को समझाने के लिए इस्तेमाल करते हैं। (हालांकि यह पहली बार में विषय से अलग लग सकता है, मेरे साथ सहन करें, मैं वादा करता हूं कि यह प्रासंगिक है।)
ट्रायआउट्स के पहले दिन एक हाई स्कूल ट्रैक कोच की कल्पना करें। तीस बच्चे दिखाते हैं। इन बच्चों के पास कुछ अंतर्निहित आंतरिक क्षमता होती है, जिसमें न तो कोच होता है, न ही किसी और की सीधी पहुंच होती है। नतीजतन, कोच केवल वही काम करता है जो वह कर सकता है, जो उन सभी को 100 मीटर की दूरी पर चलाता है। समय निश्चित रूप से उनकी आंतरिक क्षमता का एक उपाय है और इस तरह से लिया जाता है। हालांकि, वे संभाव्य हैं; किसी का कितना अच्छा अनुपात होता है, इसका कुछ अनुपात उनकी वास्तविक क्षमता पर आधारित होता है और कुछ अनुपात यादृच्छिक होता है। कल्पना करें कि वास्तविक स्थिति निम्नलिखित है:
set.seed(59)
intrinsic_ability = runif(30, min=9, max=10)
time = 31 - 2*intrinsic_ability + rnorm(30, mean=0, sd=.5)
पहली दौड़ के परिणाम कोच की टिप्पणियों के साथ निम्नलिखित आंकड़े में प्रदर्शित किए गए हैं।
ध्यान दें कि बच्चों को उनकी दौड़ के समय के द्वारा विभाजित करना उनकी आंतरिक क्षमता पर ओवरलैप होता है - यह तथ्य महत्वपूर्ण है। कुछ की प्रशंसा करने के बाद, और कुछ अन्य लोगों पर चिल्लाते हैं (जैसा कि कोच करते हैं), उसने उन्हें फिर से चलाया। यहां कोच की प्रतिक्रियाओं के साथ दूसरी दौड़ के परिणाम हैं (ऊपर एक ही मॉडल से सिम्युलेटेड):
ध्यान दें कि उनकी आंतरिक क्षमता समान है, लेकिन पहली दौड़ के सापेक्ष समय का उछाल आया। कोच के दृष्टिकोण से, वे जो सुधार करने के लिए चिल्लाते थे, और जिनकी वह प्रशंसा करते थे, वे इससे भी बदतर थे (मैंने विकी पृष्ठ पर सूचीबद्ध काहमन उद्धरण से इस ठोस उदाहरण को अनुकूलित किया था), हालांकि वास्तव में इस आशय का प्रतिगमन एक सरल गणितीय है इस तथ्य का परिणाम है कि कोच एक माप के आधार पर टीम के लिए एथलीटों का चयन कर रहा है जो आंशिक रूप से यादृच्छिक है।
अब, स्वचालित (जैसे, स्टेप वाइज) मॉडल चयन तकनीकों के साथ क्या करना है? एक ही डेटासेट के आधार पर किसी मॉडल को विकसित करना और उसकी पुष्टि करना कभी-कभी डेटा ड्रेजिंग कहलाता है। यद्यपि चर के बीच कुछ अंतर्निहित संबंध हैं, और मजबूत संबंधों से मजबूत स्कोर (जैसे, उच्च टी-आँकड़े) प्राप्त करने की उम्मीद की जाती है, ये यादृच्छिक चर हैं और महसूस किए गए मानों में त्रुटि होती है। इस प्रकार, जब आप उच्च या (कम) साकार मूल्यों के आधार पर चर का चयन करते हैं, तो वे अपने अंतर्निहित वास्तविक मूल्य, त्रुटि या दोनों के कारण ऐसे हो सकते हैं। यदि आप इस तरीके से आगे बढ़ते हैं, तो आप उतने ही आश्चर्यचकित होंगे जितना कोच दूसरी दौड़ के बाद। यह सच है कि क्या आप उच्च टी-आँकड़े, या कम इंटरकोर्सल होने के आधार पर चर का चयन करते हैं। सही है, AIC का उपयोग p- मानों के उपयोग से बेहतर है, क्योंकि यह मॉडल को जटिलता के लिए दंडित करता है, लेकिन AIC अपने आप में एक यादृच्छिक चर है (यदि आप कई बार एक अध्ययन चलाते हैं और उसी मॉडल को फिट करते हैं, तो AIC लगभग उसी तरह उछल जाएगा बाकि सब कुछ)। दुर्भाग्य से,
मुझे आशा है कि यह मददगार है।