मनोविज्ञान और अन्य क्षेत्रों में स्टेप वाइज रिग्रेशन का एक रूप अक्सर नियोजित होता है जिसमें निम्नलिखित शामिल होते हैं:
- शेष भविष्यवक्ताओं को देखें (पहले मॉडल में कोई भी नहीं हैं) और सबसे बड़े आर-वर्ग परिवर्तन के परिणामस्वरूप भविष्यवक्ता की पहचान करें;
- यदि आर-स्क्वायर परिवर्तन का पी-मूल्य अल्फा (आमतौर पर .05) से कम है, तो उस भविष्यवक्ता को शामिल करें और चरण 1 पर वापस जाएं, अन्यथा रोकें।
उदाहरण के लिए, SPSS में यह प्रक्रिया देखें ।
प्रक्रिया नियमित रूप से कारणों की एक विस्तृत श्रृंखला के लिए समालोचनीय है ( संदर्भ के साथ स्टाटा वेबसाइट पर इस चर्चा को देखें )।
विशेष रूप से, स्टैटा वेबसाइट फ्रैंक हरेल द्वारा कई टिप्पणियों का सार प्रस्तुत करती है। मुझे दावे में दिलचस्पी है:
[स्टेप वाइज रिग्रेशन] आर-स्क्वैयर वैल्यूज की पैदावार करता है जो बुरी तरह से उच्च पक्षपाती हैं।
विशेष रूप से, मेरे कुछ वर्तमान शोध अनुमान लगाने पर केंद्रित हैं जनसंख्या आर-वर्ग का । जनसंख्या आर-वर्ग द्वारा मैं जनसंख्या में उत्पन्न होने वाले जनसंख्या डेटा समीकरण द्वारा बताए गए विचरण के प्रतिशत का उल्लेख करता हूं। मेरे द्वारा समीक्षा की जा रही मौजूदा साहित्य में से अधिकांश ने स्टेपवाइज रिग्रेशन प्रक्रियाओं का उपयोग किया है और मैं जानना चाहता हूं कि प्रदान किए गए अनुमान पक्षपाती हैं और यदि ऐसा है तो कितना। विशेष रूप से, एक सामान्य अध्ययन में 30 भविष्यवक्ता, n = 200, अल्फा प्रवेश .05, और आर-वर्ग अनुमान लगभग .50 होगा।
मुझे क्या पता:
- समान रूप से, गैर-शून्य गुणांक वाला कोई भी भविष्यवाण एक सांख्यिकीय रूप से महत्वपूर्ण भविष्यवक्ता होगा, और आर-स्क्वायर समायोजित आर-स्क्वायर के बराबर होगा। इस प्रकार, asymptotically stepwise प्रतिगमन को सही प्रतिगमन समीकरण और वास्तविक जनसंख्या आर-वर्ग का अनुमान लगाना चाहिए।
- छोटे नमूना आकारों के साथ, कुछ भविष्यवक्ताओं के संभावित चूक का परिणाम छोटे आर-वर्ग से होगा, जो सभी भविष्यवक्ताओं को मॉडल में शामिल किया गया था। लेकिन नमूना डेटा के लिए आर-स्क्वायर के सामान्य पूर्वाग्रह भी आर-स्क्वायर को बढ़ाएंगे। इस प्रकार, मेरा अनुभवहीन विचार यह है कि संभावित रूप से, इन दो विरोधी बलों के कारण कुछ परिस्थितियों में निष्पक्ष आर-स्क्वायर हो सकता है। और अधिक आम तौर पर, पूर्वाग्रह की दिशा डेटा की विभिन्न विशेषताओं और अल्फा समावेशन मानदंड पर आकस्मिक होगी।
- एक अधिक कड़े अल्फा समावेशी मानदंड (जैसे, .01, .001, आदि) की स्थापना अनुमानित आर-वर्ग को कम करना चाहिए क्योंकि डेटा के किसी भी पीढ़ी में किसी भी भविष्यवक्ता को शामिल करने की संभावना कम होगी।
- सामान्य तौर पर, आर-स्क्वायर जनसंख्या आर-स्क्वायर का एक सीधा पक्षपाती अनुमान है और इस पूर्वाग्रह की डिग्री अधिक भविष्यवाणियों और छोटे नमूना आकारों के साथ बढ़ जाती है।
सवाल
तो आखिरकार, मेरा सवाल:
- जनसंख्या के आर-वर्ग के पक्षपातपूर्ण अनुमान में चरणबद्ध प्रतिगमन से r- वर्ग किस हद तक परिणामित होता है?
- यह किस नमूने के आकार, भविष्यवक्ताओं की संख्या, अल्फा समावेश मापदंड या डेटा के गुणों से संबंधित है?
- क्या इस विषय पर कोई संदर्भ हैं?