जनसंख्या आर-वर्ग को निश्चित स्कोर या यादृच्छिक स्कोर मानकर परिभाषित किया जा सकता है:
निश्चित स्कोर: नमूना आकार और भविष्यवाणियों के विशेष मूल्यों को निर्धारित किया जाता है। इस प्रकार, जनसंख्या के प्रतिगमन समीकरण द्वारा परिणाम में समझाया गया विचरण का अनुपात है जब मान स्थिर रहता है।
यादृच्छिक स्कोर: भविष्यवाणियों के विशेष मूल्य एक वितरण से तैयार किए गए हैं। इस प्रकार, जनसंख्या के परिणाम में बताए गए विचरण के अनुपात को संदर्भित करता है जहां भविष्यवक्ता मान जनसंख्या के पूर्वानुमान वितरण के अनुरूप होते हैं।
मैंने पहले इस बारे में पूछा है कि क्या इस अंतर से \ rho ^ 2 के अनुमानों पर बहुत फर्क पड़ता है । मैंने आमतौर पर \ rho ^ 2 के निष्पक्ष अनुमान की गणना करने के तरीके के बारे में भी पूछा है ।
मैं देख सकता हूं कि जैसे-जैसे नमूने का आकार तय-स्कोर के बीच का अंतर बढ़ता जाता है और रैंडम-स्कोर कम महत्वपूर्ण होता जाता है। हालांकि, मैं यह पुष्टि करने की कोशिश कर रहा हूं कि समायोजित को निश्चित स्कोर या यादृच्छिक स्कोर \ rho ^ 2 का अनुमान लगाने के लिए डिज़ाइन किया गया है ।
प्रशन
- क्या समायोजित को निश्चित स्कोर या यादृच्छिक स्कोर \ rho ^ 2 का अनुमान लगाने के लिए डिज़ाइन किया गया है ?
- क्या एक समायोजित विवरण है कि समायोजित आर-स्क्वायर के लिए सूत्र \ rho ^ 2 के एक या अन्य रूप से कैसे संबंधित है ?
मेरी उलझन की पृष्ठभूमि
जब मैंने यिन और फैन (2001, p.206) पढ़ा तो वे लिखते हैं:
एकाधिक प्रतिगमन मॉडल की मूल मान्यताओं में से एक यह है कि स्वतंत्र चर के मूल्य ज्ञात स्थिरांक हैं और प्रयोग से पहले शोधकर्ता द्वारा तय किए जाते हैं। केवल आश्रित चर नमूना से नमूने के लिए अलग-अलग है। उस प्रतिगमन मॉडल को निश्चित रैखिक प्रतिगमन मॉडल कहा जाता है ।
हालांकि, सामाजिक और व्यवहार विज्ञान में, स्वतंत्र चर के मान शायद ही कभी शोधकर्ताओं द्वारा तय किए जाते हैं और यादृच्छिक त्रुटियों के अधीन भी होते हैं। इसलिए, अनुप्रयोगों के लिए एक दूसरे प्रतिगमन मॉडल का सुझाव दिया गया है, जिसमें आश्रित और स्वतंत्र चर दोनों को अलग-अलग करने की अनुमति है (बी, 1959; पार्क एंड दुडीचा, 1974)। उस मॉडल को यादृच्छिक मॉडल (या सुधार मॉडल) कहा जाता है। यद्यपि यादृच्छिक और निश्चित मॉडल से प्राप्त प्रतिगमन गुणांक के अधिकतम संभावना अनुमान सामान्यता मान्यताओं के तहत समान हैं, लेकिन उनके वितरण बहुत अलग हैं। यादृच्छिक मॉडल इतना जटिल है कि आमतौर पर इस्तेमाल किए जाने वाले निश्चित रैखिक प्रतिगमन मॉडल के स्थान पर स्वीकार किए जाने से पहले अधिक शोध की आवश्यकता होती है। इसलिए, निश्चित मॉडल आमतौर पर लागू किया जाता है, यहां तक कि जब धारणाएं पूरी तरह से पूरी नहीं होती हैं (क्लाउडी, 1978)। उल्लिखित मान्यताओं के साथ निर्धारित प्रतिगमन मॉडल के ऐसे अनुप्रयोग "ओवरफिटिंग" का कारण बनेंगे, क्योंकि कम-से-सही नमूना डेटा से शुरू की गई यादृच्छिक त्रुटि प्रक्रिया में पूंजीकृत होती है। नतीजतन, नमूना एकाधिक सहसंबंध गुणांक ने इस तरह से प्राप्त किया कि सच्ची आबादी कई सहसंबंध (क्लॉडी, 1978; कोहेन और कोहेन, 1983; कमिंग्स, 1982) को पछाड़ देती है।
इसलिए मुझे यह स्पष्ट नहीं था कि उपरोक्त कथन कह रहा है कि समायोजित यादृच्छिक मॉडल द्वारा पेश की गई त्रुटि के लिए क्षतिपूर्ति करता है या क्या यह कागज में सिर्फ एक चेतावनी थी जो यादृच्छिक मॉडल के अस्तित्व को चिह्नित करती है, लेकिन यह कि कागज जा रहा था फिक्स्ड मॉडल पर ध्यान दें।
संदर्भ
- यिन, पी।, और फैन, एक्स (2001)। अनुमान लगाना कई प्रतिगमन में संकोचन: विभिन्न विश्लेषणात्मक तरीकों की तुलना। प्रायोगिक शिक्षा के जर्नल, 69 (2), 203-224। पीडीएफ