क्या समायोजित आर-वर्ग निश्चित स्कोर या यादृच्छिक स्कोर जनसंख्या आर-स्क्वार्ड का अनुमान लगाना चाहता है?


9

जनसंख्या आर-वर्ग को निश्चित स्कोर या यादृच्छिक स्कोर मानकर परिभाषित किया जा सकता है:ρ2

  • निश्चित स्कोर: नमूना आकार और भविष्यवाणियों के विशेष मूल्यों को निर्धारित किया जाता है। इस प्रकार, जनसंख्या के प्रतिगमन समीकरण द्वारा परिणाम में समझाया गया विचरण का अनुपात है जब मान स्थिर रहता है।ρf2

  • यादृच्छिक स्कोर: भविष्यवाणियों के विशेष मूल्य एक वितरण से तैयार किए गए हैं। इस प्रकार, ρr2 जनसंख्या के परिणाम में बताए गए विचरण के अनुपात को संदर्भित करता है जहां भविष्यवक्ता मान जनसंख्या के पूर्वानुमान वितरण के अनुरूप होते हैं।

मैंने पहले इसρ2 बारे में पूछा है कि क्या इस अंतर से \ rho ^ 2 के अनुमानों पर बहुत फर्क पड़ता है । मैंने आमतौर पर \ rho ^ 2 के निष्पक्ष अनुमान की गणना करने के तरीके के ρ2 बारे में भी पूछा है ।

मैं देख सकता हूं कि जैसे-जैसे नमूने का आकार तय-स्कोर के बीच का अंतर बढ़ता जाता है और रैंडम-स्कोर कम महत्वपूर्ण होता जाता है। हालांकि, मैं यह पुष्टि करने की कोशिश कर रहा हूं कि समायोजित R2 को निश्चित स्कोर या यादृच्छिक स्कोर \ rho ^ 2 का अनुमान लगाने के लिए डिज़ाइन किया गया है ρ2

प्रशन

  • क्या समायोजित R2 को निश्चित स्कोर या यादृच्छिक स्कोर \ rho ^ 2 का अनुमान लगाने के लिए डिज़ाइन किया गया है ρ2?
  • क्या एक समायोजित विवरण है कि समायोजित आर-स्क्वायर के लिए सूत्र \ rho ^ 2 के एक या अन्य रूप से कैसे संबंधित है ρ2?

मेरी उलझन की पृष्ठभूमि

जब मैंने यिन और फैन (2001, p.206) पढ़ा तो वे लिखते हैं:

एकाधिक प्रतिगमन मॉडल की मूल मान्यताओं में से एक यह है कि स्वतंत्र चर के मूल्य ज्ञात स्थिरांक हैं और प्रयोग से पहले शोधकर्ता द्वारा तय किए जाते हैं। केवल आश्रित चर नमूना से नमूने के लिए अलग-अलग है। उस प्रतिगमन मॉडल को निश्चित रैखिक प्रतिगमन मॉडल कहा जाता है ।

हालांकि, सामाजिक और व्यवहार विज्ञान में, स्वतंत्र चर के मान शायद ही कभी शोधकर्ताओं द्वारा तय किए जाते हैं और यादृच्छिक त्रुटियों के अधीन भी होते हैं। इसलिए, अनुप्रयोगों के लिए एक दूसरे प्रतिगमन मॉडल का सुझाव दिया गया है, जिसमें आश्रित और स्वतंत्र चर दोनों को अलग-अलग करने की अनुमति है (बी, 1959; पार्क एंड दुडीचा, 1974)। उस मॉडल को यादृच्छिक मॉडल (या सुधार मॉडल) कहा जाता है। यद्यपि यादृच्छिक और निश्चित मॉडल से प्राप्त प्रतिगमन गुणांक के अधिकतम संभावना अनुमान सामान्यता मान्यताओं के तहत समान हैं, लेकिन उनके वितरण बहुत अलग हैं। यादृच्छिक मॉडल इतना जटिल है कि आमतौर पर इस्तेमाल किए जाने वाले निश्चित रैखिक प्रतिगमन मॉडल के स्थान पर स्वीकार किए जाने से पहले अधिक शोध की आवश्यकता होती है। इसलिए, निश्चित मॉडल आमतौर पर लागू किया जाता है, यहां तक ​​कि जब धारणाएं पूरी तरह से पूरी नहीं होती हैं (क्लाउडी, 1978)। उल्लिखित मान्यताओं के साथ निर्धारित प्रतिगमन मॉडल के ऐसे अनुप्रयोग "ओवरफिटिंग" का कारण बनेंगे, क्योंकि कम-से-सही नमूना डेटा से शुरू की गई यादृच्छिक त्रुटि प्रक्रिया में पूंजीकृत होती है। नतीजतन, नमूना एकाधिक सहसंबंध गुणांक ने इस तरह से प्राप्त किया कि सच्ची आबादी कई सहसंबंध (क्लॉडी, 1978; कोहेन और कोहेन, 1983; कमिंग्स, 1982) को पछाड़ देती है।

इसलिए मुझे यह स्पष्ट नहीं था कि उपरोक्त कथन कह रहा है कि समायोजित यादृच्छिक मॉडल द्वारा पेश की गई त्रुटि के लिए क्षतिपूर्ति करता है या क्या यह कागज में सिर्फ एक चेतावनी थी जो यादृच्छिक मॉडल के अस्तित्व को चिह्नित करती है, लेकिन यह कि कागज जा रहा था फिक्स्ड मॉडल पर ध्यान दें।R2

संदर्भ

  • यिन, पी।, और फैन, एक्स (2001)। अनुमान लगाना कई प्रतिगमन में संकोचन: विभिन्न विश्लेषणात्मक तरीकों की तुलना। प्रायोगिक शिक्षा के जर्नल, 69 (2), 203-224। पीडीएफR2

जवाबों:


6

राजू एट अल (1997) ने ध्यान दिया

पेधज़ूर (1982) और मिशेल एंड क्लिमोस्की (1986) ने तर्क दिया है कि
जब एनएस कम से कम मध्यम आकार (लगभग 50) का होता है तो मॉडल [तय-एक्स या यादृच्छिक-एक्स] द्वारा अपेक्षाकृत अप्रभावित होते हैं।

फिर भी, राजू वगैरह (1997) ने को "स्थिर X सूत्र" और "रैंडम एक्स सूत्र" के रूप में लिए कुछ समायोजित सूत्रों को वर्गीकृत किया ।R2ρ2

फिक्स्ड एक्स फॉर्मूले: ईजेकील (1930) द्वारा प्रस्तावित सूत्र सहित कई सूत्र उल्लिखित हैं जो कि अधिकांश सांख्यिकीय सॉफ्टवेयर में मानक है:

ρ^(E)2=1N1Np1(1R2)

इस प्रकार, प्रश्न का संक्षिप्त उत्तर मानक समायोजित सूत्र है जिसे आमतौर पर रिपोर्ट किया गया है और मानक सांख्यिकीय सॉफ़्टवेयर में बनाया गया है, जो x का एक अनुमान है ।R2ρ2

यादृच्छिक एक्स सूत्र:

ओल्किन और प्रैट (1958) ने एक सूत्र का प्रस्ताव किया

ρ^(OP)2=1[N3Np1](1R2)F[1,1;Np+12;(1R2)]
जहां F हाइपरोमेट्रिक फ़ंक्शन है

राजू एट अल (1997) बताते हैं कि कैसे विभिन्न अन्य सूत्र, जैसे प्रैट और हर्ज़बर्ग के "अपेक्षित हाइपरोमेट्रिक फ़ंक्शन के लिए अनुमानित हैं"। जैसे, प्रैट का सूत्र है

ρ^(P)2=1(N3)(1R2)Np1[1+2(1R2)Np2.3]

अनुमान कैसे भिन्न होते हैं? लीच और हैनसेन (2003) की रिपोर्ट में एक अच्छी तालिका प्रस्तुत है जो मनोविज्ञान में विभिन्न प्रकाशित डेटासेट के नमूने पर विभिन्न सूत्रों के प्रभाव को दिखाती है (तालिका 3 देखें)। ईजेकील का मतलब था ।2817 की तुलना में ओल्किन और प्रैट ।2917 और प्रैट ।2910 की तुलना में। राजू वगैरह के प्रारंभिक उद्धरण के अनुसार निश्चित और रैंडम-एक्स फॉर्मूले के बीच अंतर छोटे नमूने के आकारों के लिए सबसे अधिक प्रासंगिक है, लीच और हैनसेन की तालिका से पता चलता है कि यहेजकेल के निश्चित-एक्स फॉर्मूला और ओल्किन और प्रैट के रैंडम-एक्स फॉर्मूले के बीच अंतर सबसे प्रमुख है छोटे नमूने के आकारों में, विशेष रूप से 50 से कम वाले।Radj2Radj2Radj2

संदर्भ

  • लीच, एलएफ, और हेंसन, आरके (2003)। प्रकाशित प्रतिगमन अनुसंधान में समायोजित R2 प्रभावों का उपयोग और प्रभाव। दक्षिण-पश्चिम शैक्षिक अनुसंधान समझौते की वार्षिक बैठक में सैन एंटोनियो, TX। पीडीएफ
  • मिशेल, TW, और क्लिमोस्की, आरजे (1986)। क्रॉस-वैधता अनुमान की वैधता का अनुमान। एप्लाइड साइकोलॉजी के जर्नल, 71 , 311-317।
  • पेधज़ूर, ईजे (1982)। व्यवहार अनुसंधान में बहु प्रतिगमन (दूसरा संस्करण) न्यूयॉर्क: होल्ट, रिनेहार्ट और विंस्टन।
  • राजू, एनएस, बिलगिक, आर।, एडवर्ड्स, जेई, और फ्लेयर, पीएफ (1997)। कार्यप्रणाली की समीक्षा: जनसंख्या की वैधता और क्रॉस-वैधता का अनुमान, और भविष्यवाणी में समान भार का उपयोग। एप्लाइड मनोवैज्ञानिक माप, 21 (4), 291-305।
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.