Shrunken


22

पियरसन सहसंबंध गुणांक के जनसंख्या मूल्य के दो प्रकार के अनुमानकों के बारे में मेरे सिर में कुछ भ्रम है।

फिशर (1915) से पता चला कि द्विचर सामान्य जनसंख्या अनुभवजन्य के लिए r एक है नकारात्मक पक्षपाती की आकलनकर्ता ρ , हालांकि पूर्वाग्रह केवल छोटा सा नमूना आकार (के लिए व्यावहारिक रूप से काफी मात्रा में हो सकता है n<30 )। नमूना इस अर्थ में को कम है कि यह तुलना में करीब है । (सिवाय इसके कि जब बाद या , तब तक निष्पक्ष है।) कई लगभग निष्पक्ष अनुमानों का प्रस्ताव किया गया है, जो शायद सबसे अच्छा है।rρ0ρ0±1rρओल्किन और प्रैट (1958) ने सही किया :r

runbiased=r[1+1r22(n3)]

बी। यह कहा जाता है कि प्रतिगमन में इसी जनसंख्या R- वर्ग को overestimates करता है। या, साधारण प्रतिगमन के साथ, यह है कि overestimates । उस तथ्य के आधार पर, मैंने देखा है कई कि कह ग्रंथों है सकारात्मक सापेक्ष पक्षपाती करने के लिए , निरपेक्ष मूल्य अर्थ: से दूर है से (? कि बयान सच है)। ग्रंथों का कहना है कि यह एक ही समस्या है क्योंकि इसके नमूना मूल्य द्वारा मानक विचलन पैरामीटर का अधिक-आकलन है। अपने जनसंख्या पैरामीटर, व्हेरी के (1931) के करीब को "समायोजित" करने के कई सूत्र मौजूद हैंR2r2ρ2rρr0ρR2 Radj2 सबसे प्रसिद्ध (लेकिन सबसे अच्छा नहीं) जा रहा है। इस तरह समायोजित की जड़ कहा जाता है सिकुड़ा हुआ :radj2 r

rshrunk=±1(1r2)n1n2

वर्तमान दो अलग-अलग अनुमानक हैं । बहुत अलग: पहले एक फुलाते , दूसरी deflates । उन्हें कैसे समेटना है? कहां उपयोग करें / एक रिपोर्ट करें और कहां - अन्य?आर आरρrr

विशेष रूप से, क्या यह सच हो सकता है कि "सिकुड़ा हुआ" अनुमानक (लगभग) निष्पक्ष भी है, "निष्पक्ष" एक की तरह, लेकिन केवल अलग संदर्भ में - प्रतिगमन के असममित संदर्भ में। ओएलएस प्रतिगमन के लिए, हम एक पक्ष (भविष्यवक्ता) के मूल्यों को तय करते हैं, जो नमूना से यादृच्छिक त्रुटि के बिना भाग लेते हैं? (और यहाँ जोड़ने के लिए, प्रतिगमन की जरूरत नहीं है द्विचर सामान्य।)


मुझे आश्चर्य है कि अगर यह सिर्फ जेन्सेन की असमानता के आधार पर कुछ के लिए नीचे आता है। यह है, और सामान्य रूप से द्विभाजित सामान्यता ज्यादातर मामलों में एक बुरी धारणा है।
छायाकार

1
इसके अलावा, बी में इस मुद्दे के बारे में मेरी समझ यह है कि प्रतिगमन एक overestimate है क्योंकि प्रतिगमन फिट को भविष्यवाणियों को जोड़कर मनमाने ढंग से सुधार किया जा सकता है। यही कारण है कि जैसे ही इस मुद्दे की तरह मेरे लिए नहीं लग r2
shadowtalker

यह वास्तव में सच है कि है का एक सकारात्मक पक्षपाती अनुमान है ρ 2 के सभी मानों के लिए ρ ? बिवरिएट सामान्य वितरण के लिए यह काफी हद तक ρ के लिए मामला नहीं लगता है। r2ρ2ρρ
NRH

क्या एक अनुमानक के वर्ग के लिए पूर्वाग्रह विपरीत दिशा में जा सकते हैं? उदाहरण के लिए, एक सरल आकलनकर्ता के साथ, यह दिखाया जा सकता है कि के कुछ श्रेणियों के लिए θ ? मुझे लगता है कि यह करता है, तो ऐसा करने के लिए मुश्किल होगा θ = ρ , लेकिन शायद एक सरल उदाहरण बाहर काम किया जा सकता है। E[θ^θ]<0<E[θ^2θ2]θθ=ρ
एंथनी

जवाबों:


1

सहसंबंध में पूर्वाग्रह के बारे में: जब पूर्वाग्रह किसी भी व्यावहारिक महत्व के लिए नमूना आकार छोटा होता है (उदाहरण के लिए, n <30 जो आपने सुझाया है), तो पूर्वाग्रह आपकी चिंताओं के कम से कम होने की संभावना है, क्योंकि अशुद्धि भयानक है।

कई प्रतिगमन में आर 2 के पूर्वाग्रह के संबंध में , कई अलग-अलग समायोजन हैं जो समान आकार के एक स्वतंत्र नमूने में निष्पक्ष जनसंख्या अनुमान बनाम निष्पक्ष अनुमान से संबंधित हैं। यिन, पी। एंड फैन, एक्स (2001) देखें। कई प्रतिगमन में R 2 संकोचन का अनुमान लगाना: विश्लेषणात्मक तरीकों की तुलना। प्रायोगिक शिक्षा के जर्नल, 69, 203-224।

आधुनिक-दिन प्रतिगमन विधियाँ प्रतिगमन गुणांक के संकोचन के साथ-साथ R 2 को भी परिणाम के रूप में संबोधित करती हैं - उदाहरण के लिए, k -fold क्रॉस सत्यापन के साथ इलास्टिक नेट , http://web.stanford.edu/~hastiePapers/ देखें flexnet.pdf


1
मैं नहीं जानता कि क्या यह वास्तव में सवाल का जवाब देता है
छायाकार

1

मुझे लगता है कि उत्तर सरल प्रतिगमन और कई प्रतिगमन के संदर्भ में है। एक IV और एक DV के साथ सरल प्रतिगमन में, R वर्ग सकारात्मक रूप से पक्षपाती नहीं है, और वास्तव में नकारात्मक पक्षपाती r दिया जा सकता है नकारात्मक पक्षपाती है। लेकिन कई IV के साथ कई प्रतिगमन में, जो स्वयं को सहसंबद्ध किया जा सकता है, R sq किसी भी "दमन" के कारण सकारात्मक रूप से पक्षपाती हो सकता है। इस प्रकार, मेरा कहना है कि मनाया गया आर 2 संबंधित जनसंख्या आर-वर्ग को कम कर देता है, लेकिन केवल कई प्रतिगमन में


1
R sq is not positively biased, and in-fact may be negatively biasedदिलचस्प। क्या आप इसे दिखा सकते हैं या एक संदर्भ दे सकते हैं? - सामान्य जनसंख्या में, क्या नमूना रु। आँकड़ा नकारात्मक पक्षपाती अनुमानक हो सकता है?
ttnphns

मैं सोचता हूं कि आप गलत हैं। क्या आप अपना दावा वापस करने के लिए एक संदर्भ दे सकते हैं?
रिचर्ड हार्डी

क्षमा करें, लेकिन यह एक विचार अभ्यास था, इसलिए मेरा कोई संदर्भ नहीं है।
डिंगस

मैं टिप्पणी ए से ऊपर जा रहा था, जहां फिशर ने दिखाया कि एक सामान्य स्थिति में, r rho का नकारात्मक पक्षपाती अनुमानक है। अगर ऐसा है तो क्या यह पालन नहीं होगा कि R sq भी नकारात्मक रूप से पक्षपाती है?
डिंगस

शायद यह बातचीत में मदद करेगा digitalcommons.unf.edu/cgi/…
डिंगस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.