पियरसन सहसंबंध गुणांक के जनसंख्या मूल्य के दो प्रकार के अनुमानकों के बारे में मेरे सिर में कुछ भ्रम है।
ए फिशर (1915) से पता चला कि द्विचर सामान्य जनसंख्या अनुभवजन्य के लिए एक है नकारात्मक पक्षपाती की आकलनकर्ता , हालांकि पूर्वाग्रह केवल छोटा सा नमूना आकार (के लिए व्यावहारिक रूप से काफी मात्रा में हो सकता है )। नमूना इस अर्थ में को कम है कि यह तुलना में करीब है । (सिवाय इसके कि जब बाद या , तब तक निष्पक्ष है।) कई लगभग निष्पक्ष अनुमानों का प्रस्ताव किया गया है, जो शायद सबसे अच्छा है।ओल्किन और प्रैट (1958) ने सही किया :
बी। यह कहा जाता है कि प्रतिगमन में इसी जनसंख्या R- वर्ग को overestimates करता है। या, साधारण प्रतिगमन के साथ, यह है कि overestimates । उस तथ्य के आधार पर, मैंने देखा है कई कि कह ग्रंथों है सकारात्मक सापेक्ष पक्षपाती करने के लिए , निरपेक्ष मूल्य अर्थ: से दूर है से (? कि बयान सच है)। ग्रंथों का कहना है कि यह एक ही समस्या है क्योंकि इसके नमूना मूल्य द्वारा मानक विचलन पैरामीटर का अधिक-आकलन है। अपने जनसंख्या पैरामीटर, व्हेरी के (1931) के करीब को "समायोजित" करने के कई सूत्र मौजूद हैं सबसे प्रसिद्ध (लेकिन सबसे अच्छा नहीं) जा रहा है। इस तरह समायोजित की जड़ कहा जाता है सिकुड़ा हुआ :
वर्तमान दो अलग-अलग अनुमानक हैं । बहुत अलग: पहले एक फुलाते , दूसरी deflates । उन्हें कैसे समेटना है? कहां उपयोग करें / एक रिपोर्ट करें और कहां - अन्य?आर आर
विशेष रूप से, क्या यह सच हो सकता है कि "सिकुड़ा हुआ" अनुमानक (लगभग) निष्पक्ष भी है, "निष्पक्ष" एक की तरह, लेकिन केवल अलग संदर्भ में - प्रतिगमन के असममित संदर्भ में। ओएलएस प्रतिगमन के लिए, हम एक पक्ष (भविष्यवक्ता) के मूल्यों को तय करते हैं, जो नमूना से यादृच्छिक त्रुटि के बिना भाग लेते हैं? (और यहाँ जोड़ने के लिए, प्रतिगमन की जरूरत नहीं है द्विचर सामान्य।)