आप दो प्रतिस्पर्धी आकलनकर्ता है, तो और , या नहीं, आपको बताता है कि है बेहतर अनुमानक पूरी तरह से "सर्वश्रेष्ठ" की आपकी परिभाषा पर निर्भर करता है। उदाहरण के लिए, यदि आप निष्पक्ष आकलनकर्ताओं की तुलना कर रहे हैं और "बेहतर" से आपका मतलब है कि कम विचरण है, तो, इसका अर्थ यह होगा कि बेहतर है। एक लोकप्रिय मानदंड है क्योंकि इसका संबंध लिस्ट स्क्वायर और गाऊसी लॉग-लाइबिलिटी के साथ है, लेकिन कई सांख्यिकीय मानदंडों की तरह, किसी को भी का उपयोग करने से सावधान रहना चाहिए θ 2एमएसई( θ 1)<एमएसई( θ 2) θ 1 θ 1एमएसईएमएसईθ^1θ^2
MSE(θ^1)<MSE(θ^2)
θ^1θ^1MSEMSE आवेदन पर ध्यान दिए बिना अनुमानक गुणवत्ता का एक उपाय के रूप में आँख बंद करके।
ऐसी कुछ स्थितियाँ हैं जहाँ को कम करने के लिए एक अनुमानक का चयन करना विशेष रूप से समझदारी वाली बात नहीं हो सकती है। दो परिदृश्य दिमाग में आते हैं:MSE
यदि किसी डेटा सेट में बहुत बड़े आउटलेयर हैं तो वे MSE को काफी प्रभावित कर सकते हैं और इस प्रकार जो अनुमानक MSE को कम करता है, वह ऐसे आउटलेर्स से अवांछित रूप से प्रभावित हो सकता है। ऐसी स्थितियों में, यह तथ्य कि एक अनुमानक कम से कम एमएसई वास्तव में आपको बहुत कुछ नहीं बताता है, यदि आपने आउटलाइर (एस) को हटा दिया है, तो आप एक बेतहाशा अलग अनुमान प्राप्त कर सकते हैं। उस अर्थ में, MSE आउटलेर्स के लिए "मजबूत" नहीं है। प्रतिगमन के संदर्भ में, यह तथ्य वही है जिसने ह्यूबर एम-एस्टीमेटर को प्रेरित किया (कि मैं इस उत्तर में चर्चा करता हूं), जो एक अलग मानदंड फ़ंक्शन (जो चुकता त्रुटि और पूर्ण त्रुटि के बीच एक मिश्रण है) को कम करता है जब लंबी-पूंछ वाली त्रुटियां होती हैं। ।
यदि आप एक घिरे पैरामीटर का आकलन कर रहे हैं, की तुलना रों उपयुक्त नहीं हो सकता है, क्योंकि यह उस स्थिति में अधिक penalizes और understimation अलग ढंग से। उदाहरण के लिए, मान लें कि आप एक विचरण का अनुमान लगा रहे हैं, । फिर, यदि आप सचेत रूप से मात्रा को कम आंकते हैं, तो आपका अधिकतम पर हो सकता है , जबकि overestimation एक उत्पादन कर सकता है, जो कि अब तक से अधिक है , शायद एक अनबिक राशि से भी।σ 2 एम एस ई σ 4 एम एस ई σ 4MSEσ2MSEσ4MSEσ4
इन कमियों को और अधिक स्पष्ट करने के लिए, मैं कब, इन मुद्दों की वजह से एक ठोस उदाहरण दूंगा, अनुमानक गुणवत्ता का एक उपयुक्त उपाय नहीं हो सकता है।MSE
मान लीजिए कि आपके पास एक नमूना है से वितरण से डिग्री की स्वतंत्रता है और हम विचरण का अनुमान लगाने की कोशिश कर रहे हैं, जो । दो प्रतिस्पर्धी आकलनकर्ताओं पर विचार करें: और स्पष्ट रूप से और यह एक तथ्य है कि जिसका उपयोग करके व्युत्पन्न किया जा सकता हैX1,...,Xntν>2ν/(ν−2)
θ^1:the unbiased sample variance
θ^2=0, regardless of the data
MSE(θ^2)=ν2(ν−2)2MSE(θ^1)={∞ν2(ν−2)2(2n−1+6n(ν−4))if ν≤4if ν>4.
तथ्य यह है इस सूत्र में चर्चा की और
के गुणों -distributiont ।
इस प्रकार भोले अनुमानक नमूना आकार की परवाह किए बिना जब भीMSEν<4 ,
संदर्भ में बेहतर प्रदर्शन करते हैं , जो कि असतत है। यह तब भी बेहतर होता है जब लेकिन यह केवल बहुत छोटे नमूना आकारों के लिए प्रासंगिक है। उपरोक्त वितरण आज़ादी के छोटे अंशों के साथ वितरण के लंबे प्रकृति के कारण होता है , जो को बहुत बड़े मानों से प्रभावित करता है और लिए भारी दंडित करता है, जबकि "
(2n−1+6n(ν−4))>1tθ^2MSEθ^1 यह समस्या नहीं है।
नीचे की रेखा यह है कि इस परिदृश्य में एक उपयुक्त माप अनुमानक प्रदर्शन नहीं हैMSE । यह स्पष्ट है क्योंकि अनुमानक जो कि संदर्भ में हावी है, एक हास्यास्पद है (विशेषकर चूंकि कोई मौका नहीं है कि यह देखा गया डेटा में कोई परिवर्तनशीलता है तो सही है)। शायद अधिक उपयुक्त दृष्टिकोण (जैसा कि कैसैला और बर्जर द्वारा इंगित किया गया है) वैरिएंट अनुमानक का चयन करने के लिए होगा, स्टीन के नुकसान को कम करने वाला :MSEθ^
S(θ^)=θ^ν/(ν−2)−1−log(θ^ν/(ν−2))
जो कम से कम overestimation को दंडित करता है। यह बाद से हमें पवित्रता में वापस लाता है :)S(θ^1)=∞