एक सांख्यिकीय में पूर्णता को परिभाषित करने के पीछे अंतर्ज्ञान क्या है क्योंकि इसमें से का निष्पक्ष अनुमान लगाने वाला असंभव है?

21

शास्त्रीय आंकड़ों में, एक परिभाषा है कि डेटा के एक सेट का एक सांख्यिकीय को एक पैरामीटर के लिए पूरा होने के लिए परिभाषित किया गया है यह निष्पक्ष आकलनकर्ता से असम्भव रूप से बनाना असंभव है । यही कारण है कि, लिए एकमात्र तरीका है कि सभी के लिए होना चाहिए । $T$ $y_1, \ldots, y_n$ $\theta$ $0$ $E h(T (y )) = 0$ $\theta$ $h$ $0$

क्या इसके पीछे कोई अंतर्ज्ञान है? इसे परिभाषित करने के बजाय एक यांत्रिक तरीके की तरह लगता है, मुझे पता है कि यह पहले पूछा गया है, लेकिन सोच रहा था कि क्या अंतर्ज्ञान को समझने में बहुत आसान था, जो परिचयात्मक छात्रों को सामग्री को पचाने का एक आसान समय होगा।

— user1398057
स्रोत

2

यह एक बहुत अच्छा सवाल है, मुझे खुद इसमें खुदाई करनी थी। यह पता चला है कि इसका कारण ऐसी यांत्रिक परिभाषा है और मेरे जैसे मानक अभ्यासी के लिए सहज रूप से सार्थक नहीं दिखाई देता है, यह मुख्य रूप से गणितीय आँकड़ों में मौलिक योगदान को साबित करने के लिए उपयोग किया जाता है। विशेष रूप से, मेरी छोटी खोज से पता चला है कि लेहमन-शेफ़े प्रमेय और बसु के प्रमेय को धारण करने के लिए एक आंकड़े की पूर्णता की आवश्यकता है । ये 1950 के दशक के मध्य में योगदान दे रहे हैं। मैं आपको एक सहज व्याख्या नहीं दे सकता - लेकिन अगर आप वास्तव में एक का निर्माण करना चाहते हैं, तो शायद साक्ष्य सहयोगी

— जेरेमीस के

18

मैं दूसरे उत्तर में जोड़ने की कोशिश करूंगा। सबसे पहले, पूर्णता एक तकनीकी स्थिति है जो मुख्य रूप से प्रमेयों द्वारा उचित है जो इसका उपयोग करते हैं। तो चलिए कुछ संबंधित अवधारणाओं और प्रमेयों से शुरू करते हैं जहां वे घटित होते हैं।

चलो आईआईडी डेटा है, जो हम होने एक वितरण के रूप में मॉडल का एक वेक्टर प्रतिनिधित्व जहां पैरामीटर गवर्निंग डेटा है अनजान। है पर्याप्त अगर की सशर्त वितरण पैरामीटर पर निर्भर नहीं करता । एक सहायक है यदि का वितरण (परिवार ) पर निर्भर नहीं करता है । शून्य का एक निष्पक्ष अनुमानक है यदि इसकी अपेक्षा शून्य है, इसके बावजूद $X=(X_1,X_2,\dotsc,X_n)$ $f(x;\theta), \theta \in \Theta$ $\theta$ $T=T(X)$ $X \mid T$ $\theta$ $V=V(X)$ $V$ $\theta$ $f(x;\theta)$ $U=U(X)$ $\theta$ । एक पूर्ण आँकड़ा है यदि आधार पर शून्य का कोई भी निष्पक्ष अनुमानक शून्य है, अर्थात, अगर तो एई (सभी के लिए )। $S=S(X)$ $S$ $\DeclareMathOperator{\E}{\mathbb{E}} \E g(S)=0 (\text{for all $\theta$})$ $g(S)=0$ $\theta$

अब, मान लें कि आपके पास पर्याप्त आँकड़ा , आधार पर दो अलग-अलग निष्पक्ष अनुमानक हैं । यही है, प्रतीकों में और (सभी )। फिर शून्य का एक निष्पक्ष अनुमानक है, जो पहचान शून्य नहीं है, यह साबित करता है कि पूरा नहीं है। इसलिए, एक पर्याप्त सांख्यिकीय की पूर्णता हमें बताती है कि आधार पर केवल एक अद्वितीय निष्पक्ष आकलनकर्ता of the मौजूद है $\theta$ $T$ $g_1(T), g_2(T)$

E g 1 (T) = θ, E g 2 (T) = θ

$\E g_1(T)=\theta ,\\ \E g_2(T)=\theta$

P(g1(T)≠g2(T))>0 $\DeclareMathOperator{\P}{\mathbb{P}} \P(g_1(T) \not= g_2(T) ) > 0$

θ $\theta$

g1(T)−g2(T) $g_1(T)-g_2(T)$

T $T$

θ $\theta$

T $T$ । यह पहले से ही लेहमैन-शेफ़े प्रमेय के बहुत करीब है।

आइए कुछ उदाहरणों पर गौर करें। मान लीजिए कि $X_1, \dotsc, X_n$ अब अंतराल $(\theta, \theta+1)$ पर एक समान है । हम यह दिखा सकते हैं कि ( $X_{(1)} < X_{(2)} < \dotsm < X_{(n)}$ क्रम आँकड़े हैं) जोड़ी $(X_{(1)}, X_{(n)})$ पर्याप्त है, लेकिन यह पूर्ण नहीं है, क्योंकि अंतर $X_{(n)}-X_{(1)}$ सहायक है, हम इसकी अपेक्षा की गणना कर सकते हैं, इसे $c$ होने दें (जो केवल $n$ का एक कार्य है ), और फिर $X_{(n)}-X_{(1)} -c$ शून्य का एक निष्पक्ष अनुमानक होगा जो पहचान शून्य नहीं है। तो इस मामले में हमारी पर्याप्त संख्या, पूर्ण और पर्याप्त नहीं है। और हम देख सकते हैं कि इसका क्या अर्थ है: पर्याप्त आंकड़े के कार्य मौजूद हैं जो कि $\theta$ (मॉडल के संदर्भ में) के बारे में जानकारीपूर्ण नहीं हैं । यह पूरी तरह से पर्याप्त आंकड़े के साथ नहीं हो सकता है; यह एक अर्थ में अधिकतम जानकारीपूर्ण है, इसमें कोई भी कार्य नहीं किया जा सकता है। दूसरी ओर, यदि न्यूनतम शून्य पर्याप्तता के कुछ कार्य हैं, जिसमें अपेक्षा शून्य है, तो इसे शोर अवधि के रूप में देखा जा सकता है , मॉडल में गड़बड़ी / शोर शब्दों में अपेक्षा शून्य है। इसलिए हम कह सकते हैं कि गैर-पूर्ण पर्याप्त आंकड़ों में कुछ शोर होते हैं ।

फिर से इस उदाहरण में $R=X_{(n)}-X_{(1)}$ देखें। के बाद से इसके वितरण पर निर्भर नहीं करता $\theta$ , यह नहीं है अकेले अपने आप में के बारे में कोई जानकारी $\theta$ । लेकिन, एक साथ पर्याप्त आँकड़ों के साथ, यह करता है! कैसे? उस मामले को देखें जहां $R=1$ मनाया जाता है। तब, हमारे (सच ज्ञात) मॉडल के संदर्भ में, हमें $\theta$ का सही ज्ञान है ! अर्थात्, हम निश्चितता के साथ कह सकते हैं कि $\theta = X_{(1)}$ । आप जाँच सकते हैं कि $\theta$ $X_{(1)}$ लिए कोई अन्य मान या तो या $X_{(n)}$ एक असंभव अवलोकन होने के नाते, ग्रहण किए गए मॉडल के तहत। दूसरी ओर, यदि हम $R=0.1$ निरीक्षण करते हैं , तो $\theta$ लिए संभावित मानों की सीमा बड़ी है (व्यायाम ...)।

इस अर्थ में, सहायक आंकड़ा परिशुद्धता जिसके साथ हम अनुमान लगा सकते बारे में कुछ जानकारी शामिल करता है इस डेटा और मॉडल के आधार पर। इस उदाहरण में, और अन्य, सहायक सांख्यिकीय "नमूना आकार की भूमिका को संभालता है"। आमतौर पर, आत्मविश्वास अंतराल और इस तरह के नमूने का आकार आवश्यकता होती है , लेकिन इस उदाहरण में, हम एक सशर्त आत्मविश्वास अंतराल बना सकते हैं यह केवल , (व्यायाम) का उपयोग करके गणना की जाती है । यह फिशर का एक विचार था, कि निष्कर्ष पर सशर्त होना चाहिए। कुछ सहायक सांख्यिकी। $R$ $\theta$ $R$ $n$ $R$ $n$

अब, बसु का प्रमेय: यदि पर्याप्त रूप से पूर्ण है, तो यह किसी भी सहायक सांख्यिकीय से स्वतंत्र है। अर्थात्, पूर्ण रूप से पर्याप्त सांख्यिकीय पर आधारित निष्कर्ष सरल है, इसमें हमें सशर्त निष्कर्ष पर विचार करने की आवश्यकता नहीं है। एक आंकड़े पर शर्त जो से स्वतंत्र है , कुछ भी नहीं बदलता है, निश्चित रूप से। $T$ $T$

फिर, कुछ और अंतर्ज्ञान देने के लिए एक अंतिम उदाहरण। अंतराल पर हमारे समान वितरण उदाहरण को एक समान वितरण ( ) में । इस मामले आँकड़ों में है पूर्ण और पर्याप्त। किया बदल गया? हम देख सकते हैं कि पूर्णता वास्तव में मॉडल की एक संपत्ति है । पूर्व मामले में, हमारे पास एक प्रतिबंधित पैरामीटर स्थान था। इस प्रतिबंध ने आदेश के आँकड़ों पर संबंधों की शुरुआत करके पूर्णता को नष्ट कर दिया। इस प्रतिबंध को हटाकर हमें पूर्णता प्राप्त हुई! तो, एक अर्थ में, पूर्णता की कमी का मतलब है कि पैरामीटर स्थान पर्याप्त बड़ा नहीं है, और इसे बड़ा करके हम पूर्णता (और इस प्रकार, आसान अनुमान) को बहाल करने की उम्मीद कर सकते हैं। $(\theta_1, \theta_2)$ $\theta_1<\theta_2$ $(X_{(1)}, X_{(n)})$

कुछ अन्य उदाहरण जहां पूर्णता की कमी पैरामीटर स्थान पर प्रतिबंध के कारण होती है,

मेरा उत्तर देखें: फिशर सूचना किस प्रकार की है?
चलो आईआईडी हो (एक स्थान पैमाने पर मॉडल)। फिर पर्याप्त में ऑर्डर के आंकड़े लेकिन पूरे नहीं। लेकिन अब इस मॉडल को एक पूरी तरह से गैर-समरूप मॉडल में बढ़ाएँ, फिर भी iid लेकिन कुछ पूरी तरह से अनिर्दिष्ट वितरण । फिर आदेश के आँकड़े पर्याप्त और पूर्ण हैं। $X_1, \dotsc, X_n$ $\mathcal{Cauchy}(\theta,\sigma)$ $F$
घातीय पैरामीटर स्थान वाले घातीय परिवारों के लिए (जो कि यथासंभव बड़ा है) न्यूनतम पर्याप्त आंकड़ा भी पूर्ण है। लेकिन कई मामलों में, घुमावदार घातीय परिवारों के साथ, पैरामीटर स्थान पर प्रतिबंधों का परिचय , पूर्णता को नष्ट कर देता है।

एक बहुत ही प्रासंगिक पेपर पूर्णता और बसु के प्रमेय की व्याख्या है।

— kjetil b halvorsen
स्रोत

7

कुछ अंतर्ज्ञान सर्वश्रेष्ठ (न्यूनतम विचरण) निष्पक्ष अनुमानकों के सिद्धांत से उपलब्ध हो सकते हैं।

यदि तो के एक सबसे अच्छा निष्पक्ष आकलनकर्ता है iff शून्य के सभी निष्पक्ष आकलनकर्ता के साथ असहसंबद्ध है। $E_\theta W=\tau(\theta)$ $W$ $\tau(\theta)$ $W$

प्रमाण : को शून्य के सभी निष्पक्ष अनुमानकों के साथ असंबंधित एक निष्पक्ष अनुमानक होने दें । को एक और अनुमानक होने दें जैसे कि । लिखें । धारणा से, । इसलिए, किसी के लिए , । $W$ $W'$ $E_\theta W'=E_\theta W=\tau(\theta)$ $W'=W+(W'-W)$ $Var_\theta W'=Var_\theta W+Var_\theta (W'-W)$ $W'$ $Var_\theta W'\geq Var_\theta W$

अब मान लें कि एक सर्वश्रेष्ठ निष्पक्ष अनुमानक है। आज्ञा देना कुछ अन्य अनुमानक साथ । भी लिए निष्पक्ष है । हमारे पास यदि एक ऐसा होता है जैसे कि , हम प्राप्त करेगा के लिए । तब सर्वश्रेष्ठ निष्पक्ष अनुमानक नहीं हो सकता था। QED $W$ $U$ $E_\theta U=0$ $\phi_a:=W+aU$ $\tau(\theta)$

$Var_\theta \phi_a:=Var_\theta W+2aCov_\theta(W,U)+a^2Var_\theta U.$

$\theta_0\in\Theta$

$Cov_{\theta_0}(W,U)<0$

$Var_\theta \phi_a<Var_\theta W$

$a\in(0,-2Cov_{\theta_0}(W,U)/Var_{\theta_0} U)$

$W$

सहज रूप से, परिणाम कहता है कि यदि एक अनुमानक इष्टतम है, तो इसे केवल कुछ शोर जोड़कर, एक अनुमानक के साथ संयोजन के अर्थ में इसे सुधारना संभव नहीं होगा जो कि औसत पर सिर्फ शून्य है (शून्य का निष्पक्ष अनुमानक होने के नाते) )।

दुर्भाग्य से, शून्य के सभी निष्पक्ष अनुमानकों को चिह्नित करना मुश्किल है। स्थिति बहुत सरल हो जाता है, तो शून्य ही है, शून्य का केवल निष्पक्ष आकलनकर्ता है के रूप में किसी भी आंकड़ा संतुष्ट । पूर्णता ऐसी स्थिति का वर्णन करती है। $W$ $Cov_\theta(W,0)=0$

— क्रिस्टोफ़ हांक
स्रोत