एक सांख्यिकीय में पूर्णता को परिभाषित करने के पीछे अंतर्ज्ञान क्या है क्योंकि इसमें से का निष्पक्ष अनुमान लगाने वाला असंभव है?


21

शास्त्रीय आंकड़ों में, एक परिभाषा है कि डेटा के एक सेट का एक सांख्यिकीय को एक पैरामीटर के लिए पूरा होने के लिए परिभाषित किया गया है यह 0 के निष्पक्ष आकलनकर्ता से असम्भव रूप से बनाना असंभव है । यही कारण है कि, ई h (T (y)) = 0 के लिए एकमात्र तरीका है कि सभी \ थीटा के लिए h 0 होना चाहिए ।टी Ty 1 , ... , y ny1,,yn θ θ0 0( टी ( y ) ) = 0 Eh(T(y))=0θ θh00

क्या इसके पीछे कोई अंतर्ज्ञान है? इसे परिभाषित करने के बजाय एक यांत्रिक तरीके की तरह लगता है, मुझे पता है कि यह पहले पूछा गया है, लेकिन सोच रहा था कि क्या अंतर्ज्ञान को समझने में बहुत आसान था, जो परिचयात्मक छात्रों को सामग्री को पचाने का एक आसान समय होगा।


2
यह एक बहुत अच्छा सवाल है, मुझे खुद इसमें खुदाई करनी थी। यह पता चला है कि इसका कारण ऐसी यांत्रिक परिभाषा है और मेरे जैसे मानक अभ्यासी के लिए सहज रूप से सार्थक नहीं दिखाई देता है, यह मुख्य रूप से गणितीय आँकड़ों में मौलिक योगदान को साबित करने के लिए उपयोग किया जाता है। विशेष रूप से, मेरी छोटी खोज से पता चला है कि लेहमन-शेफ़े प्रमेय और बसु के प्रमेय को धारण करने के लिए एक आंकड़े की पूर्णता की आवश्यकता है । ये 1950 के दशक के मध्य में योगदान दे रहे हैं। मैं आपको एक सहज व्याख्या नहीं दे सकता - लेकिन अगर आप वास्तव में एक का निर्माण करना चाहते हैं, तो शायद साक्ष्य सहयोगी
जेरेमीस के

जवाबों:


18

मैं दूसरे उत्तर में जोड़ने की कोशिश करूंगा। सबसे पहले, पूर्णता एक तकनीकी स्थिति है जो मुख्य रूप से प्रमेयों द्वारा उचित है जो इसका उपयोग करते हैं। तो चलिए कुछ संबंधित अवधारणाओं और प्रमेयों से शुरू करते हैं जहां वे घटित होते हैं।

चलो आईआईडी डेटा है, जो हम होने एक वितरण के रूप में मॉडल का एक वेक्टर प्रतिनिधित्व जहां पैरामीटर गवर्निंग डेटा है अनजान। है पर्याप्त अगर की सशर्त वितरण पैरामीटर पर निर्भर नहीं करता । एक सहायक है यदि का वितरण (परिवार ) पर निर्भर नहीं करता है । शून्य का एक निष्पक्ष अनुमानक है यदि इसकी अपेक्षा शून्य है, इसके बावजूदएक्स = ( एक्स 1 , एक्स 2 , ... , एक्स एन ) X=(X1,X2,,Xn)( एक्स , θ ) , θ Θ f(x;θ),θΘθ θटी = टी ( एक्स )T=T(X)एक्स | टी XTθ θवी = वी ( एक्स )V=V(X)वी Vθ θ( एक्स , θ )f(x;θ) यू = यू ( एक्स )U=U(X)θθ । एक पूर्ण आँकड़ा है यदि आधार पर शून्य का कोई भी निष्पक्ष अनुमानक शून्य है, अर्थात, अगर तो एई (सभी के लिए )।एस = एस ( एक्स )S=S(X)एस S जी ( एस ) = 0 ( सभी के लिए  θ ) Eg(S)=0(for all θ)जी ( एस ) = 0 g(S)=0θθ

अब, मान लें कि आपके पास पर्याप्त आँकड़ा , आधार पर दो अलग-अलग निष्पक्ष अनुमानक हैं । यही है, प्रतीकों में \ E g_1 (T) = \ theta, \\ \ E g_2 (T) = \ theta और \ DeclareMathOperator {\ P} {\ mathbb {P}} \ P (g_1 (T) \ not = g_2 (T))> 0 (सभी \ थीटा के लिए )। फिर g_1 (T) -g_2 (T) शून्य का एक निष्पक्ष अनुमानक है, जो पहचान शून्य नहीं है, यह साबित करता है कि T पूरा नहीं है। इसलिए, एक पर्याप्त सांख्यिकीय T की पूर्णता हमें बताती है कि T के आधार पर केवल एक अद्वितीय निष्पक्ष आकलनकर्ता of the थीटा मौजूद हैθ θटी Tजी 1 ( टी ) , जी 2 ( टी ) g1(T),g2(T) जी 1 ( टी ) = θ , जी 2 (टी)=θ

Eg1(T)=θ,Eg2(T)=θ
पी ( जी 1 (टी) जी 2 (टी))>0P(g1(T)g2(T))>0θθ जी 1 (टी)- जी 2 (टी)g1(T)g2(T)टीTटीTθθटीT। यह पहले से ही लेहमैन-शेफ़े प्रमेय के बहुत करीब है।

आइए कुछ उदाहरणों पर गौर करें। मान लीजिए कि एक्स 1 , , एक्स एनX1,,Xn अब अंतराल ( θ , θ + 1 )(θ,θ+1) पर एक समान है । हम यह दिखा सकते हैं कि ( एक्स ( 1 ) < एक्स ( 2 ) < < एक्स ( एन )X(1)<X(2)<<X(n) क्रम आँकड़े हैं) जोड़ी ( एक्स ( 1 ) , एक्स ( एन ) )(X(1),X(n)) पर्याप्त है, लेकिन यह पूर्ण नहीं है, क्योंकि अंतर X ( n ) - एक्स ( 1 )X(n)X(1) सहायक है, हम इसकी अपेक्षा की गणना कर सकते हैं, इसे सीc होने दें (जो केवल nn का एक कार्य है ), और फिर एक्स ( एन ) - एक्स ( 1 ) - सीX(n)X(1)cशून्य का एक निष्पक्ष अनुमानक होगा जो पहचान शून्य नहीं है। तो इस मामले में हमारी पर्याप्त संख्या, पूर्ण और पर्याप्त नहीं है। और हम देख सकते हैं कि इसका क्या अर्थ है: पर्याप्त आंकड़े के कार्य मौजूद हैं जो कि θθ (मॉडल के संदर्भ में) के बारे में जानकारीपूर्ण नहीं हैं । यह पूरी तरह से पर्याप्त आंकड़े के साथ नहीं हो सकता है; यह एक अर्थ में अधिकतम जानकारीपूर्ण है, इसमें कोई भी कार्य नहीं किया जा सकता है। दूसरी ओर, यदि न्यूनतम शून्य पर्याप्तता के कुछ कार्य हैं, जिसमें अपेक्षा शून्य है, तो इसे शोर अवधि के रूप में देखा जा सकता है , मॉडल में गड़बड़ी / शोर शब्दों में अपेक्षा शून्य है। इसलिए हम कह सकते हैं कि गैर-पूर्ण पर्याप्त आंकड़ों में कुछ शोर होते हैं

फिर से इस उदाहरण में आर = एक्स ( एन ) - एक्स ( 1 )R=X(n)X(1) देखें। के बाद से इसके वितरण पर निर्भर नहीं करता θθ , यह नहीं है अकेले अपने आप में के बारे में कोई जानकारी θθ । लेकिन, एक साथ पर्याप्त आँकड़ों के साथ, यह करता है! कैसे? उस मामले को देखें जहां आर = 1R=1 मनाया जाता है। तब, हमारे (सच ज्ञात) मॉडल के संदर्भ में, हमें θθ का सही ज्ञान है ! अर्थात्, हम निश्चितता के साथ कह सकते हैं कि θ = एक्स ( 1 )θ=X(1) । आप जाँच सकते हैं कि θθX(1)X(1)थीटा के लिए कोई अन्य मान या तो X _ {(1)} या X(n)X(n)एक असंभव अवलोकन होने के नाते, ग्रहण किए गए मॉडल के तहत। दूसरी ओर, यदि हम R=0.1R=0.1 निरीक्षण करते हैं , तो θθ लिए संभावित मानों की सीमा बड़ी है (व्यायाम ...)।

इस अर्थ में, सहायक आंकड़ा परिशुद्धता जिसके साथ हम अनुमान लगा सकते बारे में कुछ जानकारी शामिल करता है इस डेटा और मॉडल के आधार पर। इस उदाहरण में, और अन्य, सहायक सांख्यिकीय "नमूना आकार की भूमिका को संभालता है"। आमतौर पर, आत्मविश्वास अंतराल और इस तरह के नमूने का आकार आवश्यकता होती है , लेकिन इस उदाहरण में, हम एक सशर्त आत्मविश्वास अंतराल बना सकते हैं यह केवल , (व्यायाम) का उपयोग करके गणना की जाती है । यह फिशर का एक विचार था, कि निष्कर्ष पर सशर्त होना चाहिए। कुछ सहायक सांख्यिकी।RRθθRRnnRRnn

अब, बसु का प्रमेय: यदि पर्याप्त रूप से पूर्ण है, तो यह किसी भी सहायक सांख्यिकीय से स्वतंत्र है। अर्थात्, पूर्ण रूप से पर्याप्त सांख्यिकीय पर आधारित निष्कर्ष सरल है, इसमें हमें सशर्त निष्कर्ष पर विचार करने की आवश्यकता नहीं है। एक आंकड़े पर शर्त जो से स्वतंत्र है , कुछ भी नहीं बदलता है, निश्चित रूप से।TTTT

फिर, कुछ और अंतर्ज्ञान देने के लिए एक अंतिम उदाहरण। अंतराल पर हमारे समान वितरण उदाहरण को एक समान वितरण ( ) में । इस मामले आँकड़ों में है पूर्ण और पर्याप्त। किया बदल गया? हम देख सकते हैं कि पूर्णता वास्तव में मॉडल की एक संपत्ति है । पूर्व मामले में, हमारे पास एक प्रतिबंधित पैरामीटर स्थान था। इस प्रतिबंध ने आदेश के आँकड़ों पर संबंधों की शुरुआत करके पूर्णता को नष्ट कर दिया। इस प्रतिबंध को हटाकर हमें पूर्णता प्राप्त हुई! तो, एक अर्थ में, पूर्णता की कमी का मतलब है कि पैरामीटर स्थान पर्याप्त बड़ा नहीं है, और इसे बड़ा करके हम पूर्णता (और इस प्रकार, आसान अनुमान) को बहाल करने की उम्मीद कर सकते हैं।(θ1,θ2)(θ1,θ2)θ1<θ2θ1<θ2(X(1),X(n))(X(1),X(n))

कुछ अन्य उदाहरण जहां पूर्णता की कमी पैरामीटर स्थान पर प्रतिबंध के कारण होती है,

  • मेरा उत्तर देखें: फिशर सूचना किस प्रकार की है?

  • चलो आईआईडी हो (एक स्थान पैमाने पर मॉडल)। फिर पर्याप्त में ऑर्डर के आंकड़े लेकिन पूरे नहीं। लेकिन अब इस मॉडल को एक पूरी तरह से गैर-समरूप मॉडल में बढ़ाएँ, फिर भी iid लेकिन कुछ पूरी तरह से अनिर्दिष्ट वितरण । फिर आदेश के आँकड़े पर्याप्त और पूर्ण हैं। X1,,XnX1,,XnCauchy(θ,σ)Cauchy(θ,σ)FF

  • घातीय पैरामीटर स्थान वाले घातीय परिवारों के लिए (जो कि यथासंभव बड़ा है) न्यूनतम पर्याप्त आंकड़ा भी पूर्ण है। लेकिन कई मामलों में, घुमावदार घातीय परिवारों के साथ, पैरामीटर स्थान पर प्रतिबंधों का परिचय , पूर्णता को नष्ट कर देता है।

एक बहुत ही प्रासंगिक पेपर पूर्णता और बसु के प्रमेय की व्याख्या है।


7

कुछ अंतर्ज्ञान सर्वश्रेष्ठ (न्यूनतम विचरण) निष्पक्ष अनुमानकों के सिद्धांत से उपलब्ध हो सकते हैं।

यदि तो के एक सबसे अच्छा निष्पक्ष आकलनकर्ता है iff शून्य के सभी निष्पक्ष आकलनकर्ता के साथ असहसंबद्ध है।EθW=τ(θ)EθW=τ(θ)WWτ(θ)τ(θ)WW

प्रमाण : को शून्य के सभी निष्पक्ष अनुमानकों के साथ असंबंधित एक निष्पक्ष अनुमानक होने दें । को एक और अनुमानक होने दें जैसे कि । लिखें । धारणा से, । इसलिए, किसी के लिए , ।WWWWEθW=EθW=τ(θ)EθW=EθW=τ(θ)W=W+(WW)W=W+(WW)VarθW=VarθW+Varθ(WW)VarθW=VarθW+Varθ(WW)WWVarθWVarθWVarθWVarθW

अब मान लें कि एक सर्वश्रेष्ठ निष्पक्ष अनुमानक है। आज्ञा देना कुछ अन्य अनुमानक साथ । भी लिए निष्पक्ष है । हमारे पास यदि एक ऐसा होता है जैसे कि , हम प्राप्त करेगा के लिए । तब सर्वश्रेष्ठ निष्पक्ष अनुमानक नहीं हो सकता था। QEDWWUUEθU=0EθU=0ϕa:=W+aUϕa:=W+aUτ(θ)τ(θ)Varθϕa:=VarθW+2aCovθ(W,U)+a2VarθU.

θ0ΘCovθ0(W,U)<0Varθϕa<VarθWa(0,2Covθ0(W,U)/Varθ0U)W

सहज रूप से, परिणाम कहता है कि यदि एक अनुमानक इष्टतम है, तो इसे केवल कुछ शोर जोड़कर, एक अनुमानक के साथ संयोजन के अर्थ में इसे सुधारना संभव नहीं होगा जो कि औसत पर सिर्फ शून्य है (शून्य का निष्पक्ष अनुमानक होने के नाते) )।

दुर्भाग्य से, शून्य के सभी निष्पक्ष अनुमानकों को चिह्नित करना मुश्किल है। स्थिति बहुत सरल हो जाता है, तो शून्य ही है, शून्य का केवल निष्पक्ष आकलनकर्ता है के रूप में किसी भी आंकड़ा संतुष्ट । पूर्णता ऐसी स्थिति का वर्णन करती है।WCovθ(W,0)=0

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.