मंझला का एक निष्पक्ष अनुमान


16

मान लीजिए कि हमारे पास एक यादृच्छिक चर X [ 0 , 1 ]X पर समर्थित है जिससे हम नमूने खींच सकते हैं। हम एक्स के माध्य के एक निष्पक्ष अनुमान के साथ कैसे आ सकते हैं ?[0,1]X

हम, निश्चित रूप से, कुछ नमूने उत्पन्न कर सकते हैं और नमूना मंझला ले सकते हैं, लेकिन मैं समझता हूं कि यह सामान्य रूप से निष्पक्ष नहीं होगा।

नोट: यह प्रश्न संबंधित है, लेकिन मेरे अंतिम प्रश्न के समान नहीं है, जिस स्थिति में XX को केवल लगभग नमूना लिया जा सकता है।

जवाबों:


13

ऐसा अनुमान लगाने वाला मौजूद नहीं है।

अंतर्ज्ञान यह है कि माध्य स्थिर रह सकता है जब हम स्वतंत्र रूप से इसकी दोनों तरफ संभावना घनत्व को शिफ्ट करते हैं, ताकि किसी भी अनुमानक जिसका औसत मूल्य एक वितरण के लिए औसतन है, बदल वितरण के लिए एक अलग औसत होगा, जिससे यह पक्षपातपूर्ण हो जाता है। निम्नलिखित प्रदर्शनी इस अंतर्ज्ञान के लिए थोड़ी अधिक कठोरता देती है।


हम वितरण पर ध्यान केंद्रित एफ अद्वितीय माध्यिकाओं होने m , ताकि परिभाषा से एफ ( मीटर ) 1 / 2 और एफ ( एक्स ) < 1 / 2 सभी के लिए एक्स < मीटर । एक नमूने का आकार ठीक n 1 और कहा कि लगता है कि टी : [ 0 , 1 ] n[ 0 , 1 ] अनुमान हूँ । (यह पर्याप्त होगा कि टीFmF(m)1/2F(x)<1/2x<mn1t:[0,1]n[0,1]mtकेवल बाध्य होना चाहिए, लेकिन आमतौर पर कोई भी अनुमानक गंभीरता से विचार नहीं करता है जो स्पष्ट रूप से असंभव मूल्यों का उत्पादन करते हैं।) हम टी के बारे में कोई धारणा नहीं बनाते हैं ; यह कहीं भी निरंतर होने की आवश्यकता नहीं है।t

टी निष्पक्ष होने का अर्थ (इस निश्चित नमूना आकार के लिए) हैt

एफ [ टी ( एक्स 1 , , एक्स एन ) ] = एम

EF[t(X1,,Xn)]=m

के साथ किसी भी आईआईडी नमूने के लिए एक्स मैं ~ एफ । एक "निष्पक्ष अनुमानक" टी इस तरह के सभी एफ के लिए इस संपत्ति के साथ एक है ।XiFtF

मान लें कि एक निष्पक्ष अनुमानक मौजूद है। हम वितरण के एक विशेष रूप से सरल सेट पर इसे लागू करके एक विरोधाभास प्राप्त करेंगे। पर विचार करें वितरण एफ = एफ x , y , मीटर , ε इन गुणों होने:F=Fx,y,m,ε

  1. 0 एक्स < y 1 ;0x<y1

  2. 0 < ε < ( y - x ) / 4 ;0<ε<(yx)/4

  3. एक्स + ε < मीटर < y - ε ;x+ε<m<yε

  4. पीआर ( एक्स = एक्स ) = पीआर ( एक्स = y ) = ( 1 - ε ) / 2 ;Pr(X=x)=Pr(X=y)=(1ε)/2

  5. पीआर ( मीटर - ε एक्स मीटर + ε ) = ε ; तथाPr(mεXm+ε)=ε

  6. एफ पर एक समान है [ मीटर - ε , मीटर + ε ]F[mε,m+ε]

इन वितरण जगह संभावना ( 1 - ε ) / 2 में से प्रत्येक में एक्स और वाई और संभावना का एक छोटी राशि संतुलित आसपास रखा मीटर के बीच एक्स और वाई । इस बनाता हूँ की अनूठी मंझला एफ । (यदि आप चिंतित हैं कि यह एक निरंतर वितरण नहीं है, तो इसे एक बहुत ही संकीर्ण गाऊसी के साथ मनाएं और परिणाम को संक्षिप्त करें [ 0 , 1 ] : तर्क नहीं बदलेगा।)(1ε)/2xymxymF[0,1]

अब, के लिए किसी भी ख्यात मंझला आकलनकर्ता टी , एक आसान अनुमान से पता चलता है कि [ टी ( एक्स 1 , एक्स 2 , ... , एक्स एन ) ] सख्ती के भीतर है ε की औसत से 2 n मूल्यों टी ( एक्स 1 , x 2 , , X n ) जहाँ x और y के सभी संभावित संयोजनों पर x i भिन्न होता है । हालांकि, हम एम भिन्न हो सकते हैंtE[t(X1,X2,,Xn)]ε2nt(x1,x2,,xn)xixymके बीच x + ε और y - ε , कम से कम का एक परिवर्तन ε (स्थिति 2 और 3 के आधार पर)। इस प्रकार वहाँ एक से मौजूद है मीटर है, और एक इसी वितरण जिस कारण से एफ x , y , मीटर , ε , जिसके लिए इस उम्मीद करता नहीं मंझला, QED बराबर है।x+εyεεmFx,y,m,ε


(+1) अच्छा सबूत। क्या आप इसके साथ आए थे, या यह कुछ ऐसा है जिसे आपको ग्रेड स्कूल से याद किया गया है?
StasK

4
यहां एक और प्रमाण है: अधिकांश बर्नौली यादृच्छिक चर में मंझला 0 या 1 हैN परीक्षणों से अनुमान केवल k के साथ [ 0 , 1 ] n के कोने पर अनुमानक के औसत मूल्यों पर निर्भर करता है , और इन औसत मूल्यों का भार डिग्री n के p में एक बहुपद है । इस एक निष्पक्ष आकलनकर्ता है, तो यह औसत मान होना आवश्यक है 1 किसी के लिए पी > 1 / 2 , और अधिक से अधिक देखते हैं n + 1 के इस तरह के मूल्यों पी01n[0,1]nkpn1p>1/2n+1p, इसलिए यह बहुपद निरंतर होना चाहिए ... लेकिन यह पी के निचले मूल्यों पर 0 होना चाहिए , इसलिए यह वहां भी निष्पक्ष नहीं हो सकता है। 0p
डगलस ज़ारे

1
@ डगलस यह एक महान प्रमाण है। मैं कुछ लोगों को इसकी प्रयोज्यता की गुंजाइश के बारे में एक छोटे से असहज महसूस कर सकते हैं हालांकि, क्योंकि एक Bernoulli चर के लिए औसत कुछ हद तक खास है, इसके दो समर्थन बिंदुओं में से एक के साथ संपाती किया जा रहा है पर शक (छोड़कर जब पी = 1 / 2 )। पाठकों को इसे "पैथोलॉजिकल" घोषित करने के लिए लुभाया जा सकता है और अपने डोमेन पर हर जगह सकारात्मक घनत्व वाले निरंतर वितरण को देखकर ऐसे राक्षसों को बार करने की कोशिश करें। इसलिए मैंने यह दिखाने के लिए ध्यान रखा कि ऐसे प्रयास विफल होंगे। p=1/2
whuber

3

एक पैरामीट्रिक मॉडल के बिना निष्पक्ष अनुमानक खोजना मुश्किल होगा! लेकिन आप बूटस्ट्रैपिंग का उपयोग कर सकते हैं, और उपयोग कर सकते हैं कि लगभग निष्पक्ष अनुमानक प्राप्त करने के लिए अनुभवजन्य मंझला को सही करें।


यदि यह असंभव है, तो क्या यह साबित करना संभव है? उदाहरण के लिए, यदि एक्स 1 , एक्स 2 , ... , एक्स एन से स्वतंत्र नमूने कर रहे हैं एक्स तो एक ही है कि साबित कर सकते हैं ( एक्स 1 , ... , एक्स एन ) नहीं के किसी भी चुनाव के लिए निष्पक्ष हो सकता है ? X1,X2,,XnXf(X1,,Xn)f
रॉबिन्सन

2
मुझे लगता है कि kjetil कह रहा है कि एक nonparametric ढांचे में कोई ऐसा तरीका नहीं है जो हर संभव वितरण के लिए एक निष्पक्ष अनुमान देगा। लेकिन पैरामीट्रिक ढांचे में आप शायद ऐसा कर सकते हैं। एक पक्षपाती नमूना अनुमान को बूटस्ट्रैपिंग करने से आप पूर्वाग्रह का अनुमान लगा सकते हैं और एक बूटस्ट्रैप अनुमान प्राप्त करने के लिए इसे समायोजित कर सकते हैं जो लगभग निष्पक्ष है। गैरपारंपरिक ढांचे में समस्या से निपटने के लिए उनका सुझाव था। यह साबित करना कि निष्पक्ष अनुमान संभव नहीं है, यह भी मुश्किल होगा।
बजे माइकल आर। चेरिक

2
If you really want to try to prove that there do not exist an unbiased estimator, there is a book, Ferguson: "Mathematical Statistics - A Decision Theoretic Approach" which do have some examples of that kind of thing!
kjetil b halvorsen

I imagine that the regularity conditions for the bootstrap will be violated with the distribution functions that whuber considers in his answer. Michael, can you comment?
StasK

2
@Stas जैसा कि मैंने बताया, मेरे कार्यों को बहुत "अच्छा" बनाकर देखा जा सकता है। उन्हें परमाणुओं के बड़े परिमित मिश्रणों के मोल्युलाइज़ेशन के लिए भी सामान्यीकृत किया जा सकता है। इस तरह के वितरण की श्रेणी इकाई अंतराल पर सभी वितरणों में घनी होती है, इसलिए मुझे नहीं लगता कि बूटस्ट्रैप नियमितता यहां शामिल होगी।
whuber

0

I believe quantile regression will give you a consistent estimator of the median. Given the model Y=α+uY=α+u. And you want to estimate med(y)=med(α+u)=α+med(u)med(y)=med(α+u)=α+med(u) since αα is a constant. All you need is the med(u)=0med(u)=0 which should be true so long as you have independent draws. However, as far as unbiasedness, I don't know. Medians are difficult.


See @whuber 's answer
Peter Flom - Reinstate Monica
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.