एक समान वितरण के पैरामीटर का अनुमान लगाना: अनुचित पूर्व?


10

हमारे पास N नमूने हैं, , एक समान वितरण से जहां अज्ञात है। अनुमान डेटा से।Xi[0,θ]θθ

तो, बेय्स नियम ...

f(θ|Xi)=f(Xi|θ)f(θ)f(Xi)

और संभावना है:

f(Xi|θ)=i=1N1θ (संपादित करें: जब सभी लिए , और 0 अन्यथा (धन्यवाद) whuber)0Xiθi

लेकिन बारे में कोई अन्य जानकारी नहीं होने के साथ , ऐसा लगता है कि पूर्व (यानी वर्दी) या (Jeffreys पूर्व?) के लिए आनुपातिक होना चाहिए लेकिन फिर मेरे अभिन्न अंग? 't अभिसरण, और मुझे यकीन नहीं है कि कैसे आगे बढ़ना है। कोई विचार?θ11L[0,]


2
आपकी संभावना गलत है: यह शून्य होगा जब भी सबसे बड़े से कम । θXi
whuber

क्या आप दिखा सकते हैं कि आप कौन से अभिन्न अंग ले रहे हैं?

हाँ, इसलिए, मुझे लगता है कि मैं अभी नहीं जानता कि अनुचित से कैसे निपटना है। उदाहरण के लिए, मैंf[Xi]=Θf(Xi|θ)f(θ)dθ
Will

1
अनुचित पूर्व के लिए, = = और पूर्व आप इसी तरहक्योंकि लगभग निश्चित रूप से, यह निश्चित है कि अभिन्न अभिसरण करेंगे। f[Xi]=Θf(Xi|θ)f(θ)dθmax(Xi)θNdθmax(Xi)1N/(N1)f(θ)1/θmax(Xi)N/N.maxXi>0
whuber

1
बर्नार्डो संदर्भ पीछे पारेतो है - गैर-सूचनात्मक पादरियों की सूची देखें ।
स्टीफन लॉरेंट

जवाबों:


4

इसने कुछ दिलचस्प बहस पैदा की है, लेकिन ध्यान दें कि यह वास्तव में ब्याज के सवाल से बहुत फर्क नहीं पड़ता है। व्यक्तिगत रूप से मुझे लगता है कि क्योंकि The एक पैमाना पैरामीटर है, परिवर्तन समूह तर्क उचित है, जिससे पहले एक अग्रणी होता हैθ

p(θ|I)=θ1log(UL)θ1L<θ<U

इस वितरण में समस्या के rescaling के समान रूप है (संभावना भी rescaling के तहत "अपरिवर्तनीय" बनी हुई है)। इस पूर्व की कर्नेल, कार्यात्मक समीकरण को हल करके प्राप्त की जा सकती है । मान समस्या पर निर्भर करता है, और वास्तव में केवल तभी मायने रखता है जब नमूना आकार बहुत छोटा हो (जैसे 1 या 2)। पीछे की ओर एक छोटा फंदा है, जिसे नीचे दिया गया है:f(y)=y1af(ay)=f(y)L,U

p(θ|DI)=NθN1(L)NUNL<θ<UwhereL=max(L,X(N))
जहां एनएच है आदेश आँकड़ा, या नमूने का अधिकतम मूल्य। हमें अगर हम सेट करें और से हम सरल एक्सप्रेशन ।X(N)
E(θ|DI)=N((L)1NU1N)(N1)((L)NUN)=NN1L(1[LU]N11[LU]N)
UL0E(θ|DI)=NN1X(N)

लेकिन अब मान लें कि हम द्वारा दिए गए एक और सामान्य उपयोग को ध्यान में रखते हैं (ध्यान दें कि हम यह सुनिश्चित करने के लिए सब कुछ उचित है - कोई एकवचन गणित नहीं है )। पीछे वाला ऊपर के समान है, लेकिन साथ द्वारा प्रतिस्थापित किया गया - बशर्ते कि । उपरोक्त गणनाओं को दोहराते हुए, हम सरलीकृत पश्च-माध्य का मतलब हैp(θ|cI)θc1L,UNc+Nc+N0

E(θ|DI)=N+cN+c1X(N)

तो वर्दी पहले ( ) बशर्ते कि (मतलब लिए अनंत हो )। इससे पता चलता है कि यहाँ बहस इस बात की तरह है कि विचरण अनुमान में या को विभाजक के रूप में उपयोग करना है या नहीं ।c=1N1N2X(N)N2N=2NN1

इस मामले से पहले अनुचित वर्दी के उपयोग के खिलाफ एक तर्क यह है कि होने पर पीछे वाला अनुचित है , क्योंकि यह आनुपातिक है । लेकिन यह केवल तभी मायने रखता है जब या बहुत छोटा हो।N=1θ1N=1


1

चूँकि यहाँ उद्देश्य निश्चित रूप से कुछ मान्य और उपयोगी अनुमान प्राप्त करने के लिए है , इसलिए पूर्व वितरण उस जनसंख्या के वितरण के विनिर्देश के अनुरूप होना चाहिए जहाँ से नमूना आता है। इसका किसी भी तरह से मतलब नहीं है कि हम नमूना का उपयोग करने से पहले "गणना" करते हैं - यह पूरी प्रक्रिया की वैधता को कम कर देगा। हम जानते हैं कि जिस जनसंख्या से नमूना आता है वह में से प्रत्येक के लिए एक समान यादृच्छिक चर की आबादी है । यह एक अनुरक्षित धारणा है और उस पूर्व सूचना का हिस्सा है जो हमारे पास है (और इसका सैंपल से कोई लेना-देना नहीं है , यानी इन रैंडम वैरिएबल्स के सबसेट की विशिष्ट प्राप्ति के साथ)।θ[0,θ]

अब लगता है कि इस आबादी के होते , यादृच्छिक चर (जबकि हमारे नमूना के होते हैं की प्रतीति यादृच्छिक परिवर्तनीय)। बनी हुई धारणा हमें बताती है कि mn<mn

maxi=1,...,n{Xi}maxj=1,...,m{Xj}θ

कॉम्पैक्टनेस । फिर हमारे पास जिसे लिखा भी जा सकता है maxi=1,...,n{Xi}XθX

θ=cXc1

में एनआईडी यूनिफ़ॉर्म आरवी के का घनत्व कार्यmaxN[0,θ]

fX(x)=N(x)N1θN

समर्थन के लिए , और शून्य कहीं और। तब का उपयोग करके और परिवर्तन-के-चर सूत्र को लागू करके, हम लिए एक पूर्व वितरण प्राप्त करते हैं जो बनाए रखा धारणा के अनुरूप है: [0,θ]θ=cXθ

fp(θ)=N(θc)N1θN1c=NcNθ1θ[x,]

यदि हम अनुचित रूप से निरंतर निर्दिष्ट नहीं करते हैं तो यह अनुचित हो सकता है । लेकिन हमारा हित लिए एक उचित पश्च होने में निहित है , और इसके अलावा, हम के संभावित मूल्यों (बनाए गए प्रतिबंध से उत्पन्न प्रतिबंध से परे) को प्रतिबंधित नहीं करना चाहते हैं । तो हम अनिर्धारित छोड़ दें । उसके बाद लिखना पीछे हैcθθc
X={x1,..,xn}

f(θX)θNNcNθ1f(θX)=ANcNθ(N+1)

निरंतर कुछ सामान्य करने के लिए। हम चाहते हैं कि हम

Sθf(θX)dθ=1xANcNθ(N+1)dθ=1

ANcN1NθN|x=1A=(cx)N

पीछे के

f(θX)=(cx)NNcNθ(N+1)=N(x)Nθ(N+1)

ध्यान दें कि पूर्व वितरण के अनिर्धारित निरंतर को आसानी से रद्द कर दिया गया है।c

पीछे वाला सभी सूचनाओं को सारांशित करता है कि विशिष्ट नमूना हमें के मूल्य के बारे में दे सकता है । यदि हम लिए एक विशिष्ट मूल्य प्राप्त करना चाहते हैं, तो हम आसानी से पीछे के अनुमानित मूल्य की गणना कर सकते हैं, θθ

E(θX)=xθN(x)Nθ(N+1)dθ=NN1(x)NθN+1|x=NN1x

क्या इस परिणाम में कोई अंतर्ज्ञान है? ठीक है, की संख्या के रूप में की बढ़ जाती है, अधिक संभावना है कि उन के बीच अधिक से अधिक प्राप्ति करीब है और करीब उनके ऊपरी बाध्य, करने के लिए किया जाएगा जो वास्तव में है क्या के पीछे औसत मान - हैं, कहते हैं: दर्शाता है , , लेकिन यदि । इससे पता चलता है कि पूर्व के चयन के बारे में हमारी रणनीति उचित और हाथ में समस्या के अनुरूप थी, लेकिन जरूरी नहीं कि कुछ अर्थों में "इष्टतम" हो।XθθN=2E(θX)=2xN=10E(θX)=109x


1
डेटा पर पहले बेसिंग मेरे लिए गड़बड़ लगता है। आप इस दृष्टिकोण को कैसे सही ठहराते हैं?
whuber

2
मेरे पास इस तथ्य के खिलाफ कुछ भी नहीं है कि आपका पूर्व "सबसे अच्छा" नहीं है। मैंने ऐसा कुछ कहाँ कहा? मैं सिर्फ आपके दृष्टिकोण को समझने की कोशिश कर रहा हूं। मैं इस समानता को अभी तक नहीं समझ पाया हूं। यदि समता में स्थिर है तो क्या अर्थ है कि और दोनों गैर-आयामी हैं? वैसे आप इस तथ्य का उपयोग नहीं करते हैं कि पूर्व की व्युत्पत्ति में , क्या आप? (cc @whuber)cθ=cXXθc1
स्टीफन लॉरेंट

1
और आपके पूर्व का समर्थन डेटा पर निर्भर करता है? ( )θ[x,[
स्टीफन लॉरेंट

3
डेटा पर एक पूर्व निर्भर करता है (भले ही यह केवल समर्थन के माध्यम से हो) गलत लगता है: आप नमूना उत्पन्न होने से पहले अधिकतम नमूने के बारे में नहीं जान सकते हैं । इसके अलावा, आप दावा करते हैं कि दोनों लगभग एक समान समानता है, दोनों और यादृच्छिक (इस प्रकार सहसंबंध )। लेकिन इसका तात्पर्य है कि का पिछला वितरण (जो नमूना दिए गए का सशर्त वितरण है ) पर Dirac द्रव्यमान है । और यह पीछे वितरण के अपने व्युत्पत्ति का खंडन करता है। ... (कोई वर्ण शेष नहीं है ...)θ=cXθX1θθcx
स्टीफन लॉरेंट

1
का पिछला वितरण पर डिराक है का मतलब है कि है । बेयस प्रमेय इसका कारण नहीं है। आप मानकर सब कुछ नष्ट कर देते हैं । इसका मतलब है , इस प्रकार सशर्त के वितरण दिया पर डिराक बड़े पैमाने पर है , जबकि मूल धारणा है कि इस वितरण पर समान वितरण है । θcxθ cxθ=cXX=θ/cXθθ/c(0,θ)
स्टीफन लॉरेंट

0

समान पूर्व वितरण प्रमेय (अंतराल मामला):

"यदि डेटा लिए बाहरी बारे में आपकी जानकारी की समग्रता एकल प्रस्ताव द्वारा कैप्चर की जाती तो आपका एकमात्र संभव तार्किक रूप से-आंतरिक रूप से सुसंगत पूर्व विनिर्देश θD

B={{Possible values for θ}={the interval (a,b)},a<b}
f(θ)=Uniform(a,b)

इस प्रकार, यदि आप वास्तव में उपरोक्त प्रमेय में विश्वास करते हैं, तो आपको पहले विनिर्देश जेफरी के पूर्व के अनुरूप होना चाहिए। "

यूनिफ़ॉर्म प्री डिस्ट्रीब्यूशन प्रमेय का हिस्सा नहीं:

वैकल्पिक रूप से आप अपने पूर्व वितरण को Pareto वितरण के रूप में निर्दिष्ट कर सकते हैं , जो वर्दी के लिए संयुग्म वितरण है, यह जानकर कि आप पश्च वितरण को संयुग्मन द्वारा एक और समान वितरण होगा। हालांकि, यदि आप पेरेटो वितरण का उपयोग करते हैं, तो आपको किसी तरह से पेरेटो वितरण के मापदंडों को निर्दिष्ट करने की आवश्यकता होगी।f(θ)


4
पहले आप कहते हैं "केवल संभव तार्किक रूप से सुसंगत" उत्तर एक समान वितरण है और फिर आप एक विकल्प का प्रस्ताव करने के लिए आगे बढ़ते हैं। यह मुझे अतार्किक और असंगत लगता है :-)।
whuber

2
मैं सहमत नहीं हो सकता। उदाहरण के लिए, सेटजब का PDF लिए का पीडीएफ । लेकिन "प्रमेय" के अनुसार, जिसका pdf उस अंतराल में है। संक्षेप में, हालांकि प्रस्ताव इस बात पर निर्भर नहीं करता है कि समस्या को कैसे मानकीकृत किया जाता है, "प्रमेय" का निष्कर्ष पैरामीटराइजेशन पर निर्भर करता है, जहां यह अस्पष्ट है। B{θ|θ3(a3,b3)}.ΘUniform(a,b),Ψ=Θ31/(3ψ2/3(ba))a3<ψ<b3ΨUniform(a3,b3)1/(b3a3)
whuber

2
BabakP: कोई कैसे कह सकता है कि यह एक प्रमेय है ? एक प्रमेय एक गणितीय प्रमाण के साथ एक गणितीय दावा है। यह "प्रमेय" अधिक उचित रूप से एक "सिद्धांत" के रूप में कहा जाएगा, लेकिन यह समझदार नहीं है क्योंकि यह विरोधाभासी है, जैसा कि @whuber द्वारा दिखाया गया है।
स्टीफन लॉरेंट

2
संदर्भ बाबक के लिए धन्यवाद। मैं यह बताना चाहता हूं कि "प्रूफ स्केच" फर्जी है। ड्रेपर अंतराल को समान रूप से स्थानिक मानों की एक सीमित संख्या में विभाजित करता है और "सीमा में गुजरता है।" कोई भी अंतराल को मानों में विभाजित कर सकता है, जो किसी भी घनत्व को अनुमानित करते हैं, जैसे कि वे पसंद करते हैं और इसी तरह सीमा तक पहुंचते हैं, जिससे पूरी तरह से मनमाना उत्पादन होता है "केवल तार्किक रूप से आंतरिक रूप से संगत पूर्व विनिर्देशों।" इस तरह के सामान - अर्थात्, यह दिखाने के प्रयास में खराब गणित का उपयोग किया जाता है कि गैर-बायेसियन अतार्किक हैं - बायेसियन विश्लेषण को (अवांछनीय रूप से) खराब नाम देता है। (सीसी @ स्टीफन।)
whuber

1
@ स्टीफन कृपया मेरी असंवेदनशीलता ( insensibilité ) को क्षमा करें - मैं यहां दूसरी भाषा में बातचीत करने के आपके कौशल की प्रशंसा करता हूं और जानबूझकर अस्पष्ट शब्दों का उपयोग नहीं करता हूं! बोगस एक विशेषण है जो 200 साल पुराने यूएस स्लैंग शब्द से आता है जो पैसे का जालसाजी करने के लिए एक मशीन का उल्लेख करता है। इस मामले में यह प्रमेयों के प्रतिरूप के लिए एक गणितीय मशीन है :-)।
व्हिबर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.