क्या ऐसे कोई उदाहरण हैं जहाँ बेइज़ियन विश्वसनीय अंतराल स्पष्ट रूप से लगातार विश्वास अंतराल से हीन हैं


81

आत्मविश्वास और विश्वसनीय अंतराल के बीच अंतर पर एक हालिया सवाल ने मुझे उस विषय पर एडविन जेनेस के लेख को फिर से पढ़ना शुरू करने के लिए प्रेरित किया:

जेनेस, ईटी, 1976। `कॉन्फिडेंस थ्योरी बनाम बायेसियन इंटरवल, 'फ़ाउंडेशन ऑफ़ प्रोबेबिलिटी थ्योरी, स्टैटिस्टिकल इन्वेंशन, एंड स्टैटिस्टिकल थ्योरी ऑफ़ साइंस, डब्लूएल हार्पर और सीए हुकर (एड्स), डी। रिडेल, डॉर्ड्रेक्ट, पी। 175; ( pdf )

अमूर्त में, जेनेस लिखते हैं:

... हम विश्वास अंतराल (एक ही तर्क के आधार पर महत्व परीक्षण सहित) सहित छह आम सांख्यिकीय समस्याओं के लिए बायेसियन और रूढ़िवादी समाधान प्रदर्शित करते हैं। हर मामले में, हम पाते हैं कि स्थिति इसके बिल्कुल विपरीत है, अर्थात बायेसियन पद्धति को लागू करने के लिए आसान है और समान या बेहतर परिणाम देता है। वास्तव में, रूढ़िवादी परिणाम केवल तभी संतोषजनक होते हैं जब वे बायेसियन परिणामों के साथ निकटता से (या बिल्कुल) सहमत होते हैं। कोई विपरीत उदाहरण अभी तक निर्मित नहीं हुआ है।

(जोर मेरा)

पेपर 1976 में प्रकाशित हुआ था, इसलिए शायद चीजें आगे बढ़ गई हैं। मेरा सवाल यह है कि क्या ऐसे उदाहरण हैं जहां बार-बार विश्वास अंतराल बेइज़ियन विश्वसनीय अंतराल (जेन्स द्वारा स्पष्ट रूप से की गई चुनौती के अनुसार) से बेहतर है?

गलत पूर्व धारणाओं पर आधारित उदाहरण स्वीकार्य नहीं हैं क्योंकि वे विभिन्न दृष्टिकोणों की आंतरिक स्थिरता के बारे में कुछ नहीं कहते हैं।


21
बल्कि मामूली मान्यताओं के तहत, (ए) बायेसियन अनुमान प्रक्रियाएं स्वीकार्य हैं और (बी) सभी, या लगभग सभी, स्वीकार्य अनुमानकर्ता कुछ पूर्व के संबंध में बायेसियन हैं। इस प्रकार यह कोई आश्चर्य की बात नहीं है कि एक बायेसियन आत्मविश्वास अंतराल "समान या बेहतर परिणाम देता है।" ध्यान दें कि मेरे कथन (ए) और (बी) तर्कसंगत निर्णय सिद्धांत के लगातार विश्लेषण का हिस्सा हैं । जहां फ्रीसाइंस पार्ट कंपनी बायेसियन के साथ गणित या सांख्यिकीय प्रक्रियाओं से अधिक नहीं है, लेकिन किसी विशेष समस्या के लिए पूर्व के अर्थ, औचित्य और सही उपयोग की चिंता करता है।
whuber

1
तो, क्या उपरोक्त टिप्पणी का अर्थ यह है कि ओपी के प्रश्न का उत्तर है 'ऐसे कोई उदाहरण नहीं बनाए जा सकते हैं।' या शायद, कुछ पैथोलॉजिकल उदाहरण मौजूद हैं जो स्वीकार्यता के पीछे की धारणाओं का उल्लंघन करते हैं?

1
@ श्रीकांत: अच्छा सवाल। मुझे लगता है कि जांच शुरू करने के लिए जगह एक ऐसी स्थिति है जहां गैर-बेयस स्वीकार्य अनुमानक हैं - जरूरी नहीं कि एक "रोगविज्ञानी" हो, लेकिन कम से कम एक है जो "विपरीत उदाहरण" खोजने का अवसर प्रदान करता है।
whuber

2
मैं "गलत पूर्व मान्यताओं ..." को कुछ स्पष्टता जोड़ूंगा, यह बताते हुए कि बायेसियन उत्तर और लगातार उत्तर को एक ही जानकारी का उपयोग करना चाहिए , अन्यथा आप केवल दो अलग-अलग प्रश्नों के उत्तर की तुलना कर रहे हैं। यद्यपि महान प्रश्न (मेरे से +1)
प्रायिकतालोगिक

3
पैथोलॉजी या नहीं, यह शायद अपनी तरह का पहला होगा। मैं इन "विकृतियों" के लिए इस उदाहरण को देखने के लिए, बहुत उत्सुक हूँ आमतौर पर एक अच्छा सीखने तत्व उन्हें करने के लिए है
probabilityislogic

जवाबों:


52

मैंने पहले कहा था कि मुझे इस सवाल का जवाब देना होगा, इसलिए यहाँ जाता है ...

Jaynes अपने पेपर में थोड़ा शरारती था कि एक अतिविशिष्ट आत्मविश्वास अंतराल को एक अंतराल के रूप में परिभाषित नहीं किया गया है जहां हम उच्च (निर्दिष्ट) संभावना के साथ आंकड़े के सही मूल्य की उम्मीद कर सकते हैं, इसलिए यह बहुत आश्चर्यजनक नहीं है कि विरोधाभास अगर वे के रूप में अगर वे व्याख्या कर रहे हैं उठता है। समस्या यह है कि यह अक्सर व्यवहार में विश्वास के अंतराल का उपयोग किया जाता है, एक अंतराल के रूप में अत्यधिक सही मूल्य (जो हम अपने डेटा के नमूने से अनुमान लगा सकते हैं) को शामिल करने की संभावना है।

मेरे लिए मुख्य मुद्दा यह है कि जब किसी प्रश्न का उत्तर दिया जाता है, तो उस प्रश्न का सीधा उत्तर देना सबसे अच्छा होता है। चाहे बायेसियन विश्वसनीय अंतराल लगातार विश्वासवादी अंतराल से भी बदतर हैं, वास्तव में क्या सवाल पूछा गया था पर निर्भर करता है। यदि प्रश्न पूछा गया था:

(ए) "मुझे एक अंतराल दें जहां संभाव्यता का सही मूल्य संभाव्यता पी के साथ निहित है", तो ऐसा प्रतीत होता है कि एक एक्सीडेंटिस्ट वास्तव में उस प्रश्न का उत्तर नहीं दे सकता है (और यह उस तरह की समस्याओं का परिचय देता है, जो जेन्स अपने पेपर में चर्चा करते हैं), लेकिन ए बेयसियन कर सकते हैं, यही वजह है कि जेनेस द्वारा दिए गए उदाहरणों में लगातार विश्वास अंतराल से बेएज़ियन विश्वसनीय अंतराल बेहतर है। लेकिन यह केवल कारण है कि यह लगातार व्यक्ति के लिए "गलत सवाल" है।

(बी) "मुझे एक अंतराल दें जहां, प्रयोग कई बार दोहराया गया था, आंकड़े का सही मूल्य पी * 100% के अंतराल पर झूठ होगा" तो लगातार जवाब सिर्फ वही है जो आप चाहते हैं। बायेसियन भी इस सवाल का सीधा जवाब देने में सक्षम हो सकता है (हालांकि यह केवल स्पष्ट विश्वसनीय अंतराल नहीं हो सकता है)। इस सवाल पर व्हिबर की टिप्पणी से यही पता चलता है।

इसलिए अनिवार्य रूप से, यह प्रश्न को सही ढंग से निर्दिष्ट करने और उत्तर को ठीक से समझने की बात है। यदि आप प्रश्न (ए) पूछना चाहते हैं, तो बायेसियन विश्वसनीय अंतराल का उपयोग करें, यदि आप प्रश्न पूछना चाहते हैं (बी) तो एक लगातार विश्वास अंतराल का उपयोग करें।


2
अच्छी तरह से कहा, विशेष रूप से एक सीआई वास्तव में किस सवाल का जवाब देता है। हालांकि, जेनेस के लेख में, उन्होंने उल्लेख किया है कि CI की (और सबसे अक्सर प्रक्रियाओं की) अच्छी तरह से काम करने के लिए डिज़ाइन किया गया है "लंबे समय में" (उदाहरण के लिए, आप कितनी बार या "बड़े n वितरण के लिए देखते हैं " लगभग ... "लगातार तरीकों में धारणाएं?), लेकिन कई ऐसी प्रक्रियाएं हैं जो ऐसा कर सकती हैं। मुझे लगता है कि यह वह जगह है जहां बार-बार की जाने वाली तकनीकों (संगति, पूर्वाग्रह, अभिसरण, आदि) का उपयोग विभिन्न बायेसियन प्रक्रियाओं का आकलन करने के लिए किया जा सकता है, जिनके बीच निर्णय लेना मुश्किल है। n
प्रोबेबिलिसलॉजिक

1
"Jaynes अपने पेपर में थोड़ा शरारती था ..." मुझे लगता है कि Jaynes बनाने की कोशिश कर रहा था (या जिस बिंदु से मैंने इसे लिया था) वह है कि कॉन्फिडेंस इंटरवल्स का उपयोग प्रश्न का उत्तर देने के लिए किया जाता है) a बड़ी संख्या में मामलों (मैं अनुमान लगाता हूं कि जो कोई भी केवल लगातार प्रशिक्षण प्राप्त करता है वह सीआई के प्रश्न का उत्तर देने के लिए उपयोग करेगा) और वे सोचेंगे कि वे एक उपयुक्त उत्तरवादी उत्तर हैं)
संभावना

2
हां, "थोड़ा शरारती" से मेरा मतलब सिर्फ इतना था कि जेनेस इस बात को गलत तरीके से टकराव (लेकिन साथ ही मनोरंजक) तरीके (या कम से कम यह है कि मैं इसे कैसे पढ़ता हूं) में बना रहा था। लेकिन अगर वह नहीं होता तो शायद इसका कोई असर नहीं होता।
डिक्रान मार्सुपियल

23

यह एक "फेलेशेड आउट" उदाहरण है, जिसे लैरी वासरमैन द्वारा लिखी गई एक पुस्तक में दिया गया है, पृष्ठ 216 ( 12.8 ताकत और बेइज़नेस की कमजोरियों के आंकड़े )। मैं मूल रूप से वास्सरमैन को अपनी पुस्तक 1 ​​में क्या प्रदान करता हूं) एक फेंक लाइन के बजाय वास्तव में क्या हो रहा है, इसके लिए एक स्पष्टीकरण; 2) सवाल का लगातार जवाब, जो वास्समैन आसानी से नहीं देता है; और 3) एक प्रदर्शन जो समान जानकारी का उपयोग करके गणना की गई समान विश्वास एक ही समस्या से ग्रस्त है।

इस उदाहरण में, वह निम्नलिखित स्थिति बताता है

  1. एक अवलोकन, एक्स, एक नमूना वितरण के साथ:(X|θ)N(θ,1)
  2. का पूर्व वितरण (वह वास्तव में प्रसरण के लिए एक सामान्य का उपयोग करता है , लेकिन उसका चित्र माहिर है )τ 2 τ 2 = 1(θ)N(0,1)τ2τ2=1

वह तब यह दिखाने के लिए जाता है कि, इस सेट-अप में बायेसियन 95% विश्वसनीय अंतराल का उपयोग करके अंततः 0% लगातार कवरेज होता है जब का वास्तविक मूल्य मनमाने ढंग से बड़ा हो जाता है। उदाहरण के लिए, वह कवरेज का एक ग्राफ (P218) प्रदान करता है, और आंख से जांच करता है, जब θ का वास्तविक मूल्य 3 है, तो कवरेज लगभग 35% है। वह फिर कहता है:θθ

... इस सब से हमें क्या निष्कर्ष निकालना चाहिए? महत्वपूर्ण बात यह समझना है कि लगातार और बेयसियन तरीके अलग-अलग सवालों के जवाब दे रहे हैं। एक रियायती तरीके से डेटा के साथ पूर्व मान्यताओं को संयोजित करने के लिए, बायेसियन इनविज़न का उपयोग करें। गारंटीकृत लंबी अवधि के प्रदर्शन के साथ प्रक्रियाओं का निर्माण करने के लिए, जैसे कि आत्मविश्वास अंतराल, लगातार तरीकों का उपयोग करें ... (P217)

और फिर बिना किसी विच्छेदन या स्पष्टीकरण के आगे बढ़ता है कि बायेसियन पद्धति ने स्पष्ट रूप से इतना बुरा प्रदर्शन क्यों किया। इसके अलावा, वह लगातार दृष्टिकोण से जवाब नहीं देता है, "लंबे समय तक चलने" के बारे में सिर्फ एक व्यापक ब्रश का बयान है - एक शास्त्रीय राजनीतिक रणनीति (अपनी ताकत + दूसरों की कमजोरी पर जोर दें, लेकिन कभी भी इस तरह की तुलना न करें)।

मैं दिखाऊंगा कि समस्या τ = 1 के रूप में किस तरह से अक्सर / रूढ़िवादी शब्दों में तैयार की जा सकती है, और फिर दिखाती है कि आत्मविश्वास अंतराल का उपयोग करने वाला परिणाम ठीक उसी तरह का उत्तर देता है जैसा कि बायेसियन एक । इस प्रकार विश्वास अंतराल का उपयोग करके बायेसियन (वास्तविक या कथित) में किसी भी दोष को ठीक नहीं किया जाता है।τ=1

ठीक है, तो यहाँ जाता है। पहला सवाल मैं पूछने के ज्ञान की क्या राज्य पहले से वर्णन किया गया है है ? यदि एक "अज्ञानी" के बारे में था θ , इस व्यक्त करने के लिए तो उपयुक्त तरीका है पी ( θ ) α 1 । अब मान लीजिए कि हम अनभिज्ञ थे, और हमने देखा Y ~ एन ( θ , 1 ) , की स्वतंत्र रूप से एक्स । क्या के लिए हमारे पीछे हैं θ हो सकता है?θN(0,1)θp(θ)1YN(θ,1)Xθ

p(θ|Y)p(θ)p(Y|θ)exp(12(Yθ)2)

(θ|Y)N(Y,1)X00X

θx¯=0+X2=X2

(x¯|θ)N(θ,12)

(1α)%

12X±Zα/212

(1α)%θ

cX±cZα/2

c=τ21+τ2τ2=1c=12

12X±Zα/212

p(θ)1X±Zα/2)

X=00θ=4X0θ=4। वास्तव में आप यह दिखा सकते हैं कि यह उदाहरण मूल रूप से यह दिखाने के बराबर है कि अंकगणित माध्य का एक बिना प्रभाव वाला फ़ंक्शन है।

τ=1τ2=1N (N=0,1,2,3,)NX0Xθ0θ0


1
विश्लेषण के लिए धन्यवाद। AFAICS यह एक गलत (सूचनात्मक) पूर्व धारणा के कारण होने वाली समस्या का एक उदाहरण है और बेयसियन दृष्टिकोण की आंतरिक स्थिरता के बारे में कुछ नहीं कहता है?
डिक्रान मार्सुपियल

1
0θ

0X0XθθX0X0θθ
संभाव्यताविषयक

10

कीथ विंस्टीन,

EDIT: बस स्पष्ट करने के लिए, यह उत्तर केथ विंस्टीन उत्तर में राजा पर दिए गए उदाहरण का वर्णन करता है जिसमें क्रूर सांख्यिकीय खेल है। बायेसियन और फ़्रीक्वेंटिस्ट दोनों एक ही जानकारी का उपयोग करते हैं, जो अंतराल का निर्माण करते समय निष्पक्ष और अनुचित सिक्कों की संख्या की जानकारी को अनदेखा करना है। यदि इस जानकारी को नजरअंदाज नहीं किया जाता है, तो कॉन्फिडेंशियल अंतराल के निर्माण में नमूनाकरण वितरण के रूप में, एक्सीलेंट को एकीकृत बीटा-बिनोमियल लिक्लिएलिटी का उपयोग करना चाहिए, जिस स्थिति में क्लॉपर-पियर्सन कॉन्फिडेंस इंटरवल उपयुक्त नहीं है, और इसे संशोधित करने की आवश्यकता है। बायसीयन समाधान में एक समान समायोजन होना चाहिए।

EDIT: मैंने क्लॉपर पियर्सन इंटरवल के शुरुआती उपयोग को भी स्पष्ट किया है।

संपादित करें: अफसोस, मेरा अल्फा गलत तरीका है, और मेरा क्लॉपर पियर्सन अंतराल गलत है। मेरे हबलर ने @whuber से माफी मांगी, जिन्होंने इसे ठीक से बताया, लेकिन मैं शुरू में किस से असहमत था और नजरअंदाज कर दिया।

Clopper Pearson मेथड का उपयोग करना CI बहुत अच्छा है

θ

[Pr(Bi(1,θ)X)α2][Pr(Bi(1,θ)X)α2]

X=1Pr(Bi(1,θ)1)=θPr(Bi(1,θ)1)=1θα21α2X=1X=0Pr(Bi(1,θ)0)=1Pr(Bi(1,θ)0)=1θ1θα2θ1α2X=0[0.025,1]X=1[0,0.975]X=0

इस प्रकार, क्लॉपर पियर्सन कॉन्फिडेंस इंटरवल का उपयोग करने वाला कभी भी सिर पर हाथ नहीं रखेगा । अंतराल का अवलोकन करने पर, यह मूल रूप से पूरे पैरामीटर स्थान है। लेकिन सीपी अंतराल एक कथित रूप से 95% अंतराल को 100% कवरेज देकर ऐसा कर रहा है! मूल रूप से, फ़्रीक्वेंटर्स 95% विश्वास अंतराल देकर "धोखा" देता है, उससे अधिक / उसे देने के लिए कहा गया था (हालांकि ऐसी स्थिति में कौन धोखा नहीं देगा? यदि यह मैं होता, तो मैं पूरा देता [0] 1] अंतराल)। यदि राजा ने सटीक 95% सीआई के लिए कहा , तो यह लगातार पद्धति विफल हो जाएगी, भले ही वास्तव में क्या हुआ हो (शायद एक बेहतर मौजूद है)।

Bayesian अंतराल के बारे में क्या? (विशेष रूप से उच्चतम पश्चगामी देशांतर (HPD) बायेसियन अंतराल)

(θ|X)Beta(1+X,2X)Pr(θθe|x=1)=1(θe)2Pr(θθe|x=0)=1(1θe)2θe=0.050.224X=1θe=10.050.776X=0(0,0.776)X=0(0.224,1)X=1

इस प्रकार बेयसियन को उसके एचपीडी विश्वसनीय अंतराल के लिए दोषी माना जाएगा जब वह खराब सिक्का प्राप्त करता है और खराब सिक्का ऊपर की ओर आता है जो कि अवसर के साथ होगा।11012+1×1100

0.1

0.0250.975

एक वास्तविक 95% विश्वास अंतराल को उद्धृत करने के लिए , फिर परिभाषा के अनुसार मनाया अंतराल के कुछ मामले (यानी कम से कम एक) होने चाहिए जिनमें पैरामीटर का सही मूल्य नहीं है । अन्यथा, कोई 95% टैग को कैसे सही ठहरा सकता है? क्या इसे केवल ९ ०%, ५०%, २०%, या यहाँ तक कि ०% के अंतराल के लिए वैध या अमान्य नहीं कहा जाएगा?

मैं यह नहीं देखता कि केवल "मानार्थ प्रतिबंध के बिना" यह वास्तव में 95% या अधिक का मतलब है "संतोषजनक है। इसका कारण यह है कि स्पष्ट गणितीय समाधान पूरे पैरामीटर स्थान है, और समस्या तुच्छ है। मान लीजिए मुझे 50% CI चाहिए? यदि यह केवल झूठे नकारात्मक को बांधता है तो संपूर्ण पैरामीटर स्पेस केवल इस मानदंड का उपयोग करके एक वैध CI है।

100%X=0100×1012+9101012+1%>95%X=1

समापन में, अनिश्चितता के अंतराल के लिए पूछना थोड़ा अजीब लगता है, और फिर उस वास्तविक मूल्य का उपयोग करके उस अंतराल का मूल्यांकन करें जिसके बारे में हम अनिश्चित थे। आत्मविश्वास और विश्वसनीय अंतराल के लिए एक "निष्पक्ष" तुलना, मेरे लिए अंतराल के साथ दिए गए अनिश्चितता के बयान की सच्चाई की तरह लगती है ।


α1α

1012α1α

1012α1α1α21θθ

क्या आपका मतलब @Keith विंस्टीन के जवाब से है?
whuber

@whuber, हाँ मेरा मतलब है किथ वाइनस्टीन का जवाब।
संभाव्यताविषयक

9

समस्या आपके वाक्य से शुरू होती है:

गलत पूर्व धारणाओं पर आधारित उदाहरण स्वीकार्य नहीं हैं क्योंकि वे विभिन्न दृष्टिकोणों की आंतरिक स्थिरता के बारे में कुछ नहीं कहते हैं।

हाँ, आप कैसे जानते हैं कि आपका पूर्व सही है?

Phylogeny में बेयेसियन के अनुमान के मामले को लें। कम से कम एक परिवर्तन की संभावना सूत्र द्वारा विकासवादी समय (शाखा लंबाई टी) से संबंधित है

P=1e43ut

यू के साथ प्रतिस्थापन की दर है।

अब आप डीएनए अनुक्रमों की तुलना के आधार पर विकास का एक मॉडल बनाना चाहते हैं। संक्षेप में, आप एक पेड़ का अनुमान लगाने की कोशिश करते हैं जिसमें आप डीएनए अनुक्रमों के बीच बदलाव की मात्रा को यथासंभव करीब से मॉडल करने की कोशिश करते हैं। पी ऊपर दी गई शाखा पर कम से कम एक बदलाव का मौका है। विकासवादी मॉडल किसी भी दो न्यूक्लियोटाइड के बीच परिवर्तन की संभावनाओं का वर्णन करते हैं, और इन विकासवादी मॉडल से अनुमान फ़ंक्शन को व्युत्पन्न किया जाता है, या तो पी के साथ एक पैरामीटर के रूप में या टी के साथ एक पैरामीटर के रूप में।

आपको कोई समझदार ज्ञान नहीं है और आपने पी के लिए एक फ्लैट चुना है। यह स्वाभाविक रूप से टी के लिए एक तेजी से घटने से पहले का तात्पर्य है। (यह तब और भी अधिक समस्याग्रस्त हो जाता है यदि आप t पर एक फ्लैट सेट करना चाहते हैं। p पर पूर्व में निहित यह बहुत हद तक इस बात पर निर्भर करता है कि आपने कहाँ t की सीमा काट दी है।)

सिद्धांत रूप में, टी अनंत हो सकती है, लेकिन जब आप एक अनंत सीमा की अनुमति देते हैं, तो इसके घनत्व फ़ंक्शन के तहत क्षेत्र अनंत के बराबर होता है, इसलिए आपको पूर्व के लिए एक ट्रंकेशन बिंदु को परिभाषित करना होगा। अब जब आपने ट्रंकेशन बिंदु को पर्याप्त रूप से बड़ा चुना है, तो यह साबित करना मुश्किल नहीं है कि विश्वसनीय अंतराल के दोनों छोर उठते हैं, और एक निश्चित बिंदु पर वास्तविक मूल्य किसी भी अधिक अंतराल में निहित नहीं है। जब तक आपके पास पहले के बारे में बहुत अच्छा विचार नहीं है, बायेसियन विधियों को अन्य तरीकों के बराबर या श्रेष्ठ होने की गारंटी नहीं है।

रेफरी: जोसेफ फेल्सेंस्टीन: Inlog Phylogenies, अध्याय 18

एक साइड नोट पर, मैं उस बायेसियन / फ़्रीक्वेंटिस्ट झगड़े से बीमार हो रहा हूं। वे दोनों अलग फ्रेमवर्क हैं, और न ही पूर्ण सत्य है। शास्त्रीय उदाहरण प्रो बायेसियन तरीके हमेशा संभावना गणना से आते हैं, और कोई भी व्यक्ति अक्सर उनका विरोध नहीं करेगा। बायेसियन विधियों के खिलाफ शास्त्रीय तर्क हमेशा एक पूर्व की मनमानी पसंद को शामिल करता है। और समझदार पुजारी निश्चित रूप से संभव हैं।

यह सभी सही समय पर किसी भी विधि के सही उपयोग के लिए उबालता है। मैंने बहुत कम दलीलें / तुलनाएँ देखी हैं जहाँ दोनों विधियों को सही तरीके से लागू किया गया था। किसी भी तरीके की मान्यताओं को बहुत कम आंका जाता है और बहुत बार अनदेखा कर दिया जाता है।

संपादित करें: स्पष्ट करने के लिए, समस्या इस तथ्य में निहित है कि पी पर आधारित अनुमान बेयिनियन फ्रेमवर्क में टी पर आधारित अनुमान से भिन्न होता है जब अनइन्फॉर्मेटिव पादरियों के साथ काम करना (जो कई मामलों में एकमात्र संभव समाधान है)। यह phylogenetic अनुमान के लिए एमएल ढांचे में सच नहीं है। यह एक गलत पूर्व की बात नहीं है, यह विधि के लिए अंतर्निहित है।


3
बायेसियन और लगातार आंकड़ों के बीच मतभेदों में दिलचस्पी के बिना संभव है कि यह झगड़ा हो। दोषों के साथ-साथ पसंदीदा दृष्टिकोण के लाभों को जानना महत्वपूर्ण है। मैंने विशेष रूप से पुजारियों को बाहर रखा है क्योंकि यह रूपरेखा के साथ कोई समस्या नहीं है, लेकिन सीजीओ की बात है। यही बात आवृत्तियों के आंकड़ों पर भी लागू होती है, उदाहरण के लिए डेटा के लिए गलत पैरामीट्रिक वितरण और गलत वितरण। यह केवल विशेष पद्धति के लिए अक्सर होने वाली कार्यप्रणाली की आलोचना नहीं होगी। BTW, मुझे अनुचित पुजारियों के साथ कोई विशेष समस्या नहीं है।
डिक्रान मार्सुपियल

3
Jaynes पहला उदाहरण: उसके दाहिने दिमाग में कोई भी सांख्यिकीविद् कभी भी उस डेटासेट पर F-परीक्षण और T-परीक्षण का उपयोग नहीं करेगा। इसके अलावा, वह दो-पूंछ वाले परीक्षण की तुलना P (b> a) से करता है, जो कि एक ही परिकल्पना परीक्षण नहीं है। इसलिए उसका उदाहरण उचित नहीं है, जिसे वह अनिवार्य रूप से बाद में स्वीकार करता है। उसके आगे, आप "रूपरेखा" की तुलना नहीं कर सकते। हम किस बारे में बात कर रहे हैं? ML, REML, LS, दंडित तरीके, ...? गुणांक, सांख्यिकी, भविष्यवाणियों के लिए अंतराल, ...? आप यह भी पूछ सकते हैं कि क्या लूथरन सेवा शिया सेवाओं के समकक्ष या श्रेष्ठ है। वे उसी भगवान के बारे में बात करते हैं।
जोरिस मेय्स

क्या आप स्पष्ट कर सकते हैं कि आपका डेटा क्या है और आप अपने मॉडल में किन मापदंडों का आकलन कर रहे हैं? मैं इस बिंदु पर थोड़ा भ्रमित हूं। सूत्र को केंद्र में रखने के लिए आप $ के बजाय $ $ का उपयोग कर सकते हैं? अभी फ़ॉन्ट का आकार बहुत छोटा है।

@ श्रीकांत: फेल्सेंस्टिन्स पुस्तक में उदाहरण डीएनए विकास के लिए एक जुकस-कैंटर मॉडल पर आधारित है। डेटा डीएनए अनुक्रम है। आप अपने अनुक्रम में परिवर्तन की संभावना का अनुमान लगाना चाहते हैं, जो उल्लिखित सूत्र के आधार पर आपकी शाखा की लंबाई से संबंधित है। शाखा की लंबाई को विकास के समय के रूप में परिभाषित किया गया है: परिवर्तनों का मौका जितना अधिक होगा, उतना अधिक समय जो पूर्वज और वर्तमान स्थिति के बीच गुजरता है। क्षमा करें, लेकिन मैं केवल एक पद पर एमएल और बेयसियन फाइटोलैनेटिक इंजेक्शन के पीछे पूरे सिद्धांत को संक्षेप में प्रस्तुत नहीं कर सकता। फेलसेनस्टीन को इसके लिए आधी किताब की जरूरत थी।
जोरिस मेय्स

मुझे लगता है कि मैं आपको स्पष्ट करना चाहता था कि आपके समीकरण में कौन से चर डेटा थे और कौन से पैरामीटर थे क्योंकि यह आपके पोस्ट से विशेष रूप से मेरे जैसे किसी बाहरी व्यक्ति के लिए स्पष्ट नहीं था। मैं अभी भी खो गया हूं, लेकिन मुझे लगता है कि मुझे अधिक जानने के लिए पुस्तक पढ़ने की आवश्यकता होगी।

8

बार-बार विश्वास अंतराल झूठी सकारात्मक (टाइप I त्रुटियों) की दर को बाध्य करते हैं, और गारंटी देते हैं कि उनकी कवरेज सबसे खराब स्थिति में भी विश्वास पैरामीटर द्वारा नीचे की ओर बंधी होगी। Bayesian विश्वसनीयता अंतराल नहीं है।

इसलिए यदि आप जिस चीज की परवाह करते हैं वह झूठी सकारात्मक है और आपको उन्हें बांधने की आवश्यकता है, तो आत्मविश्वास अंतराल वह दृष्टिकोण है जिसे आप उपयोग करना चाहते हैं।

उदाहरण के लिए, मान लें कि आपके पास 100 दरबारियों और दरबारियों के साथ एक दुष्ट राजा है और वह उनके साथ एक क्रूर सांख्यिकीय खेल खेलना चाहता है। राजा के पास एक ट्रिलियन फेयर सिक्कों का एक बैग होता है, साथ ही एक अनुचित सिक्का होता है जिसके प्रमुख होने की संभावना 10% होती है। वह निम्नलिखित खेल का प्रदर्शन करने जा रहा है। सबसे पहले, वह बैग से बेतरतीब ढंग से एक सिक्का खींचेगा।

फिर सिक्के को 100 लोगों के एक कमरे के आसपास से गुजारा जाएगा और हर एक को निजी तौर पर उस पर एक प्रयोग करने के लिए मजबूर किया जाएगा, और फिर प्रत्येक व्यक्ति 95% अनिश्चितता अंतराल को बताएगा कि वे क्या सोचते हैं कि सिक्के के प्रमुख संभावना है।

जो कोई एक अंतराल देता है जो एक झूठे सकारात्मक का प्रतिनिधित्व करता है - यानी एक अंतराल जो सिर की संभावना के वास्तविक मूल्य को कवर नहीं करता है - को माथे लगाया जाएगा।

यदि हम सिक्के के वजन के / पश्च-वितरण / संभाव्यता वितरण फ़ंक्शन को व्यक्त करना चाहते थे, तो निश्चित रूप से एक विश्वसनीयता अंतराल है जो ऐसा करता है। उत्तर हमेशा अंतराल [0.5, 0.5] परिणाम के बावजूद होगा। यहां तक ​​कि अगर आप शून्य सिर या एक सिर फ्लिप करते हैं, तो आप अभी भी कहेंगे [0.5, 0.5] क्योंकि यह बहुत अधिक संभावना है कि राजा ने एक उचित सिक्का खींचा और आपके पास 1/1024 दिन एक पंक्ति में दस सिर हो गए , इससे राजा ने अनुचित सिक्का खींचा।

तो यह दरबारियों और दरबारियों के लिए उपयोग करने के लिए एक अच्छा विचार नहीं है! क्योंकि जब अनुचित सिक्का खींचा जाता है, तो पूरा कमरा (सभी 100 लोग) गलत होगा और वे सभी का सिर काट लेंगे।

इस दुनिया में जहां सबसे महत्वपूर्ण चीज झूठी सकारात्मकता है, जो हमें चाहिए वह एक पूर्ण गारंटी है कि झूठी सकारात्मक की दर 5% से कम होगी, चाहे जो सिक्का खींचा जाए। तब हमें विश्वास अंतराल का उपयोग करने की आवश्यकता होती है, जैसे कि Blyth-Still-Casella या Clopper-Pearson, जो काम करता है और पैरामीटर के सही मूल्य के बावजूद कम से कम 95% कवरेज प्रदान करता है , यहां तक ​​कि सबसे खराब स्थिति में भी । यदि हर कोई इस पद्धति का उपयोग करता है, तो कोई बात नहीं कि कौन सा सिक्का खींचा जाता है, दिन के अंत में हम गारंटी दे सकते हैं कि गलत लोगों की अपेक्षित संख्या पांच से अधिक नहीं होगी।

तो मुद्दा यह है: यदि आपकी कसौटी पर झूठे सकारात्मक (या समकक्ष, कवरेज की गारंटी) को बाध्य करने की आवश्यकता होती है, तो आप एक आत्मविश्वास अंतराल के साथ जाते हैं। यही वे करते हैं। विश्वसनीयता अंतराल अनिश्चितता व्यक्त करने का एक अधिक सहज तरीका हो सकता है, वे लगातार विश्लेषण से बहुत अच्छा प्रदर्शन कर सकते हैं, लेकिन जब आप इसके लिए पूछते हैं, तो आपको झूठी सकारात्मक चीजों पर बाध्य गारंटी प्रदान नहीं करने जा रहे हैं।

(बेशक अगर आप भी झूठी नकारात्मक बातों की परवाह करते हैं, तो आपको एक ऐसी विधि की आवश्यकता होगी जो उन लोगों के बारे में भी गारंटी दे ...)


6
विचार के लिए भोजन, हालांकि विशेष उदाहरण अनुचित है क्योंकि लगातार दृष्टिकोण को झूठी-सकारात्मक और झूठी-नकारात्मक लागतों की सापेक्ष लागतों पर विचार करने की अनुमति है, लेकिन बायेसियन दृष्टिकोण नहीं है। बेयसियन निर्णय सिद्धांत के अनुसार करने के लिए सही बात [0,1] का अंतराल देना है क्योंकि झूठे-नकारात्मक के साथ कोई दंड नहीं जुड़ा है। इस प्रकार चौखटे की तुलना में एक तरह से, किसी भी बेइज़ियन को कभी भी नहीं मारा जाएगा। हालांकि झूठी-सकारात्मक बातें करने के बारे में मुद्दा मुझे एक दिशा देता है जिसमें जेनेस की चुनौती का जवाब तलाशना है।
डिक्रान मार्सुपियल

1
यह भी ध्यान दें कि यदि चयनित सिक्का अक्सर पर्याप्त रूप से फ़्लिप किया जाता है, तो अंततः बेयसियन विश्वास अंतराल को विशेष सिक्के के पूर्व के बजाय सिर के लंबे रन आवृत्ति पर केंद्रित किया जाएगा। यदि मेरा जीवन एक सिर की सच्ची संभावना वाले अंतराल पर निर्भर करता है तो मैं सिर्फ एक बार सिक्का नहीं फँसाता!
डिक्रान मार्सुपियल

1
हालांकि इसके बारे में थोड़ा और अधिक होने के बाद, यह उदाहरण अमान्य है क्योंकि सफलता को मापने के लिए उपयोग की जाने वाली कसौटी राजा द्वारा प्रस्तुत प्रश्न द्वारा निहित नहीं है। समस्या "कोई बात नहीं है कि कौन सा सिक्का खींचा जाता है", एक खंड जो पक्षपाती सिक्के की दुर्लभता के बारे में पूर्व ज्ञान का उपयोग करने वाले किसी भी तरीके की यात्रा करने के लिए डिज़ाइन किया गया है। जैसा कि होता है, बायसेनस डायरियों (जैसे पीएसी सीमाएं) को प्राप्त कर सकता है और अगर पूछा जाए तो उसने ऐसा किया होगा, और मुझे संदेह है कि उत्तर क्लॉपर-पीयरसन अंतराल के समान होगा। एक निष्पक्ष परीक्षा होने के लिए, एक ही जानकारी दोनों दृष्टिकोणों को दी जानी चाहिए।
डिक्रान मार्सुपियल

1
डिक्रान, "बायेसियन" और "फ़्रीक्वेंसीज़" की आवश्यकता नहीं है। वे दर्शन के असंगत स्कूल नहीं हैं, जिसमें से केवल एक के लिए सदस्यता ले सकते हैं! वे गणितीय उपकरण हैं जिनकी प्रभावकारिता संभावना सिद्धांत के सामान्य ढांचे में प्रदर्शित की जा सकती है। मेरा कहना है कि यदि आवश्यकता गलत सकारात्मकता पर पूर्णतया आबद्ध है, तो कोई फर्क नहीं पड़ता कि पैरामीटर का सही मूल्य है, फिर भी एक विश्वास अंतराल वह विधि है जो इसे पूरा करती है। बेशक हम सभी संभावना के एक ही स्वयंसिद्ध पर सहमत हैं और एक ही जवाब कई तरीकों से प्राप्त किया जा सकता है।
कीथ विंस्टीन

1
[0.1,0.5]0.10.5100%95%
probabilityislogic

0

क्या ऐसे उदाहरण हैं जहां बार-बार विश्वास अंतराल स्पष्ट रूप से बायेसियन विश्वसनीय अंतराल (जेनेस द्वारा किए गए चुनौती के अनुसार) से बेहतर है।

θ10θ1θ

बर्नार्डो ने वैज्ञानिक संदर्भ [और यहां तक ​​कि एक "संदर्भ विश्वसनीय अंतराल" ( बर्नार्डो - उद्देश्य विश्वसनीय क्षेत्रों ) के लिए एक मानक के रूप में उपयोग करने के लिए "संदर्भ पूर्व" का प्रस्ताव रखा । यह मानते हुए "" बायेसियन दृष्टिकोण है, अब सवाल यह है: जब एक अंतराल एक दूसरे से बेहतर है? बायेसियन अंतराल के लगातार गुण हमेशा इष्टतम नहीं होते हैं, लेकिन न तो "लगातार" अंतराल के बायेसियन गुण हैं
(वैसे, "लगातार अंतराल" क्या है?)


मैं अटकलें लगा रहा हूं, लेकिन मुझे संदेह है कि यह उत्तर उसी उपचार को प्राप्त करने के लिए बाध्य है जो दूसरों के पास है। कोई बस यह तर्क देगा कि यह बायेसियन प्रक्रियाओं की कुछ अंतर्निहित कमजोरी का नहीं बल्कि पहले की खराब पसंद का मुद्दा है, जो मेरे विचार में आंशिक रूप से एक वैध आलोचना को मिटाने की कोशिश करता है।
कार्डिनल

@ कार्डिनल की टिप्पणी काफी सही है। यहाँ पहले से ही परिमाण के एक क्रम से बंद है, जिससे आलोचना बहुत कमजोर है। आवृत्तियों के लिए पूर्व सूचना मायने रखती है; किसी को पता है कि एक प्राथमिकताओं को यह निर्धारित करना चाहिए कि क्या अनुमान और परीक्षण आँकड़े उपयोग किए जाते हैं। यदि ये विकल्प परिमाण के एक आदेश द्वारा गलत जानकारी पर आधारित हैं, तो खराब परिणाम की उम्मीद की जानी चाहिए; Bayesian या लगातार होना इसमें नहीं आता है।
अतिथि

मेरा "उदाहरण" मेरे उत्तर का महत्वपूर्ण हिस्सा नहीं था। लेकिन पूर्व का एक अच्छा विकल्प क्या है? पूर्व की कल्पना करना आसान है जिनके समर्थन में सही पैरामीटर है लेकिन पीछे नहीं है, इसलिए लगातार अंतराल बेहतर है?
स्टीफन लॉरेंट

कार्डिनल और अतिथि सही हैं, मेरे प्रश्न में स्पष्ट रूप से शामिल है "गलत पूर्व धारणाओं पर आधारित उदाहरण स्वीकार्य नहीं हैं क्योंकि वे विभिन्न दृष्टिकोणों की आंतरिक स्थिरता के बारे में कुछ नहीं कहते हैं।" एक अच्छे कारण के लिए। बार-बार होने वाले परीक्षण गलत मान्यताओं के साथ-साथ बेयसियन लोगों पर आधारित हो सकते हैं (बायेसियन फ्रेमवर्क मान्यताओं को अधिक स्पष्ट रूप से बताता है); सवाल यह है कि क्या ढांचे में कमजोरियां हैं। इसके अलावा, अगर सही मूल्य पूर्व में था, लेकिन पीछे नहीं है, तो इसका मतलब यह होगा कि टिप्पणियों ने सही मूल्य के सही होने की संभावना को खारिज कर दिया है!
डिक्रान मार्सुपियल

1
शायद मुझे अपना उत्तर संपादित करना चाहिए और अपना "उदाहरण" हटाना चाहिए - यह मेरे उत्तर का गंभीर हिस्सा नहीं है। मेरा उत्तर मुख्य रूप से "बायेसियन दृष्टिकोण" के अर्थ के बारे में था। आप बायेसियन दृष्टिकोण को क्या कहते हैं? इस दृष्टिकोण के लिए एक व्यक्तिपरक विकल्प की आवश्यकता होती है या यह एक noninformative का चयन करने के लिए एक स्वचालित तरीके का उपयोग करता है? दूसरे मामले में बर्नार्डो के काम का उल्लेख करना महत्वपूर्ण है। दूसरे आपने अंतराल के बीच "श्रेष्ठता" संबंध को परिभाषित नहीं किया है: जब आप कहते हैं कि अंतराल एक दूसरे से बेहतर है?
स्टीफन लॉरेंट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.