बायेसियन और अक्सर उत्तर देने वाले दृष्टिकोण के उदाहरण अलग-अलग उत्तर देते हैं


54

नोट: मैं कर रहा हूँ के बारे में पता दार्शनिक बायेसियन और frequentist आंकड़ों के बीच अंतर।

उदाहरण के लिए "क्या संभावना है कि मेज पर सिक्का है" लगातार आंकड़ों में कोई मतलब नहीं है, क्योंकि यह या तो पहले से ही सिर या पूंछ उतरा है - इसके बारे में कुछ भी संभाव्य नहीं है। तो सवाल का लगातार जवाब में कोई जवाब नहीं है।

लेकिन ऐसा अंतर विशेष रूप से उस तरह का अंतर नहीं है जिसके बारे में मैं पूछ रहा हूं।

इसके बजाय, मैं यह जानना चाहूंगा कि किसी भी सैद्धांतिक / दार्शनिक मतभेद को छोड़कर वास्तव में वास्तविक दुनिया में उनकी भविष्यवाणियों के बारे में उनकी भविष्यवाणियां अलग - अलग हैं, जैसे कि मैंने ऊपर उल्लेख किया है।

तो दूसरे शब्दों में:

एक प्रश्न का एक उदाहरण है, जो लगातार और बेयसियन आंकड़ों में उत्तर देने योग्य है, जिसका उत्तर दोनों के बीच भिन्न है?

(उदाहरण के लिए, शायद उनमें से कोई एक विशेष प्रश्न का "1/2" उत्तर देता है, और दूसरा उत्तर "2/3"।)

क्या ऐसे कोई मतभेद हैं?

  • यदि हां, तो कुछ उदाहरण क्या हैं?

  • यदि नहीं, तो यह वास्तव में कभी फर्क पड़ता है कि क्या मैं किसी विशेष समस्या को हल करते समय बायेसियन या लगातार आंकड़ों का उपयोग करता हूं?
    मैं दूसरे के पक्ष में एक से क्यों बचूंगा?


8
जॉन क्रुस्के ने केवल दो वीडियो का निर्माण किया, जहां उन्होंने बेयसियन और मानक सांख्यिकीय तरीकों की तुलना की। उनके पास कई उदाहरण हैं जहां बायेसियन पद्धति खारिज कर देती है लेकिन मानक विधि नहीं है। हो सकता है कि वास्तव में आप क्या देख रहे थे, लेकिन फिर भी ... youtu.be/YyohWpjl6KU और youtu.be/IhlSD-lIQ_Y
रासमस बैथ

4
द्विपद वितरण एक और उदाहरण प्रदान करता है जहां अक्सरवादी (संभावना-आधारित) अनुमान और बायेसियन निष्कर्ष कुछ मामलों में भिन्न होते हैं। पैरामीटर की प्रोफाइल संभावना कुछ नमूनों के लिए से ( देखें ) के रूप में क्षय नहीं होती है । इसका मतलब है कि कुछ संभावना-विश्वास अंतराल की अनंत लंबाई है। दूसरी ओर, का सीमान्त पश्च-वितरण हमेशा से रूप में है, यह देखते हुए कि यह पूर्णांक है। N0NN0N

@Procrastinator: धन्यवाद, मैं अभी बताई गई स्लाइड्स को देख रहा हूँ। यह मेरी गणितीय पृष्ठभूमि की तुलना में थोड़ा अधिक गहन है, लेकिन उम्मीद है कि मुझे इससे कुछ मिलेगा। :)
मेहरदाद

2
आप स्टोन के उदाहरण पर एक नज़र डालना चाहते हैं। मैं इसे अपने ब्लॉग पर यहाँ समझाता हूँ: normaldeviate.wordpress.com/2012/12/08/…
लैरी

1
@mbq: बस सोच रहा था, यह समुदाय विकि क्यों बनाया गया था?
मेहरदाद 19

जवाबों:


9

यह उदाहरण यहाँ से लिया गया है । (मुझे भी लगता है कि मुझे यह लिंक SO से मिला है, लेकिन अब और नहीं मिल सकता है।)

एक सिक्का बार उछाला गया है , सिर के ऊपर आ रहा है बार। यदि इसे दो बार और उछाला जाए, तो क्या आप दो सिर पर दांव लगाएंगे? मान लें कि आपको दूसरी टॉस से पहले पहली टॉस का परिणाम देखने को नहीं मिला (और स्वतंत्र रूप से पर सशर्त भी ), ताकि आप दो थ्रो के बीच में अपनी राय को पर अपडेट नहीं कर सकें ।n=14k=10θθ

स्वतंत्रता से, फिर, भविष्य कहनेवाला वितरण एक -पियर दिया जाता है, बन जाता है

f(yf,1=heads,yf,2=heads|θ)=f(yf,1=heads)f(yf,2=heads|θ)=θ2.
Beta(α0,β0)
f(yf,1=heads,yf,2=heads|y)=f(yf,1=heads,yf,2=heads|θ)π(θ|y)dθ=Γ(α0+β0+n)Γ(α0+k)Γ(β0+nk)θ2θα0+k1(1θ)β0+nk1dθ=Γ(α0+β0+n)Γ(α0+k)Γ(β0+nk)Γ(α0+k+2)Γ(β0+nk)Γ(α0+β0+n+2)=(α0+k)(α0+k+1)(α0+β0+n)(α0+β0+n+1)
एक समान पूर्व के लिए aBeta(1,1)-पियर), यह मोटे तौर पर देता है ।485 इसलिए, आप निश्चित रूप से दांव नहीं लगाएंगे। MLE 10/14 के आधार पर, आप दो प्रमुखों संभावना की गणना करेंगे , जैसे कि सट्टेबाजी का अर्थ होगा।(10/14)2.51

+1 बिल्कुल उसी तरह का जवाब जिसकी मुझे तलाश थी, धन्यवाद।
मेहरदाद

5
उत्तर में संदर्भित पोस्ट के लिए वास्तव में एक अपडेट था ... हालांकि उन्होंने पोस्ट को छोड़ दिया, "एक पूर्व के रूप में एक समान वितरण का उपयोग करने के बजाय, हम और भी अधिक अज्ञेयवादी हो सकते हैं। इस मामले में, हम बीटा का उपयोग कर सकते हैं ( पूर्व के रूप में 0,0) वितरण। ऐसा वितरण उस मामले से मेल खाता है जहां वितरण का कोई मतलब समान रूप से होने की संभावना है। इस मामले में, दो दृष्टिकोण, बायेसियन और अक्सर एक ही परिणाम देते हैं। " !!! इसलिए हमें इस प्रश्न का उत्तर देने के लिए अभी भी एक उदाहरण की आवश्यकता है! इसलिए इस सवाल का असली जवाब के रूप में नीचे दिए गए उत्तर के लिए +1।
user1745038

10

मेरे प्रश्न को यहां देखें , जिसमें एडविन जेन्स द्वारा एक पेपर का उल्लेख किया गया है, जो एक सही ढंग से निर्मित अक्सरवादी विश्वास अंतराल का एक उदाहरण देता है, जहां कुछ के लिए यह जानने के लिए नमूने में पर्याप्त जानकारी है कि सांख्यिकीय अंतराल का सही मूल्य विश्वास अंतराल में कहीं नहीं है। और इस प्रकार विश्वास अंतराल बायेसियन विश्वसनीय अंतराल से अलग है)।

हालांकि, इसका कारण एक विश्वास अंतराल और एक विश्वसनीय अंतराल की परिभाषा में अंतर है, जो बदले में प्रायिकता के बायोसिस्ट और बेयसियन परिभाषाओं में अंतर का प्रत्यक्ष परिणाम है। यदि आप एक बायेसियन को बायेसियन विश्वास (विश्वसनीय के बजाय) अंतराल का उत्पादन करने के लिए कहते हैं, तो मुझे संदेह है कि हमेशा एक प्राथमिकता होगी जिसके लिए अंतराल समान होगा, इसलिए मतभेद पहले की पसंद के लिए नीचे हैं।

क्या फ़ॉरेस्टिस्ट या बायेसियन तरीके उपयुक्त हैं, उस प्रश्न पर निर्भर करता है जिसे आप पोज़ करना चाहते हैं, और दिन के अंत में यह उन दर्शनशास्त्रों में अंतर है जो उत्तर का निर्णय करता है (बशर्ते कि आवश्यक कम्प्यूटेशनल और विश्लेषणात्मक प्रयास एक विचार नहीं है)।

गाल में कुछ जीभ होने के नाते, यह तर्क दिया जा सकता है कि लंबे समय तक चलने की आवृत्ति एक प्रस्ताव की सापेक्ष बहुलता को निर्धारित करने का एक पूरी तरह से उचित तरीका है, इस मामले में लगातार आंकड़े व्यक्तिपरक बायेसिज्म का थोड़ा अजीब उपसमुच्चय है - इसलिए किसी भी प्रश्न का उत्तर अक्सर एक व्यक्ति दे सकता है। एक व्यक्तिवादी बायेसियन भी उसी तरह से उत्तर दे सकता है, या किसी अन्य तरीके से उन्हें अलग-अलग पुजारियों का चयन करना चाहिए। ; ओ)


4
"व्यक्तिपरक बायेसियन" का उपयोग आत्म-तोड़फोड़ ( देखें ) का एक सा है । सामान्य रूप से मॉडलिंग करना विषयवाद से भरा होता है, नमूने के मॉडलिंग के लिए वितरण की पसंद भी व्यक्तिपरक होती है। यहां तक ​​कि एक निश्चित मॉडल उचित है या नहीं, यह जांचने के लिए फिट टेस्ट की अच्छाई का विकल्प।

2
मैं वास्तव में इससे सहमत नहीं हूं, अगर कोई व्यक्ति "व्यक्तिपरक" को मानता है, तो यह उनकी त्रुटि है। कभी-कभी जब हम संभाव्यता का अर्थ करते हैं, तो हम वास्तव में व्यक्तिपरक व्यक्तिगत विश्वास करते हैं - मुझे कोई कारण नहीं है कि इसे कॉल न करें कि यदि वास्तव में इसका मतलब है (केवल लंबे समय तक चलने वाली आवृत्तियों को स्वीकार करना है क्योंकि संभाव्यता की परिभाषा एक विशुद्ध व्यक्तिपरक विकल्प है)।
डिक्रान मार्सुपियल

1
लिंक के लिए +1 धन्यवाद, यह बहुत ज्ञानवर्धक है। और साथ ही विश्वास और विश्वसनीय अंतराल के बीच अंतर पर भी ध्यान दें।
मेहरदाद

8

मेरा मानना ​​है कि यह पत्र दोनों के बीच वास्तविक अनुप्रयोगों में व्यापार-नापसंद का अधिक उद्देश्यपूर्ण अर्थ प्रदान करता है। इसका एक हिस्सा परीक्षणों के बजाय अंतराल के लिए मेरी प्राथमिकता के कारण हो सकता है।

गुस्ताफसन, पी। और ग्रीनलैंड, एस (2009)। मेस्सी ऑब्जर्वेशन डेटा के लिए अंतराल अनुमानसांख्यिकीय विज्ञान 24: 328-342।

अंतराल के संबंध में, यह ध्यान में रखना सार्थक हो सकता है कि लगातार विश्वास अंतराल की आवश्यकता होती है / एक समान कवरेज की मांग (प्रत्येक या हर पैरामीटर मान के लिए x% से कम या कम से कम महान है, जिसमें शून्य संभावना नहीं है) और यदि वे नहीं करते हैं है कि - वे वास्तव में विश्वास अंतराल नहीं है। (कुछ लोग आगे जाकर कहते हैं कि उन्हें कवरेज को बदलने वाले प्रासंगिक उप-नियमों का भी पालन करना चाहिए।)

बायेसियन कवरेज को आमतौर पर "औसत कवरेज पर" आराम से परिभाषित किया जाता है जिसे देखते हुए पूर्व अनुमान बिल्कुल सही हो जाता है। गुस्ताफसन और ग्रीनलैंड (2009) इन सर्वशक्तिमान पुजारियों को बुलाते हैं और बेहतर मूल्यांकन प्रदान करने के लिए गिरने योग्य मानते हैं।


1
+1 प्रतिबंध में मुझे इस अंतर के बारे में कभी नहीं पता था, इसे इंगित करने के लिए धन्यवाद।
मेहरदाद

3

यदि किसी को एक प्रश्न का उत्तर देना होता है, जिसमें एक लगातार और बायेसियन दोनों उत्तर होते हैं, तो मुझे संदेह है कि कोई अन्य व्यक्ति प्रश्न में अस्पष्टता की पहचान करने में सक्षम होगा, इस प्रकार यह "अच्छी तरह से गठित" नहीं होगा।

दूसरे शब्दों में, यदि आपको लगातार उत्तर की आवश्यकता है, तो लगातार तरीकों का उपयोग करें। यदि आपको बायेसियन उत्तर की आवश्यकता है, तो बायेसियन विधियों का उपयोग करें। यदि आपको नहीं पता कि आपको किस चीज की आवश्यकता है, तो हो सकता है कि आपने प्रश्न को स्पष्ट रूप से परिभाषित न किया हो।

हालांकि, वास्तविक दुनिया में किसी समस्या को परिभाषित करने या सवाल पूछने के कई अलग-अलग तरीके होते हैं। कभी-कभी यह स्पष्ट नहीं होता है कि उनमें से कौन सा तरीका बेहतर है। यह विशेष रूप से आम है जब किसी का ग्राहक सांख्यिकीय रूप से अनुभवहीन हो। अन्य समय में एक प्रश्न दूसरे की तुलना में उत्तर देना अधिक कठिन होता है। उन मामलों में जब कोई व्यक्ति अक्सर यह सुनिश्चित करने का प्रयास करता है कि उसके ग्राहक इस बात से सहमत हों कि वह कौन सा सवाल पूछ रहा है या वह किस समस्या को हल कर रहा है।


3

मैं मैकके द्वारा स्वतंत्र रूप से उपलब्ध पाठ्यपुस्तक सूचना सिद्धांत, आविष्कार और सीखना एल्गोरिदम के व्यायाम 3.15 को देखने की सलाह देता हूं ।

लंदन स्कूल ऑफ इकोनॉमिक्स के एक सांख्यिकी लेक्चरर बैरी ब्लाइट ने कहा, जब 250 बार एक किनारे पर एक बेल्जियम का एक-एक सिक्का 140 बार आया और 110 बज गया। 'यह मुझे बहुत संदेहास्पद लग रहा है'। `यदि सिक्का निष्पक्ष था, तो परिणाम के रूप में चरम 7% से कम होगा। लेकिन क्या ये आंकड़े इस बात का सबूत देते हैं कि सिक्का निष्पक्ष होने के बजाय पक्षपाती है?

उदाहरण पाठ्यपुस्तक के पीपी। 63-64 पर विस्तार से काम किया है। निष्कर्ष यह है कि है -value है , लेकिन बायेसियन दृष्टिकोण या तो परिकल्पना के लिए समर्थन के विभिन्न स्तरों तक देता है, पहले के आधार पर। यह बिना किसी सबूत के अनुशंसित उत्तर से लेकर होता है कि सिक्का पक्षपाती है (जब एक फ्लैट पूर्व का उपयोग किया जाता है) निष्पक्षता की अशक्त परिकल्पना के खिलाफ जवाब में , इस मामले में कि कृत्रिम रूप से चरम पूर्व का उपयोग किया जाता है।p0.076:1

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.