बायसीयन बनाम प्रायिकता की व्याख्या


37

क्या कोई बायेसियन और प्रायिकतावादी दृष्टिकोण के बीच अंतर की संभावना का एक अच्छा हिस्सा दे सकता है?

मैं जो कुछ समझता हूं:

फ़्रीक्वॉज़र्स का दृष्टिकोण यह है कि डेटा एक विशिष्ट आवृत्ति / संभावना के साथ एक दोहराए जाने योग्य यादृच्छिक नमूना (रैंडम वेरिएबल) है (जिसे किसी घटना की सापेक्ष आवृत्ति के रूप में परिभाषित किया गया है क्योंकि परीक्षण की संख्या अनंतता के करीब आती है)। अंतर्निहित मापदंडों और संभावनाओं इस repeatable प्रक्रिया के दौरान और वह विविधता में परिवर्तनशीलता की वजह से है स्थिर रहना और नहीं प्रायिकता बंटन (जो एक निश्चित घटना / प्रक्रिया के लिए तय हो गई है)।एक्सn

बायेसियन दृश्य यह है कि डेटा को ठीक किया गया है जबकि एक निश्चित घटना के लिए आवृत्ति / संभावना का अर्थ बदल सकता है जो वितरण के मापदंडों को बदलता है। वास्तव में, जो डेटा आपको मिलता है वह एक पैरामीटर के पूर्व वितरण को बदलता है जो डेटा के प्रत्येक सेट के लिए अपडेट हो जाता है।

मेरे लिए ऐसा लगता है कि लगातार दृष्टिकोण अधिक व्यावहारिक / तार्किक है क्योंकि यह उचित लगता है कि घटनाओं की एक विशिष्ट संभावना है और यह कि भिन्नता हमारे नमूने में है।

इसके अलावा, अध्ययन से अधिकांश डेटा विश्लेषण आमतौर पर लगातार दृष्टिकोण (यानी आत्मविश्वास अंतराल, पी-मूल्यों के साथ परिकल्पना परीक्षण) का उपयोग करके किया जाता है क्योंकि यह आसानी से समझ में आता है।

मैं बस सोच रहा था कि क्या कोई मुझे बायसियन बनाम अक्सरवादी दृष्टिकोण की एक त्वरित सारांश दे सकता है जिसमें लगातार पी-मूल्य और आत्मविश्वास अंतराल के बायेसियन सांख्यिकीय समकक्ष शामिल हैं। इसके अलावा, विशिष्ट उदाहरण जहां 1 विधि को दूसरे के लिए बेहतर माना जाएगा।


1
यदि आप कहते हैं कि कुछ स्थानों पर आप पर गुस्सा भीड़ द्वारा हमला किया जाएगा, तो आप कहेंगे कि सांख्यिकीय अनुमान के लिए लगातार दृष्टिकोण अधिक व्यावहारिक है। (ठीक है, हो सकता है कि उस कथन में कुछ अतिशयोक्ति हो।) मैं इस बात से सहमत नहीं हूं कि आत्मविश्वास के अंतरालों को पोस्टीरियर प्रायिकता अंतरालों की तुलना में समझना आसान है। (वैसे भी, मेरा उत्तर नीचे, वहाँ जानते हुए भी क्या परे कोई गणित हालांकि देख मैं यह बात का सार के लिए सीधे हो जाता है लगता है। है।)1/2
माइकल हार्डी

@DilipSarwate ay, मैं अगली बार के लिए इसे ध्यान में रखूंगा। लेकिन ऐसा लगता है कि मुझे इस बार कुछ अच्छे उत्तर मिले, इसलिए शायद मैं यहां से समाप्त करने की कोशिश करूंगा: D
BYS2

इन्हें भी देखें stats.stackexchange.com/q/173056/35989
टिम

जवाबों:


27

में frequentist दृष्टिकोण बात पर जोर दिया गया है कि परीक्षण के एक दृश्य के रूप में यानी में सफलताओं की संख्या का सीमित मान के रूप में है ही भावना है, जिसमें संभावनाओं अर्थ है

पी=लिमnकश्मीरn

जहां सफलताओं की संख्या है और परीक्षणों की संख्या है। विशेष रूप से, इसका कोई मतलब नहीं है कि संभावना वितरण को एक पैरामीटर के साथ जोड़ा जाए ।nकश्मीरn

उदाहरण के लिए, नमूने पर विचार पैरामीटर के साथ Bernoulli वितरण से (यानी वे संभावना के साथ मान 1 है संभावना के साथ और 0 )। हम नमूना सफलता दर को परिभाषित कर सकते हैं पीएक्स1,...,एक्सnपी1 - पीपी1-पी

पी^=एक्स1++एक्सnn

और के वितरण के बारे में बात के मूल्य पर सशर्त , लेकिन यह सवाल को उलटने और की संभावना वितरण के बारे में बात शुरू करने के लिए कोई मतलब नहीं है की प्रेक्षित मूल्य पर सशर्त । विशेष रूप से, इसका मतलब यह है कि जब हम एक आत्मविश्वास अंतराल की गणना करते हैं, तो हम आत्मविश्वास अंतराल के छोर को यादृच्छिक चर के रूप में व्याख्या करते हैं, और हम "संभावना है कि अंतराल में सच्चे पैरामीटर शामिल हैं" के बारे में बात करते हैं, बजाय "संभावना के कि पैरामीटर। आत्मविश्वास अंतराल के अंदर "। पीपी पीपी^पीपीपी^

में बायेसियन दृष्टिकोण, हम दुनिया के बारे में हमारी अनिश्चितता मात्र निर्धारण के रूप में संभाव्यता वितरण की व्याख्या। विशेष रूप से, इसका मतलब है कि हम अब सार्थक रूप से मापदंडों के वितरण के बारे में बात कर सकते हैं, क्योंकि पैरामीटर तय होने के बावजूद, इसके सही मूल्य के बारे में हमारा ज्ञान सीमित हो सकता है। ऊपर दिए गए उदाहरण में, हम संभावना वितरण का उपयोग कर सकते हैं, जो कि बेयस कानून का उपयोग करते हैं,(पी^|पी)

(पी|पी^)पीछे=(पी^|पी)(पी^)संभावना अनुपात(पी)पूर्व

रोड़ा यह है कि हमें अपने विश्लेषण में पूर्व वितरण शुरू करना होगा - यह के वास्तविक मूल्यों को देखने से पहले के मूल्य के बारे में हमारी धारणा को दर्शाता है । पूर्व की भूमिका की अक्सर आलोचनावादी दृष्टिकोण में की जाती है, क्योंकि यह तर्क दिया जाता है कि यह संभावना के अन्यथा विषय और वस्तु जगत में विषय का परिचय देता है।पीएक्समैं

बेयसियन दृष्टिकोण में अब कोई विश्वास अंतराल की बात नहीं करता है, लेकिन विश्वसनीय अंतरालों के बजाय, जिनकी अधिक प्राकृतिक व्याख्या है - 95% विश्वसनीय अंतराल दिए जाने पर, हम 95% संभावना को असाइन कर सकते हैं कि पैरामीटर अंतराल के अंदर है।


6
दूसरी ओर, लगातार दृष्टिकोण की एक आलोचना यह है कि यह संभावना के बारे में लोगों के विचार के साथ वर्ग नहीं करता है। इस बात पर विचार करें कि लोग डायनासोर के विलुप्त होने, या कल के सूरज की तरह "निश्चितताओं" की "संभावना" जैसे "बंद" की "संभावना" के बारे में कैसे बात करते हैं ...

14
यह भी उल्लेख करना अच्छा होगा कि लगातार और बायेसियन दृष्टिकोणों के बीच अंतर लगभग एक व्यावहारिक स्तर पर महान नहीं है: कोई भी लगातार पद्धति जो उपयोगी और आत्मनिर्भर परिणाम पैदा करती है, उसे आम तौर पर बायेसियन व्याख्या दी जा सकती है, और इसके विपरीत । विशेष रूप से, बायेसियन शब्दों में बार-बार गणना करने से आम तौर पर कुछ विशिष्ट पूर्व दिए गए पश्च की गणना के लिए एक नियम मिलता है । एक तो पूछ सकता है "ठीक है, यह है कि वास्तव में एक उचित एक ग्रहण करने के लिए?"
इल्मरी करोनन

इस उत्तर के लिए धन्यवाद, यह मेरी सामान्य समझ के अनुरूप है। हालाँकि, मैं सोच रहा था कि यदि आप एक बात स्पष्ट कर सकते हैं, तो आप बे के कानून सूत्र में डेटा / नमूना सफलता दर (एफ (पी-हैट)) की संभावना कैसे पाएंगे? मैंने कुछ काम किए गए उदाहरणों के माध्यम से पढ़ा है और मैं आमतौर पर समझता हूं कि एफ (पी-हैट | पी) और पूर्व एफ (पी) कैसे प्राप्त करें लेकिन एफ (पी-हैट) मुझे अब तक हटा देता है। यदि आपके पास कुछ संसाधनों के लिए कुछ लिंक थे, तो यह बहुत अच्छा होगा: डी। धन्यवाद!
BYS2

@IlmariKaronen। ठीक है, तो आप कह रहे हैं कि यदि मेरे पास एक अध्ययन है जो विश्वास अंतराल के रूप में व्यक्त किए गए कुछ परिणामों का उत्पादन करता है, तो मैं डेटा को पुन: प्राप्त कर सकता हूं और इसके बजाय एक बायेसियन विश्लेषण कर सकता हूं? और परिणाम कमोबेश सुसंगत होंगे?
BYS2

@Karonen का कहना है कि पूरी तरह से सही नहीं है। दो सबसे आम लगातार तकनीकों बिंदु बिंदु अनुमान (आमतौर पर अधिकतम संभावना अनुमान) और परिकल्पना परीक्षण हैं, और न ही वास्तव में एक प्राकृतिक बायेसियन व्याख्या दी जा सकती है।
जूल्स

20

आप फ़्रीक्वेंटिस्ट संभावना की अपनी व्याख्या के बारे में सही हैं: इस सेटअप में यादृच्छिकता केवल अपूर्ण नमूने के कारण है। बायेसियन दृष्टिकोण से संभावनाएं "व्यक्तिपरक" हैं, जिसमें वे दुनिया के बारे में एक एजेंट की अनिश्चितता को दर्शाते हैं। यह कहना सही नहीं है कि वितरण के पैरामीटर "परिवर्तन" हैं। चूंकि हमारे पास मापदंडों के बारे में पूरी जानकारी नहीं है, इसलिए जब हम अधिक जानकारी एकत्र करते हैं, तो उनके बारे में हमारी अनिश्चितता बदल जाती है।

दोनों व्याख्याएं अनुप्रयोगों में उपयोगी हैं, और जो अधिक उपयोगी है वह स्थिति पर निर्भर करती है। आप Bayesian अनुप्रयोगों के बारे में विचारों के लिए एंड्रयू जेलमैन के ब्लॉग की जांच कर सकते हैं । कई स्थितियों में जो बायेसियन "पुजारी" कहते हैं, फ़्रीक्वेंटर्स "नियमितीकरण" कहते हैं, और इसलिए (मेरे दृष्टिकोण से) उत्तेजना कमरे को जल्दी से छोड़ सकती है। वास्तव में, बर्नस्टीन-वॉन मिज़ प्रमेय के अनुसार, बायेसियन और फ़्रीक्वेनिस्ट निष्कर्ष वास्तव में विषम धारणाओं के तहत समान रूप से समतुल्य हैं (हालांकि विशेष रूप से अनंत-आयामी वितरण के लिए प्रमेय विफल रहता है)। आप इस बारे में संदर्भ के एक धसान पा सकते हैं यहाँ

चूंकि आपने व्याख्याएं मांगी हैं: मुझे लगता है कि फ़्रीक्वेंटिस्ट दृष्टिकोण वैज्ञानिक प्रयोगों को मॉडलिंग करते समय बहुत अच्छा लगता है क्योंकि इसे करने के लिए डिज़ाइन किया गया था। मशीन सीखने में कुछ अनुप्रयोगों के लिए या प्रेरक तर्क (या सीखने) मॉडलिंग के लिए, बायेसियन संभावना मेरे लिए अधिक मायने रखती है। ऐसी कई परिस्थितियाँ हैं, जिसमें किसी घटना को एक निश्चित, "सही" संभावना के साथ मॉडलिंग करना असंभव लगता है।

एक खिलौना उदाहरण के लिए वापस लाप्लास जा रहा है , इस संभावना पर विचार करें कि कल सूरज उगता है। आवृत्तिवादी दृष्टिकोण से, हमें संभावना को परिभाषित करने के लिए असीम रूप से-कई ब्रह्मांडों की तरह कुछ प्रस्तुत करना होगा। बायेसियन के रूप में, केवल एक ब्रह्मांड है (या कम से कम, वहाँ कई होने की आवश्यकता नहीं है)। उगते हुए सूरज के बारे में हमारी अनिश्चितता हमारे बहुत, बहुत मजबूत पूर्व विश्वास से प्रेरित है कि यह कल फिर से उठेगा।


17

संभाव्यता की बायेसियन व्याख्या एक डिग्री-ऑफ-विश्वास व्याख्या है।

1/2

1/2


2
आरटी कॉक्स द्वारा क्लासिक पेपर की तुलना में बायेसियन दृष्टिकोण (तर्क का विस्तार) की व्यापकता बनाम संकीर्ण संकीर्णतावादी दृष्टिकोण की सीमाओं को इंगित करने के लिए शायद कोई बेहतर जगह नहीं है ।
GWR

2
कॉक्स ने इसके बारे में एक किताब भी लिखी, जिसका शीर्षक है, अल्जबरा ऑफ प्रोबेबल इन्वेंशन , जो जॉन्स हॉपकिन्स द्वारा प्रकाशित। @gwr
माइकल हार्डी

1
इयान हैकिंग ने अपनी पुस्तक "एन इंट्रोडक्शन टू प्रोबेबिलिटी एंड इंडक्टिविव लॉजिक" में इसे अच्छी तरह से कहा है। उन्होंने कहा: "बायेसियन व्यक्तिगत प्रस्तावों के लिए व्यक्तिगत संभावनाओं या विश्वास की डिग्री को संलग्न करने में सक्षम है। हार्ड-लाइन फ्रीक्वेंसी डॉगमेटिस्ट का मानना ​​है कि संभावनाओं को केवल घटनाओं की एक श्रृंखला से जोड़ा जा सकता है।"
बटंस Dec४०

9

क्रिस एक अच्छा सरलीकृत स्पष्टीकरण देता है जो संभावना के लिए दो दृष्टिकोणों को ठीक से अलग करता है। लेकिन प्रायिकता का लगातार सिद्धांत केवल सफलताओं की लंबी दूरी के अनुपात को देखने से अधिक है। हम वितरण से यादृच्छिक रूप से सैंपल पर विचार करते हैं और वितरण के अनुमानित मापदंडों जैसे कि डेटा के औसत प्रकार के कुछ प्रकार लेकर, जैसे कि यह अवलोकनों का अंकगणितीय औसत है। उस अनुमान के साथ जिसे नमूना वितरण कहा जाता है।

फ्रिक्वेंसी थ्योरी में हम ऐसे मापदण्डों के लिए मापदंडों को दिखाने में सक्षम होते हैं जो औसतन उन नमूनों से लिए जाते हैं जिनका अनुमान सही पैरामीटर में परिवर्तित हो जाएगा। नमूना वितरण का उपयोग यह बताने के लिए किया जाता है कि किसी भी निश्चित नमूना आकार n के लिए पैरामीटर कितना अनुमानित है। बंद सटीकता की माप द्वारा परिभाषित किया गया है (उदाहरण के लिए वर्ग त्रुटि)।

क्रिस किसी भी पैरामीटर के लिए इंगित करता है जैसे कि बेयसियन उस पर एक पूर्व संभाव्यता वितरण संलग्न करता है। फिर दिए गए डेटा बेयस नियम का उपयोग पैरामीटर के लिए एक पीछे के वितरण की गणना करने के लिए किया जाता है। बायेसियन के लिए पैरामीटर के बारे में सभी अनुमान इस पश्च वितरण पर आधारित है।

फ़्रीक्वॉन्सर आत्मविश्वास अंतराल का निर्माण करते हैं जो पैरामीटर के लिए प्रशंसनीय मूल्यों के अंतराल हैं। उनका निर्माण लगातार संभावना पर आधारित है कि यदि अंतराल उत्पन्न करने के लिए इस्तेमाल की जाने वाली प्रक्रिया स्वतंत्र नमूनों के लिए कई बार दोहराई गई तो अंतराल के अनुपात में वास्तव में पैरामीटर का वास्तविक मूल्य शामिल होगा कम से कम कुछ निर्धारित आत्मविश्वास स्तर (जैसे 95%) )।

बायेसियन विश्वसनीय क्षेत्रों के निर्माण के लिए पैरामीटर के लिए पश्च-पश्च वितरण का उपयोग करते हैं। ये केवल पैरामीटर स्पेस के क्षेत्र हैं, जिस पर पूर्ववर्ती डिस्टिब्यूशन को एक निर्धारित संभावना (जैसे 0.95) प्राप्त करने के लिए एकीकृत किया गया है। विश्वसनीय क्षेत्रों को बायेसियन द्वारा ऐसे क्षेत्रों के रूप में व्याख्या किया जाता है जिनके पास एक उच्च (जैसे कि पूर्व निर्धारित 0.95) पैरामीटर के सही मूल्य को शामिल करने की संभावना है।


1
विश्वसनीय क्षेत्रों को बायेसियन द्वारा ऐसे क्षेत्रों के रूप में व्याख्या किया जाता है जिनके पास एक उच्च (जैसे कि पूर्व निर्धारित 0.95) पैरामीटर के सही मूल्य को शामिल करने की संभावना है । यदि पैरामीटर यादृच्छिक चर है तो यह कैसे संभव है?

@Procrastinator ठीक है शायद आप मेरे लिए यह कहना पसंद करेंगे कि यह पैरामीटर वितरण के एक उच्च निर्धारित अनुपात को कवर करता है। लेकिन अगर X एक वितरण च के साथ एक यादृच्छिक चर है और हम इसके लिए एक विश्वसनीय क्षेत्र का निर्माण करते हैं तो क्षेत्र इस संभावना का प्रतिनिधित्व करता है कि यादृच्छिक चर का एक एहसास क्षेत्र में झूठ होगा।
माइकल आर। चेरिक जूल

मैं इस स्पष्टीकरण से सहमत हूं। यह स्पष्ट करना महत्वपूर्ण है कि यादृच्छिक चर का एक एहसास पैरामीटर का सही मूल्य नहीं है।

@Procrastinator जो एक दिलचस्प बिंदु है जो आप उठाते हैं। हालाँकि, बायसियन संभावना के बारे में मेरी समझ यह है कि कई बायेसियन शास्त्रीय सांख्यिकीविदों से सहमत हैं कि प्रश्न में पैरामीटर का एक ही सही मूल्य है (यह तय है लेकिन अज्ञात है)। यह इस पैरामीटर के बारे में अनिश्चितता है जिसे हमारे ज्ञान की अपूर्ण स्थिति के कारण वितरित किया गया है। तो अगर आप इसके बारे में इस तरह से सोचते हैं, तो माइकल चेर्निक का प्रारंभिक कथन मान्य है क्या आपको नहीं लगता?
BYS2

2
θ0=1(1,100)

2

एक "वास्तविक दुनिया" के दृष्टिकोण से, मुझे एक निरंतरतावादी और एक शास्त्रीय या बायेसियन "समाधान" के बीच एक बड़ा अंतर लगता है जो कम से कम तीन प्रमुख परिदृश्यों पर लागू होता है। एक कार्यप्रणाली का चयन करने में अंतर इस बात पर निर्भर करता है कि क्या आपको एक समाधान की आवश्यकता है जो जनसंख्या की संभावना से प्रभावित है, या एक जो व्यक्तिगत संभावना से प्रभावित है। नीचे दिए गए उदाहरण:

  1. यदि कोई ज्ञात 5% संभावना है कि 40 से अधिक पुरुष एक वर्ष में मर जाएंगे और जीवन बीमा भुगतान की आवश्यकता होगी, तो एक बीमा कंपनी अपनी लागत का अनुमान लगाने के लिए 5% पॉपुलेशन प्रतिशत का उपयोग कर सकती है, लेकिन यह कहना है कि प्रत्येक व्यक्ति को केवल 40 से अधिक है मरने का 5% मौका ... व्यर्थ है ... क्योंकि 5% में मरने की 100% संभावना है - जो कि एक लगातार दृष्टिकोण है। व्यक्तिगत स्तर पर घटना या तो होती है (100% संभावना) या यह (0% संभावना) नहीं है, हालांकि, इस सीमित जानकारी के आधार पर, उन व्यक्तियों की भविष्यवाणी करना संभव नहीं है जिनके मरने की 100% संभावना है, और 5 % "औसत" जनसंख्या संभावना व्यक्तिगत स्तर पर बेकार है।

  2. उपरोक्त तर्क समान रूप से इमारतों में आग लगाने के लिए समान रूप से लागू होता है यही कारण है कि आबादी में सभी इमारतों में स्प्रिंकलर की आवश्यकता होती है।

  3. उपरोक्त दोनों तर्क समान रूप से सूचना प्रणालियों के ब्रीच, क्षति, या "हैक्स" पर लागू होते हैं। जनसंख्या प्रतिशत बेकार है इसलिए सभी प्रणालियों को सुरक्षित रखना चाहिए।


2
मैं इन तीनों उदाहरणों में से किसी एक में लगातार दृष्टिकोण को नहीं पहचानता। वे सभी एक पूर्वव्यापी पर टिका लग रहे हैं - और इसलिए बेकार - संभावना की अवधारणा जो शास्त्रीय मॉडल में उपयोग नहीं की जाती है। उदाहरण के लिए, यह दावा कि "घटना या तो घटित होती है ... या यह" नहीं है, तुच्छ रूप से सत्य है लेकिन संभावनाओं से असंबंधित है।
whuber

0

व्याख्या का विकल्प प्रश्न पर निर्भर करता है। यदि आप मौका के खेल में बाधाओं को जानना चाहते हैं, तो शास्त्रीय व्याख्या आपकी समस्या को हल करेगी, लेकिन सांख्यिकीय डेटा बेकार है क्योंकि निष्पक्ष पासा की कोई स्मृति नहीं है।

यदि आप पिछले अनुभव के आधार पर भविष्य की घटना की भविष्यवाणी करना चाहते हैं, तो अक्सर व्याख्या सही और पर्याप्त होती है।

यदि आपको नहीं पता कि कोई पिछली घटना हुई थी, और उस संभावना का आकलन करना चाहते हैं जो उसने किया था, तो आपको अपने पूर्व विश्वासों को लेना होगा, अर्थात जब आप घटना के होने के अवसर के बारे में पहले से जानते हैं और जब आप अधिग्रहित होंगे तो अपने विश्वास को अपडेट करें। नए आंकड़े।

चूंकि सवाल विश्वास की एक डिग्री के बारे में है, और प्रत्येक व्यक्ति के पास पुजारियों के बारे में एक अलग विचार हो सकता है, व्याख्या आवश्यक रूप से व्यक्तिपरक है, उर्फ ​​बायेसियन।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.