व्यवहार अनुसंधान के लिए पारंपरिक (अक्सरवादी) आंकड़ों पर बेयसियन सांख्यिकी वास्तव में एक सुधार है?


19

सम्मेलनों में भाग लेने के दौरान, प्रयोगों के परिणामों का आकलन करने के लिए बायेसियन सांख्यिकी के अधिवक्ताओं द्वारा थोड़ा धक्का दिया गया है। यह लगातार संवेदनशील आंकड़ों की तुलना में वास्तविक निष्कर्षों (कम झूठी सकारात्मक) के प्रति अधिक संवेदनशील, उपयुक्त और चयनात्मक दोनों के रूप में है।

मैंने कुछ हद तक विषय का पता लगाया है, और मुझे बेयसियन सांख्यिकी का उपयोग करने के लाभों के बारे में अभी तक असंबद्ध छोड़ दिया गया है। बायेसियन विश्लेषण का उपयोग डेरिल बेम के शोध का समर्थन करने के लिए किया गया था ।

तो मैं निम्नलिखित के बारे में उत्सुक हूं:

  • बायेसियन विश्लेषण बनाम एक निरंतरवादी विश्लेषण में पावर
  • प्रत्येक प्रकार के विश्लेषण में टाइप 1 त्रुटि के लिए संवेदनशीलता
  • विश्लेषण की जटिलता में व्यापार-बंद (बेसेयन अधिक जटिल लगता है) बनाम प्राप्त लाभ। पारंपरिक सांख्यिकीय विश्लेषण सीधे हैं, निष्कर्ष निकालने के लिए अच्छी तरह से स्थापित दिशानिर्देशों के साथ। सादगी को लाभ के रूप में देखा जा सकता है। क्या वह देने लायक है?

किसी भी जानकारी के लिए धन्यवाद!


1
बेयसियन आँकड़े पारंपरिक आँकड़े हैं - क्या आप पारंपरिक आँकड़ों के लिए ठोस उदाहरण दे सकते हैं?

1
@OphirYoktan: वह आवृत्ति संभाव्यता बनाम बेयसियन संभावना के बारे में बात कर रहे हैं। यह प्रश्न के शीर्षक में भी उल्लेख किया गया है।

5
मुझे लगता है कि इस सवाल को यहाँ ले जाना चाहिए: सांख्यिकी
मार्क

2
मैंने मेटा पर एक प्रश्न पूछा कि क्या यह विषय होना चाहिए।

1
मुझे लगता है कि यह प्रश्न संभावित रूप से "अच्छा" या "सही" उत्तर हो सकता है। जैसे अगर कोई कह सकता है "टाइप 1 एरर और टाइप 2 एरर साथ हर एग्जिस्टिस्ट टेस्ट के लिए, टाइप 1 एरर और टाइप 2 एरर " के साथ बायेसियन टेस्ट मौजूद है , तो यह एक अच्छा उत्तर होगा । या "हर बार-बार होने वाला परीक्षण बेइज़ियन परीक्षण के बराबर होता है जिसमें बिना किसी पूर्व सूचना के"। यानी यह आवृत्तियों और बेइज़ियन के बीच एक धार्मिक युद्ध नहीं है। मैं केवल बहस कर रहा हूं क्योंकि मुझे समझ नहीं आ रहा है कि उत्तर ओपी में विशिष्ट प्रश्नों से कैसे संबंधित हैं। αβαβx
शेल्डनकोपर

जवाबों:


14

बुलेटेड सामग्री के लिए एक त्वरित प्रतिक्रिया:

1) बायसी विश्लेषण में पावर / टाइप 1 त्रुटि बनाम एक लगातार विश्लेषण

टाइप 1 और पावर के बारे में पूछना (अर्थात टाइप 2 त्रुटि की संभावना शून्य) का अर्थ है कि आप अपनी अनुमान समस्या को बार-बार नमूने के ढांचे में डाल सकते हैं। क्या आप? यदि आप नहीं कर सकते हैं, तो लगातार विकल्प उपकरण से दूर जाने के लिए बहुत विकल्प नहीं है। यदि आप कर सकते हैं, और यदि इस तरह के कई नमूनों पर आपके अनुमानक का व्यवहार प्रासंगिकता का है, और यदि आप विशेष घटनाओं के बारे में संभावना बयान करने में विशेष रुचि नहीं रखते हैं, तो मेरे पास स्थानांतरित करने का कोई मजबूत कारण नहीं है।

यहाँ तर्क यह नहीं है कि ऐसी स्थितियाँ कभी उत्पन्न नहीं होती हैं - निश्चित रूप से वे करते हैं - लेकिन वे आमतौर पर उन क्षेत्रों में उत्पन्न नहीं होती हैं जहाँ विधियाँ लागू होती हैं।

2) विश्लेषण की जटिलता में व्यापार बंद (बेयसियन अधिक जटिल लगता है) बनाम प्राप्त लाभ।

यह पूछना महत्वपूर्ण है कि जटिलता कहाँ जाती है। अक्सर प्रक्रियाओं में कार्यान्वयन बहुत सरल हो सकता है, उदाहरण के लिए वर्गों का योग कम से कम करें, लेकिन सिद्धांत मनमाने ढंग से जटिल हो सकते हैं, आम तौर पर घूमने वाला, जो अनुमान लगाने वाले (ओं) का चयन करने के लिए, सही परीक्षा कैसे प्राप्त करें, इसके लिए क्या सोचें वे असहमत हैं। एक उदाहरण के लिए। एक अनुपात के लिए अलग-अलग आत्मविश्वास अंतराल के, इस मंच में अभी भी जीवंत चर्चा को देखें!

बायेसियन प्रक्रियाओं में कार्यान्वयन उन मॉडलों में भी मनमाने ढंग से जटिल हो सकता है जो देखने में ऐसे लगते हैं जैसे वे सरल होने के लिए आमतौर पर कठिन होते हैं , लेकिन सिद्धांत बेहद सरल होते हैं। बल्कि यह निर्भर करता है कि आप कहां से गड़बड़ करना चाहेंगे।

3) पारंपरिक सांख्यिकीय विश्लेषण सीधे हैं, निष्कर्ष निकालने के लिए अच्छी तरह से स्थापित दिशानिर्देशों के साथ।

व्यक्तिगत रूप से मैं अब याद नहीं कर सकता, लेकिन निश्चित रूप से मेरे छात्रों को ये सीधे-सीधे कभी नहीं मिले, ज्यादातर यह ऊपर वर्णित सिद्धांत प्रसार के कारण था। लेकिन सवाल वास्तव में नहीं है कि क्या एक प्रक्रिया सीधी है, लेकिन क्या समस्या के ढांचे को देखते हुए इसे सही माना जा रहा है।

अंत में, मैं दृढ़ता से असहमत हूं कि या तो प्रतिमान में "निष्कर्ष निकालने के लिए अच्छी तरह से स्थापित दिशानिर्देश हैं"। और मुझे लगता है कि यह अच्छी बात है। ज़रूर, "find p <.05" एक स्पष्ट दिशानिर्देश है, लेकिन किस मॉडल के लिए, क्या सुधार के साथ, आदि? और जब मेरे परीक्षण असहमत हों तो मैं क्या करूँ? यहां वैज्ञानिक या इंजीनियरिंग निर्णय की आवश्यकता है, क्योंकि यह कहीं और है।


मुझे यकीन नहीं है कि टाइप 1 / टाइप 2 त्रुटियों के बारे में पूछना एक दोहराया नमूना ढांचे के बारे में कुछ भी कहता है। ऐसा लगता है कि भले ही मेरी अशक्त परिकल्पना को बार-बार नमूना नहीं लिया जा सकता है, फिर भी टाइप 1 त्रुटि की संभावना के बारे में पूछना सार्थक है। इस मामले में संभावना, ज़ाहिर है, सभी संभव परिकल्पनाओं पर नहीं है, बल्कि मेरी एकल परिकल्पना से सभी संभव नमूनों पर है।
शेल्डनकोपर

यह मुझे लगता है कि सामान्य तर्क यह है: हालांकि एक प्रकार (1 या 2) त्रुटि बनाते हुए 'एक शॉट' निष्कर्ष के लिए परिभाषित किया जा सकता है (टाइप 1 बनाम 2 केवल गलतियों के एक टाइपोलॉजी का हिस्सा है) जब तक कि मेरी इस गलती को बार-बार परीक्षण में शामिल किया गया है और न ही त्रुटि प्रकार में बार-बार होने की संभावना हो सकती है।
संयुक्ताक्षरी

मैं जो कह रहा हूं वह यह है कि टाइप 1 (या 2) त्रुटि हमेशा दोहराया परीक्षणों में अंतर्निहित है। प्रत्येक परीक्षण शून्य परिकल्पना से टिप्पणियों के एक सेट का नमूना ले रहा है। इसलिए भले ही एक अलग परिकल्पना के नमूने की कल्पना करना मुश्किल है, फिर भी दोहराया परीक्षण अभी भी हैं क्योंकि उसी परिकल्पना से टिप्पणियों के एक अलग सेट के नमूने की कल्पना करना आसान है।
शेल्डनकोपर

1
मुझे यह बताएं: कोई यह कैसे तय करता है "यादृच्छिक क्या है?" उदाहरण के लिए, आपके पास कलश है, कोई व्यक्ति कलश से "यादृच्छिक पर" नमूना ले रहा है। यह भी मान लीजिए कि एक "बुद्धिमान पर्यवेक्षक" भी मौजूद है, और वे कलश की सटीक सामग्री को जानते हैं। क्या नमूना अभी भी "यादृच्छिक पर" है, हालांकि "बुद्धिमान पर्यवेक्षक" निश्चितता के साथ भविष्यवाणी कर सकता है कि क्या खींचा जाएगा? क्या कलश के बारे में कुछ भी बदल गया है अगर वे अब मौजूद नहीं हैं?
संभाव्यताविषयक

1
आवृत्तियों के "दोहराया" स्वभाव के साथ मेरे पास यह मुद्दा है कि काम करने के लिए, स्थितियों को समान रहना चाहिए। लेकिन अगर स्थितियां समान रहती हैं, तो आपको अपने डेटा सेटों को एक साथ जमा करने और एक बेहतर अनुमान प्राप्त करने में सक्षम होना चाहिए। बार-बार आने वाला अतीत की जानकारी को शर्तों के तहत ठीक से अनदेखा कर देता है, जब इसे ध्यान में रखना उचित होता है।
प्रोबेबिलिसलॉजिक

5

बायेसियन आँकड़े कुछ तार्किक सिद्धांतों से प्राप्त किए जा सकते हैं। "विस्तारित तर्क के रूप में संभावना" की खोज करने का प्रयास करें और आप मूल सिद्धांतों के गहन विश्लेषण में अधिक पाएंगे। लेकिन मूल रूप से, बायेसियन आँकड़े तीन बुनियादी "डिसाइडेरेटा" या आदर्श सिद्धांतों पर टिकी हुई हैं:

  1. एक प्रस्ताव की संभाव्यता को एक वास्तविक संख्या द्वारा दर्शाया जाना है
  2. प्रशंसनीयता अगर एक प्रस्ताव "सामान्य ज्ञान" के साथ गुणात्मक पत्राचार है। यदि प्रारंभिक दिखावट दिया , फिर से बदल सी ( 0 )सी ( 1 ) ऐसी है कि पी ( एक | सी ( 1 ) ) > पी ( एक | सी ( 0 ) ) (ए हो जाता है अधिक प्रशंसनीय) और भी p ( B | A C (p(A|C(0))C(0)C(1)p(A|C(1))>p(A|C(0))(प्रदान की जाने वाली,) बस के रूप में प्रशंसनीय बी अवशेष तो हम होना आवश्यक हैपी(बी | सी ( 0 ) )पी(बी | सी ( 1 ) )( ए और बी में कम से कम प्रशंसनीय) और के रूप में होना चाहिएपी( ¯ एक | सी ( 1 ) )<पी( ¯ एक | सीp(B|AC(0))=p(B|AC(1))p(AB|C(0))p(AB|C(1))(ए को कम प्रशंसनीय नहीं बनना चाहिए)।p(A¯|C(1))<p(A¯|C(0))
  3. किसी प्रस्ताव की निरंतरता की गणना लगातार की जानी है । इसका मतलब है कि) यदि एक प्लाज़ेबिलिटी को 1 से अधिक तरीकों से तर्क किया जा सकता है, तो सभी उत्तर समान होने चाहिए; बी) दो समस्याओं में जहां हमें एक ही जानकारी के साथ प्रस्तुत किया जाता है, हमें एक ही प्लॉसबिलिटीज असाइन करनी चाहिए; और ग) हमें उन सभी सूचनाओं का ध्यान रखना चाहिए जो उपलब्ध हैं। हमें उस जानकारी को नहीं जोड़ना चाहिए जो वहां नहीं है, और हमें उस जानकारी को अनदेखा नहीं करना चाहिए जो हमारे पास है।

ये तीन डिसाइडेराटा (तर्क और निर्धारित सिद्धांत के नियमों के साथ) संभावना सिद्धांत के योग और उत्पाद नियमों को विशिष्ट रूप से निर्धारित करते हैं। इस प्रकार, यदि आप उपरोक्त तीन डिसाइडेरेटा के अनुसार तर्क करना चाहते हैं, तो आपको बायेसियन दृष्टिकोण अपनाना होगा । आपको "बायेसियन दर्शन" को अपनाने की आवश्यकता नहीं है, लेकिन आपको संख्यात्मक परिणामों को अपनाना होगा। इस पुस्तक के पहले तीन अध्याय इनका अधिक विस्तार से वर्णन करते हैं, और प्रमाण प्रदान करते हैं।

और अंतिम लेकिन कम से कम नहीं, "बायेसियन मशीनरी" आपके पास सबसे शक्तिशाली डेटा प्रोसेसिंग टूल है। यह मुख्य रूप से desiderata 3c के कारण है) आपके पास सभी जानकारी का उपयोग करते हुए (यह भी बताता है कि बेयर्स गैर-बेय से अधिक जटिल क्यों हो सकते हैं)। अपने अंतर्ज्ञान का उपयोग करके "क्या प्रासंगिक है" यह तय करना काफी मुश्किल हो सकता है। बेयस प्रमेय आपके लिए ऐसा करता है (और यह मनमानी धारणाओं में शामिल किए बिना भी करता है, 3 सी के कारण भी)।

H0H1L1H0L2H0

  1. P(H0|E1,E2,)Ei
  2. गणना करेंP(H1|E1,E2,)
  3. O=P(H0|E1,E2,)P(H1|E1,E2,)
  4. H0O>L2L1

H0O>>1H1O<<1O1

अब यदि गणना "बहुत कठिन" हो जाती है, तो आपको या तो संख्याओं का अनुमान लगाना होगा, या कुछ सूचनाओं को अनदेखा करना होगा।

काम करने वाले नंबरों के साथ एक वास्तविक उदाहरण के लिए इस प्रश्न का मेरा उत्तर देखें


3
मुझे यकीन नहीं है कि यह सवाल का जवाब कैसे देता है। बेशक इस सूची से डिसाइडेरेटम 1 से असहमत हैं, इसलिए बाकी तर्क उन पर लागू नहीं होते हैं। यह ओपी में किसी भी विशिष्ट प्रश्न का उत्तर नहीं देता है, जैसे कि "बायेसियन विश्लेषण अधिक शक्तिशाली या कम त्रुटि वाला होता है, जो लगातार विश्लेषण होता है"।
शेल्डनकोपर

@sheldoncooper - यदि कोई व्यक्ति डेसिडेरेटम 1 से असहमत है, तो वे किस आधार पर 95% विश्वास अंतराल का निर्माण कर सकते हैं? उन्हें एक अतिरिक्त संख्या की आवश्यकता होगी।
प्रोबेबिलिसलॉजिक

@sheldoncooper - और आगे, नमूना संभावनाओं को फिर से परिभाषित करना होगा, क्योंकि वे भी केवल 1 नंबर हैं। एक व्यक्ति अपने स्वयं के सिद्धांत को खारिज किए बिना डिसाइडेरेटम 1 को अस्वीकार नहीं कर सकता है
प्रोबेबिलिसलॉजिक

1
p(H1|...)p(E1,E2,...|H0)H0

1
"वे अपने स्वयं के सिद्धांत को खारिज किए बिना डिसाइडेरेटम 1 को अस्वीकार नहीं कर सकते हैं" - आपका क्या मतलब है? फ़्रीक्वेंटर्स के पास "प्रशंसनीयता" की कोई धारणा नहीं है। उनके पास "दोहराया परीक्षणों में घटना की आवृत्ति" की धारणा है। यह आवृत्ति आपके तीन डीसाइडरेट के समान स्थितियों को संतुष्ट करती है और इस प्रकार समान नियमों का पालन करने के लिए होती है। इस प्रकार कुछ भी जिसके लिए आवृत्ति की धारणा को परिभाषित किया गया है, आप बिना किसी समस्या के संभावना के कानूनों का उपयोग कर सकते हैं।
शेल्डनकोपर

2

मैं खुद बायेसियन स्टैटिस्टिक्स से परिचित नहीं हूं, लेकिन मुझे पता है कि स्केप्टिक्स गाइड टू द यूनिवर्स एपिसोड 294 में एरिक-जान वेगेनमेकर्स के साथ इंटरव्यू है, जहां वे बेयसियन स्टैटिस्टिक्स पर चर्चा करते हैं। यहां पॉडकास्ट का लिंक दिया गया है: http://www.theskepticsguide.org/archive/podcastinfo.aspx?mid=1&pid=294

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.