बायेसियन सांख्यिकी में शक्ति विश्लेषण आवश्यक है?


19

मैं हाल ही में शास्त्रीय आँकड़ों पर बायेसियन लेने पर शोध कर रहा हूँ। बेयस फैक्टर के बारे में पढ़ने के बाद मुझे आश्चर्य हुआ कि यदि आंकड़ों के इस दृष्टिकोण में बिजली विश्लेषण एक आवश्यकता है। यह सोचने का मेरा मुख्य कारण यह है कि बेयस कारक वास्तव में केवल एक संभावना अनुपात प्रतीत होता है। एक बार जब यह 25: 1 हो जाता है तो ऐसा लगता है कि मैं इसे रात कह सकता हूं।

क्या मैं दूर हूं? किसी भी अन्य पढ़ने मैं अधिक जानने के लिए कर सकते हैं? वर्तमान में इस पुस्तक को पढ़ना: परिचय बायसेन स्टैटिस्टिक्स , डब्लूएम बोलस्टैड (विली-इंटरसाइंस; दूसरा संस्करण, 2007)।



जवाबों:


10

भविष्य के अध्ययनों में पावर लंबे समय तक p <0.05 (अल्फा) की संभावना के बारे में है। बे में अध्ययन से साक्ष्य नीचे लाइन पर अध्ययन बी, आदि के लिए पुजारियों में खिलाती है। इसलिए, अक्सर आंकड़ों में परिभाषित शक्ति वास्तव में मौजूद नहीं है।


12
शक्ति का एक कम सीमित दृश्य इसे 0-1 हानि समारोह के लिए जोखिम वक्र की अभिव्यक्ति के रूप में देखता है। एक बायेसियन विश्लेषण पूर्व जोखिम पर उस जोखिम को एकीकृत करता है। हालांकि, अच्छे बायेसियन विश्लेषण पूर्व वितरण की पसंद के लिए अपने परिणामों की संवेदनशीलता पर विचार करते हैं। यह हमें शक्ति विश्लेषण के क्षेत्र में वापस लाने के लिए प्रतीत होता है। यद्यपि यह उस नाम से नहीं जा सकता है और अलग-अलग गणना की जाएगी, उद्देश्य समान होगा: अर्थात्, यह निर्धारित करना कि अध्ययन के उद्देश्यों को पूरा करने के लिए कितना बड़ा नमूना प्राप्त करना है।
whuber

2
यह एक बहुत अच्छा बिंदु Whuber है। हालाँकि, यह शक्ति गणना का एकमात्र कारण नहीं है और कई बायेसियन तर्क देंगे कि यह अनावश्यक है क्योंकि आपको पहले से एन (एक गलती) निर्धारित करने की आवश्यकता नहीं है।
जॉन

5
एन

2
मैं इस विचार के साथ नहीं आया था, कई पेपर हैं जहां बायेसियन का तर्क है कि आप विषयों को जोड़ सकते हैं जब तक कि आपके पास लगातार परीक्षण करने का विरोध करने के लिए पर्याप्त सबूत हों, जहां इस तरह के परीक्षण और प्रक्रियाओं को जोड़ने का काम नहीं होता है। मुझे लगता है कि मैं एक संदर्भ देख सकता हूं। सबसे विशेष रूप से यह प्रस्ताव है कि नैदानिक ​​परीक्षणों में डेटा का विश्लेषण कैसे किया जाए।
जॉन

8
एन

14

आप बायेसियन आंकड़ों के साथ परिकल्पना परीक्षण कर सकते हैं। उदाहरण के लिए, आप निष्कर्ष निकाल सकते हैं कि यदि शून्य से अधिक घनत्व का 95% से अधिक है तो प्रभाव शून्य से अधिक है। या विकल्प के रूप में, आप बेयस कारकों के आधार पर द्विआधारी निर्णय के कुछ रूप को नियोजित कर सकते हैं।

एक बार जब आप इस तरह की निर्णय लेने की प्रणाली स्थापित करते हैं, तो किसी दिए गए डेटा जनरेट करने की प्रक्रिया और नमूना आकार मानकर सांख्यिकीय शक्ति का आकलन करना संभव है। आप अनुकरण के उपयोग से दिए गए संदर्भ में आसानी से इसका आकलन कर सकते हैं।

उस ने कहा, एक बायेसियन दृष्टिकोण अक्सर बिंदु अनुमान की तुलना में विश्वसनीयता अंतराल पर अधिक ध्यान केंद्रित करता है, और बाइनरी निर्णय के बजाय विश्वास की डिग्री। निष्कर्ष के लिए इस अधिक निरंतर दृष्टिकोण का उपयोग करके, आप इसके बजाय अपने डिजाइन के प्रभाव पर अन्य प्रभावों का आकलन कर सकते हैं। विशेष रूप से, आप किसी दिए गए डेटा जनरेटिंग प्रक्रिया और नमूना आकार के लिए अपने विश्वसनीयता अंतराल के अपेक्षित आकार का आकलन करना चाह सकते हैं।


3

इस समस्या के कारण बहुत सी गलतफहमियाँ हो जाती हैं क्योंकि लोग बार-बार प्रश्न पूछने के लिए बायसियन आँकड़ों का उपयोग करते हैं। उदाहरण के लिए, लोग यह निर्धारित करना चाहते हैं कि क्या वेरिएंट B वेरिएंट A से बेहतर है। वे इस प्रश्न का उत्तर बायेसियन स्टैटिस्टिक्स के साथ दे सकते हैं, यदि यह निर्धारित किया जाए कि उन दो पीछे के डिस्ट्रीब्यूशन (BA) के बीच के अंतर का 95% उच्चतम घनत्व 0 या उससे अधिक है या नहीं 0. के आसपास व्यावहारिक महत्व का क्षेत्र। यदि आप लगातार सवालों के जवाब देने के लिए बायेसियन सांख्यिकी का उपयोग करते हैं, हालांकि, आप अभी भी लगातारवादी त्रुटियां कर सकते हैं: टाइप I (झूठी सकारात्मकता; opps - B वास्तव में बेहतर नहीं है) और II टाइप करें (मिस, महसूस करने में विफल; वह B सही मायने में बेहतर है)।

एक शक्ति विश्लेषण का बिंदु प्रकार II त्रुटियों को कम करता है (जैसे कि मौजूद होने पर प्रभाव खोजने का कम से कम 80% मौका है)। बायसीयन सांख्यिकी का उपयोग करते समय एक शक्ति विश्लेषण का भी उपयोग किया जाना चाहिए ताकि ऊपर वाले की तरह लगातार सवाल पूछे जा सकें।

यदि आप एक शक्ति विश्लेषण का उपयोग नहीं करते हैं, और फिर आप इसे इकट्ठा करते समय अपने डेटा को बार-बार झांकते हैं और फिर केवल एक बार जब आप एक महत्वपूर्ण अंतर पाते हैं, तो आप अधिक टाइप I (गलत अलार्म) त्रुटियों की अपेक्षा करने जा रहे हैं जो आप अपेक्षा कर सकते हैं - यदि आप लगातार आंकड़ों का उपयोग कर रहे हैं।

चेक आउट:

https://doingbayesiandataanalysis.blogspot.com/2013/11/optional-stopping-in-data-collection-p.html

http://varianceexplained.org/r/bayesian-ab-testing/

ध्यान दें - कुछ बायेशियन दृष्टिकोण को कम कर सकते हैं, लेकिन खत्म नहीं कर सकते हैं, एक प्रकार की त्रुटि बनाने की संभावना (जैसे, एक उपयुक्त जानकारीपूर्ण पूर्व)।


0

उदाहरण के लिए नैदानिक ​​परीक्षण में एक शक्ति विश्लेषण की आवश्यकता की गणना / अनुमान लगाने में सक्षम होने के लिए कि कितने प्रतिभागियों को भर्ती करने के लिए एक उपचार प्रभाव (किसी दिए गए न्यूनतम आकार का) का मौका मिलने पर मौजूद है। यह रोगियों की एक अंतहीन संख्या को भर्ती करने के लिए संभव नहीं है, पहला समय की कमी के कारण और दूसरा लागत की कमी के कारण।

इसलिए, कल्पना कीजिए कि हम एक बायेशियन दृष्टिकोण के लिए कह रहे हैं जो नैदानिक ​​परीक्षण है। हालांकि फ्लैट पुजारी सिद्धांत रूप में संभव हैं, फिर भी पूर्व की संवेदनशीलता वैसे भी उचित है, दुर्भाग्य से, एक से अधिक फ्लैट पहले उपलब्ध है (जो अजीब है कि मैं अब सोच रहा हूं, क्योंकि वास्तव में पूरी तरह से अनिश्चितता व्यक्त करने का एक ही तरीका होना चाहिए)।

तो, कल्पना कीजिए कि, आगे, हम एक संवेदनशीलता विश्लेषण करते हैं (मॉडल और न केवल पूर्व भी यहां जांच के अधीन होगा)। इसमें 'सत्य' के लिए एक प्रशंसनीय मॉडल से अनुकरण शामिल है। शास्त्रीय / आवृत्तिवादी आंकड़ों में, 'सत्य' के लिए यहां चार उम्मीदवार हैं: H0, mu = 0; H1, mu! = 0 जहाँ या तो त्रुटि के साथ देखे जाते हैं (जैसा कि हमारी वास्तविक दुनिया में है), या त्रुटि के बिना (अप्रचलित वास्तविक दुनिया में)। बेयसियन आंकड़ों में, यहां 'सत्य' के लिए दो उम्मीदवार हैं: म्यू एक यादृच्छिक चर है (जैसा कि वास्तविक वास्तविक दुनिया में है); म्यू एक यादृच्छिक चर है (जैसा कि हमारे अवलोकन योग्य वास्तविक दुनिया में, अनिश्चित व्यक्ति के दृष्टिकोण से)।

तो वास्तव में यह निर्भर करता है कि आप संवेदनशीलता विश्लेषण द्वारा ट्रायल और बी) द्वारा ए) को समझाने की कोशिश कर रहे हैं। यदि यह एक ही व्यक्ति नहीं है, तो यह काफी अजीब होगा।

वास्तव में प्रश्न क्या है, इस बात पर आम सहमति है कि सत्य क्या है और ठोस साक्ष्य की पुष्टि करता है। साझा आधार यह है कि हस्ताक्षर संभाव्यता वितरण हमारी वास्तविक अवलोकन योग्य दुनिया में देखने योग्य हैं जो किसी न किसी तरह से कुछ अंतर्निहित गणितीय सत्य हैं जो कि बस संयोग से ऐसा होता है, या डिजाइन द्वारा होता है। मैं वहां रुक जाऊंगा क्योंकि यह एक कला पृष्ठ नहीं है, बल्कि एक विज्ञान पृष्ठ है, या यह मेरी समझ है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.