बायेसियन विश्लेषण के विपक्ष क्या हैं?


44

किसी भी संदर्भ में बायेसियन सांख्यिकीय विधियों के उपयोग के लिए कुछ व्यावहारिक आपत्तियां क्या हैं? नहीं, मेरा मतलब यह नहीं है कि पहले की पसंद के बारे में सामान्य कार्पिंग। मुझे खुशी होगी अगर इसका कोई जवाब नहीं मिला।


5
सवाल ठीक है, लेकिन टिप्पणियाँ सही लाइन अप करने के लिए हो रही हैं और उस लाइन के गलत पक्ष पर फैल करने की धमकी दे रही हैं। सावधान रहें ... यह इस तरह की बहस के लिए जगह नहीं है। यदि आप ऐसा करना चाहते हैं तो एक चैट रूम बनाएं।
whuber

जवाबों:


40

मैं आपको जवाब देने जा रहा हूं। चार कमियां वास्तव में। ध्यान दें कि इनमें से कोई भी वास्तव में आपत्तियां नहीं हैं, जिन्हें लगातार विश्लेषण करने के लिए सभी तरह से ड्राइव करना चाहिए, लेकिन बायोसियन फ्रेमवर्क के साथ जाने के लिए विपक्ष हैं:

  1. पूर्व की पसंद। यह एक कारण के लिए सामान्य कार्पिंग है, हालांकि मेरे मामले में यह सामान्य नहीं है "पादरी व्यक्तिपरक हैं!" लेकिन यह एक पूर्व के साथ आ रहा है जो अच्छी तरह से उचित है और वास्तव में एक को संक्षेप में प्रस्तुत करने के आपके सर्वोत्तम प्रयास का प्रतिनिधित्व करता है कई मामलों में बहुत अच्छा काम है। मेरे शोध प्रबंध का एक पूरा उद्देश्य, उदाहरण के लिए, "अनुमान पादरी" के रूप में अभिव्यक्त किया जा सकता है।
  2. यह कम्प्यूटेशनल रूप से गहन है। विशेष रूप से कई चर वाले मॉडल के लिए। कई वेरिएबल्स के अनुमान के साथ एक बड़े डेटासेट के लिए, यह बहुत अच्छी तरह से निषेधात्मक रूप से गहन रूप से गहन हो सकता है, विशेष रूप से कुछ परिस्थितियों में जहां डेटा आसानी से एक क्लस्टर या इस तरह नहीं फेंका जा सकता है। इसे हल करने के कुछ तरीके, जैसे MCMC के बजाय संवर्धित डेटा, कुछ हद तक सैद्धांतिक रूप से चुनौतीपूर्ण हैं, कम से कम मेरे लिए।
  3. जब तक कोई वितरणवादी, वितरण का पैरामीट्रिक विवरण प्रदान नहीं किया गया है, तब तक वितरण में कुछ हद तक मेटा-विश्लेषण शामिल करना मुश्किल है।
  4. इस बात पर निर्भर करता है कि विश्लेषण किस पत्रिका के लिए किया गया है, या तो आम तौर पर बेयस का उपयोग, या आपके पसंद के पुजारी, आपके पेपर को थोड़ा और अधिक अंक प्रदान करते हैं जहां एक समीक्षक इसमें खुदाई कर सकता है। इनमें से कुछ उचित समीक्षक आपत्तियां हैं, लेकिन कुछ बे की प्रकृति से सिर्फ स्टेम और कुछ क्षेत्रों में परिचित लोग इसके साथ हैं।

इनमें से कोई भी चीज आपको रोकनी नहीं चाहिए। दरअसल, इन बातों से कोई भी मुझे बंद कर दिया है, और उम्मीद है कि कर बायेसियन विश्लेषण पते के कम से कम 4 नंबर में मदद मिलेगी।


2
#, यह, आदर्श रूप से, पहले चरण का विश्लेषण होना चाहिए। कला में एक जलाया समीक्षा। विज्ञान में एक मात्रात्मक रोशनी की समीक्षा। बायसी को इसके बारे में क्षमाप्रार्थी नहीं होना चाहिए। अगर वे आदम और हव्वा के रूप में अगर फ्रीक डेटा का उपयोग करते हैं - ठीक है। मेरे पीएचडी का पहला अध्याय एक मेटा-विश्लेषण (यद्यपि लगातार) है। यह ऐसा ही होना चाहिए। # 2 मूर का कानून, मुझे स्थानीय उच्च प्रदर्शन कम्प्यूटिंग समूह के साथ एक संक्षिप्त और एक्सकेसीडी-आधारित चर्चा मिली है जो बहुत मदद कर सकता है। # 3 मेटा विश्लेषण किसी भी तरह से बेकार है। मैं अनिवार्य रोलिंग मेगा-विश्लेषण के पक्ष में होगा, दूसरे शब्दों में - जब आप प्रकाशित करते हैं तो अपना डेटा प्रदान करें।
रोज़र

7
@rosser कुछ विचार। # 1। वास्तव में एक मुकदमे की समीक्षा होनी चाहिए, और हाँ, यह एक कदम होना चाहिए। लेकिन एक उचित बायेसियन विश्लेषण जो सही ढंग से भ्रमित करने के लिए नियंत्रित करता है, को मॉडल में शामिल किए जाने वाले प्रत्येक चर की पूर्ण, मात्रात्मक रोशनी की समीक्षा की आवश्यकता होती है । यह कोई छोटा काम नहीं है। # 2। मूर के कानून के आधार पर एक बुरा विचार है। पहला, हालिया लाभ ज्यादातर मल्टी-कोर / जीपीयू सिस्टम में किए गए हैं। इसके लिए सॉफ्टवेयर की जरूरत होती है, और समानांतर प्रसंस्करण से होने वाली समस्याएं। MCMC के साथ किया गया एक एकल GLM मॉडल वह नहीं हो सकता है। कंट ...
फोमाइट

6
@ ब्रदर्स और एचपीसी के साथ समय हो सकता है जरूरी जवाब नहीं है। उदाहरण के लिए, मैं उन क्षेत्रों में काम करता हूं, जहां डेटा का उपयोग समझौते करते हैं और जैसे अक्सर डेटा को बेहद सुरक्षित प्रणालियों के अलावा चीजों पर संग्रहीत होने से रोकते हैं। स्थानीय क्लस्टर ... ऐसा नहीं है। और अंत में, मूर का कानून केवल उतना ही अच्छा है जितना आपका हार्डवेयर बजट बड़ा है। # 3 और मेटा-विश्लेषण के लिए, मैं असहमत हूं, लेकिन इससे परे, यह एक समस्या बनी हुई है जब तक कि बिंदु पूरी तरह से खुले-डेटा सिस्टम का आदर्श नहीं बन जाता।
फोमाइट

ठीक है मैंने # 3 ओवर किया। लेकिन परिणाम से पहले हर कोई कितना अंतर करता है? srsly? क्या एक संवेदनशीलता विश्लेषण भारी अंतर दिखाता है?
रोज़र

1
@ रॉसर यह संभावना आपके भविष्यवक्ता की प्रकृति और उसके संपर्क और परिणाम के संबंध पर निर्भर करती है। लेकिन संवेदनशीलता विश्लेषण करने के लिए किसी को उन सभी चर के लिए पूर्व होना चाहिए। शायद मैं इसे अपने शोध प्रबंध के साइड-बिट के रूप में जोड़ूंगा। मैं भी बे की ताकत का सह-विरोध कर रहा हूं, लेकिन चर पर एकतरफा पुजारियों को संभालने के लिए जहां "मुझे पता लगाने के लिए परेशान नहीं किया जा सकता है" कुछ समस्याग्रस्त है।
फोमाइट

16

मैं झुकाव से बायेसियन हूं, लेकिन आम तौर पर व्यवहार में एक निरंतरवादी हूं। इस का कारण यह पूर्ण बायेसियन विश्लेषण के प्रदर्शन कि आम तौर पर है ठीक से (न कि जैसे एमएपी समाधान की तुलना में) समस्या के प्रकार के लिए मैं कर रहा हूँ दिलचस्पी में मुश्किल और कंप्यूटेशनल रूप से संवेदनशील है। अक्सर एक पूर्ण बायेसियन विश्लेषण की आवश्यकता होती है जो वास्तव में अक्सर समतुल्य समकक्षों पर इस दृष्टिकोण का लाभ देखता है।

मेरे लिए, व्यापार-बंद मूल रूप से बेयसियन विधियों के बीच एक विकल्प है जो वैचारिक रूप से सुरुचिपूर्ण और समझने में आसान हैं, लेकिन अभ्यास और अक्सरवादी तरीकों में लागू करना मुश्किल है, जो कि वैचारिक रूप से अजीब और सूक्ष्म हैं (यह समझाने की कोशिश करें कि हाइपेसिस परीक्षा की सटीक व्याख्या कैसे करें) क्यों एक 95% संभावना नहीं है कि सच्चा मूल्य एक 95% विश्वास अंतराल में है), लेकिन जो आसानी से "रसोई की किताब" समाधान को लागू करने के लिए अनुकूल हैं।

मैदान के लिए घोड़े।


11

विशुद्ध रूप से व्यावहारिक दृष्टिकोण से, मैं उन तरीकों का प्रशंसक नहीं हूं जिनके लिए बहुत अधिक संगणना की आवश्यकता है (मैं गिब्स नमूना और एमसीएमसी के बारे में सोच रहा हूं, जिसे अक्सर बेयसियन ढांचे में उपयोग किया जाता है, लेकिन यह अक्सर विश्लेषण में उदाहरण के लिए बूटस्ट्रैप तकनीकों पर भी लागू होता है )। इसका कारण यह है कि किसी भी तरह के डिबगिंग (कार्यान्वयन का परीक्षण, मान्यताओं के संबंध में मजबूती को देखते हुए, आदि ) को खुद मोंटे कार्लो सिमुलेशन का एक गुच्छा की आवश्यकता होती है, और आप जल्दी से एक कम्प्यूटेशनल मोरस में हैं। मैं अंतर्निहित विश्लेषण तकनीकों को तेज और नियतात्मक होना पसंद करता हूं, भले ही वे केवल अनुमानित हों।

यह विशुद्ध रूप से व्यावहारिक आपत्ति है, निश्चित रूप से: अनंत कंप्यूटिंग संसाधनों को देखते हुए, यह आपत्ति गायब हो जाएगी। और यह केवल बायेसियन विधियों के सबसेट पर लागू होता है। इसके अलावा, यह मेरे वर्कफ़्लो को दिए गए एक प्राथमिकता के अधिक है।


1
अब तक मैं सुन रहा हूँ 1. मूर ’कानून, 2. कड़ी मेहनत +/- धैर्य और 3. अज्ञानता। कहना है कि इनमें से कोई भी आश्वस्त नहीं है। बेयर्स इस तरह के एक से अधिक arching प्रतिमान जैसा लगता है। उदाहरण के लिए ... GWAS अध्ययनों का विश्लेषण क्यों नहीं किया गया। क्या वे 99.999% डेटा को फेंकने से रोक सकते थे?
रोज़र

1
इसके विपरीत: MCMC तेजी से कोड लिखने के लिए और सिमुलेशन पूरा होने के इंतजार की पीड़ा से सीख सकता है। यह मॉडलिंग के साथ मेरा अनुभव रहा है: अगर इसे चलाने में लंबा समय लगता है, तो मुझे यह सीखने में फायदा हो सकता है कि कोड को तेज कैसे बनाया जाए।
इटरेटर

9

कभी-कभी एक समस्या का एक सरल और प्राकृतिक "शास्त्रीय" समाधान होता है, जिस स्थिति में एक फैंसी बायेसियन विधि (विशेष रूप से एमसीएमसी के साथ) ओवरकिल होगी।

इसके अलावा, चर चयन प्रकार की समस्याओं में, दंडित संभावना की तरह कुछ पर विचार करना अधिक सरल और स्पष्ट हो सकता है; ऐसे मॉडल पर एक पूर्व मौजूद हो सकता है जो एक समान बायेसियन दृष्टिकोण प्रदान करता है, लेकिन अंतिम प्रदर्शन के अनुरूप पूर्व कैसे दंड और प्रदर्शन के बीच के संबंध से कम स्पष्ट हो सकता है।

अंत में, MCMC विधियों को अक्सर अभिसरण / मिश्रण का आकलन करने और परिणामों की समझ बनाने के लिए एक विशेषज्ञ की आवश्यकता होती है।


9

मैं बायेसियन विधियों में अपेक्षाकृत नया हूं, लेकिन एक चीज जो मुझे परेशान करती है, वह यह है कि जब मैं पादरियों के औचित्य को समझता हूं (अर्थात विज्ञान एक संचयी प्रयास है, तो अधिकांश प्रश्नों के लिए पिछले अनुभव / सोच की कुछ मात्रा है जो आपको चाहिए) डेटा की व्याख्या), मुझे यह पसंद नहीं है कि बायेसियन दृष्टिकोण आपको विश्लेषण की शुरुआत में विषय को आगे बढ़ाने के लिए मजबूर करता है, जिससे अंतिम परिणाम आकस्मिक होता है। मेरा मानना ​​है कि यह दो कारणों से समस्याग्रस्त है: 1) कुछ कम अच्छी तरह से वाकिफ पाठकों ने भी पुजारियों पर ध्यान नहीं दिया, और बेयसियन परिणामों को गैर-आकस्मिक के रूप में व्याख्या करेंगे; 2) जब तक कच्चा डेटा उपलब्ध नहीं है, पाठकों के लिए अपने स्वयं के व्यक्तिपरक पादरियों में परिणामों को फिर से लिखना कठिन है। यही कारण है कि मैं संभावना अनुपात पसंद करता हूं,

(सूक्ष्म आलोचक ध्यान देंगे कि यहां तक ​​कि संभावना अनुपात "आकस्मिक" इस अर्थ में है कि यह तुलना किए जा रहे मॉडल के मानकीकरण पर आकस्मिक है; हालांकि यह सभी विधियों, फ्रीक्वेंटिस्ट, बायेसियन और लिकैलिहुडिस्ट द्वारा साझा की गई विशेषता है)


9
अक्सर स्टैटिस्टिक स्टैटिस्टिक्स के साथ समस्या यह है कि इसमें सब्जेक्टिविटी होती है, लेकिन इसका उल्लेख बिल्कुल नहीं है। संभावना अनुपातों के साथ (व्यावहारिक) परेशानी यह है कि वे संभावना का अनुकूलन करने पर आधारित हैं और इसलिए इस तथ्य को अनदेखा करते हैं कि संभावना के साथ अन्य समाधान केवल थोड़े कम हो सकते हैं। यह वह जगह है जहाँ बेयस कारक उपयोगी है। लेकिन यह हमेशा "घोड़ों के लिए पाठ्यक्रम" है।
डिक्रान मार्सुपियल

6

निर्णय सिद्धांत अंतर्निहित सिद्धांत है जिस पर सांख्यिकी संचालित होती है। समस्या डेटा से निर्णय लेने के लिए एक अच्छी (कुछ अर्थों में) प्रक्रिया खोजने की है। हालांकि, अपेक्षित नुकसान को कम करने के अर्थ में, शायद ही कभी विकल्प का एक अस्पष्ट विकल्प होता है, इसलिए उन्हें चुनने के लिए अन्य मानदंडों को लागू करना होगा। कुछ पूर्व के संबंध में बेयस की प्रक्रियाओं को चुनना इन मानदंडों में से एक है, लेकिन यह हमेशा वह नहीं हो सकता है जैसा आप चाहते हैं। किसी मामले में, या निष्पक्षता में मिनिमैक्स अधिक महत्वपूर्ण हो सकता है।

जो कोई भी जोर देकर कहता है कि आव्रजक गलत हैं या बायेसियन या गलत हैं वे ज्यादातर आंकड़ों की अपनी अज्ञानता का खुलासा कर रहे हैं।


5

कुछ समय के लिए मैं खुद को और अधिक शिक्षित करना चाहता था ताकि मेरी सरसरी समझ को प्राप्त करने के लिए मॉडलिंग के बारे में बायेसियन दृष्टिकोण पर (मैंने स्नातक पाठ्यक्रम के काम में गिब्स के नमूनों को कोडित किया है, लेकिन कभी भी वास्तविक नहीं किया है)। जिस तरह से मैंने सोचा है कि ब्रायन डेनिस के कुछ कागजात हालांकि भड़काऊ रहे हैं और मैंने चाहा है कि कागज़ पढ़ने और उनके काउंटरपॉइंट्स सुनने के लिए मुझे एक बायेसियन दोस्त (जो अलमारी में नहीं थे) मिल सकते हैं। इसलिए, यहां वे कागजात हैं जिनका मैं उल्लेख कर रहा हूं, लेकिन मुझे हमेशा याद रखने वाला उद्धरण है

बायेसियन होने का मतलब यह है कि आप गलत नहीं हैं।

http://facademy.washington.edu/skalski/classes/QERM597/papers/Dennis_1996.pdf http://classes.warnercnr.colostate.edu/nr575/files/2011/01/Lele-and-Dennis-2009.pdf


1
सिद्धांत बनाम बनाम कैसे अभ्यास किया जाता है, इसके बारे में पहला पेपर (दूसरे को नहीं पढ़ा है) अधिक लगता है। व्यवहार में मॉडल को उतनी कठोरता से नहीं देखा जाना चाहिए, लेकिन सिद्धांत रूप में बायेसियन आंकड़ों में बेहतर मॉडल की जांच सुविधाएं हैं, जिन्हें जेनेस द्वारा "सबूत" कहा जाता है, जो कि बेयस नियम के हर (पी | मॉडल) में सन्निहित है। इसके साथ आप एक मॉडल की उपयुक्तता की तुलना कर सकते हैं, कुछ ऐसा जो आप केवल लगातार आंकड़ों में अनुभव कर सकते हैं। समस्या, निश्चित रूप से, यह है कि साक्ष्य की गणना करना कठिन है, इसलिए अधिकांश लोग इसे अनदेखा करते हैं और सोचते हैं कि पीछे का हिस्सा सभी महत्वपूर्ण कारक (cont'd) है
cespinoza

2
भा। 2 "स्कीइंग नेस्टेड सैंपलिंग" को देखने की कोशिश करें और आपको सबूतों की गणना के लिए MCMC विधि पर एक पेपर मिलेगा। (अन्य, गैर-सबूत आधारित मॉडल जाँच विधियों के रूप में अच्छी तरह से कर रहे हैं: जेलमैन अपने मॉडल की जांच करके प्रतिरूप से पूर्वसूचक और वास्तविक डेटा की तुलना में (नेत्रहीन या अन्यथा) की तुलना करता है।) कुछ लोग यह भी सुझाव देते हैं कि मॉडल को देखने के साथ औसत होना चाहिए। मॉडल का स्थान ही हाशिए पर है। एक और चीज़ जो हम क्षितिज पर देख सकते हैं, वह है गैरपारंपरिक बेयर्स, जो पारंपरिक पैरामीट्रिक मॉडल की तुलना में मॉडल की बहुत व्यापक श्रेणी को अनुमति देकर समस्या को हल करती है।
cespinoza

5
इसके अलावा, मेरा सुझाव है कि आप माइकल आई। जॉर्डन द्वारा वीडियोलेचर.नेट / एमएलएसएस09uk_jordan_bfway देखें , बर्कले में एक प्रोफेसर जो माना जाता है कि बेयस बनाम फ्रीक पर उनके विचारों में काफी संतुलित है। "युद्ध"। मैं वास्तव में पहले पेपर b / c के दूसरे भाग पर टिप्पणी नहीं कर सकता / सकती हूं, जिसे मैं किसी भी पारिस्थितिक संदर्भ में नहीं जानता हूं। मैं बाद में दूसरा पढ़ूंगा।
सेस्पिनोज़ा

1
@cespinoza: मैं काम करने के तरीके पर यह सोच रहा था। पेपर का कहना है कि एक बायेसियन कभी भी अवशेषों को नहीं देखेगा (यानी वास्तविक डेटा के लिए मॉडल आउटपुट की तुलना करता है), और शायद एक सख्त बायेसियन इस सिद्धांत पर आगे निकल सकता है, लेकिन जेलमैन जैसे चिकित्सक वास्तविक डेटा के लिए मॉडल आउटपुट (भविष्य कहनेवाला) की तुलना जरूर करते हैं। मैं आगे जाने के लिए पर्याप्त नहीं जानता, लेकिन कागजात के बारे में मेरी धारणा यह है कि उन्होंने "सिद्धांत रूप में" स्ट्रॉ पुरुषों पर हमला करने के लिए स्थापित किया है।
वेन

1
बस जोड़ें कि एक Bayesian जो अवशेषों की जांच नहीं करता है वह एक बुरा सांख्यिकीविद् है। आमतौर पर, बायेसियन पद्धति का उपयोग "मोटा और तैयार" मॉडल और पूर्व के साथ किया जाता है। अवशिष्ट की जाँच करना यह देखने का एक तरीका है कि क्या आपको अपना ज्ञान पूर्व और मॉडल में पर्याप्त मिला है। यह जाँचने के लिए हाथ से जाता है कि आपके मॉडल में कौन सी सैद्धांतिक विशेषताएं हैं और पूर्व में है
संभावना 14

5

आईएसबीए त्रैमासिक समाचार पत्र से बेयसियन सांख्यिकी में खुली समस्याएं क्या हैं , क्षेत्र में विभिन्न नेताओं के बायेसियन आंकड़ों के साथ 5 समस्याएं, # 1 जा रहा है, उबाऊ रूप से पर्याप्त है, "मॉडल चयन और परिकल्पना परीक्षण"।


3
क्यों उबाऊ है ?! यह सांख्यिकीय विधियों के सबसे लगातार उपयोगों में से एक है।
शीआन 12
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.