जब बेयसियन तरीके आवृत्तिवादी के लिए बेहतर हैं?


18

मैं वास्तव में बायेसियन तकनीकों के बारे में सीखना चाहता हूं, इसलिए मैं खुद को थोड़ा सिखाने की कोशिश कर रहा हूं। हालाँकि, मुझे यह देखने में कठिन समय हो रहा है जब बेयसियन तकनीकों का उपयोग करते हुए कभी-कभी फ़्रीक्वेंटिस्ट विधियों पर लाभ मिलता है। उदाहरण के लिए: मैंने साहित्य में थोड़ा देखा है कि कैसे कुछ जानकारीपूर्ण पुजारी का उपयोग करते हैं जबकि अन्य गैर-सूचनात्मक पूर्व का उपयोग करते हैं। लेकिन अगर आप एक गैर-जानकारीपूर्ण पूर्व का उपयोग कर रहे हैं (जो वास्तव में आम लगता है?) और आप पाते हैं कि पीछे वितरण, कहते हैं, एक बीटा वितरण है ... क्या आप शुरुआत में केवल एक बीटा वितरण फिट नहीं कर सकते हैं और कहा जाता है यह अच्छा? मैं यह नहीं देखता कि एक पूर्व वितरण का निर्माण कैसे किया जाता है जो आपको कुछ भी नहीं बताता है ... क्या, ठीक है, वास्तव में आपको कुछ भी बता सकता है?

यह पता चला है कि कुछ तरीके जो मैं आर में उपयोग कर रहा हूँ, बायेसियन और फ़्रीक्वेंटिस्ट विधियों के मिश्रण का उपयोग करते हैं (लेखक यह स्वीकार करते हैं कि यह कुछ असंगत है) और मैं यह भी नहीं समझ सकता कि बायेसियन कौन से हिस्से हैं। वितरण फिटिंग के अलावा, मैं यह भी पता नहीं लगा सकता कि आप बायेसियन विधियों का उपयोग कैसे करेंगे। क्या "बायेसियन रिग्रेशन" है? वो कैसा लगता है? सभी मैं कल्पना कर सकता हूं कि यह बार-बार अंतर्निहित वितरण पर अनुमान लगा रहा है जबकि फ़्रीक्वेंटिस्ट डेटा के बारे में कुछ सोचता है, नेत्रगोलक करता है, एक पॉइसन वितरण देखता है और एक जीएलएम चलाता है। (यह एक आलोचना नहीं है ... मैं वास्तव में सिर्फ समझ में नहीं आता!)

तो .. कुछ प्राथमिक उदाहरणों से मदद मिलेगी? और यदि आप अपने जैसे वास्तविक शुरुआती लोगों के लिए कुछ व्यावहारिक संदर्भों के बारे में जानते हैं, तो यह वास्तव में भी उपयोगी होगा!


इस की संभावित नकल ?
Glen_b -Reinstate मोनिका

एर, जैसा दिखता है? मेरे सवाल का जवाब देने के करीब आने के बाद से आपका स्वागत है। मुझे अभी भी मेरे द्वारा वर्णित सरल स्थितियों के बारे में आश्चर्य है (क्योंकि मैंने उस धागे पर सूचीबद्ध तकनीकों के बारे में कभी नहीं सुना है) लेकिन मुझे लगता है कि मेरा जवाब यह है कि लोग प्रतिगमन / आदि के लिए बायसियन तकनीकों का उपयोग नहीं करते हैं क्योंकि स्थापित और आसान लगातार तकनीकों मौजूद हैं?
HFBrowning

2
लोग प्रतिगमन के लिए बेयसियन तकनीकों का उपयोग करते हैं। लेकिन क्योंकि अक्सरवादी तरीके बहुत सुविधाजनक होते हैं और बहुत से लोग व्यावहारिक होते हैं कि वे किस दृष्टिकोण का उपयोग करते हैं, इसलिए अक्सर जो लोग या तो उपयोग करने के लिए खुश होते हैं वे साधारण प्रतिगमन का उपयोग करेंगे यदि कुछ अधिक जटिल की आवश्यकता नहीं है। लेकिन जैसे ही आपको थोड़ी अधिक जटिलता से निपटने की आवश्यकता होती है, या औपचारिक रूप से पूर्व सूचना, या किसी भी अन्य कारणों को शामिल करने की आवश्यकता होती है, तब बायेसियन दृष्टिकोण में मामूली अतिरिक्त काम अच्छा लगने लगता है।
Glen_b -Reinstate मोनिका

यह समझ में आता है, धन्यवाद। कुछ अन्य सूत्र के आसपास पढ़ने से मेरे लिए उपयोग स्पष्ट हो गए हैं।
HFBrowning

कुछ और जो प्रासंगिक है .. एक बायेसियन सेटिंग में प्रतिगमन के लिए, गुणांक के लिए सबसे अधिक उपयोग किए जाने वाले पुजारी मल्टीवेरेट नॉर्मल और मल्टीवेरेट लाप्लास हैं। इन पुजारियों का उपयोग गुणांक पर संकोचन दंड लगाने के लिए करता है, क्रमशः रिज प्रतिगमन या LASSO का उपयोग करने के लिए उन्हें बराबर बनाता है, अगर किसी को बायेसियन एल्गोरिथ्म के बाद गुणांक का एमएपी अनुमान लेना था। यह इन परिणामों की गणना करने के लिए अधिक किफायती है जो पूरी तरह से बायेसियन नहीं है, और यदि वे मूल रूप से समतुल्य हैं .. तो परेशान क्यों?

जवाबों:


11

यहां कुछ लिंक दिए गए हैं जो आपको लगातार और बायेसियन तरीकों की तुलना करने में रुचि दे सकते हैं:

संक्षेप में, जिस तरह से मैंने इसे समझा है, डेटा के एक विशिष्ट सेट को देखते हुए, अक्सरवादी का मानना ​​है कि एक सच्चा, अंतर्निहित वितरण है जिसमें से डेटा उत्पन्न किया गया था। सटीक मापदंडों को प्राप्त करने में असमर्थता परिमित नमूना आकार का एक कार्य है। दूसरी ओर, बायेसियन का मानना ​​है कि हम मापदंडों के बारे में कुछ धारणा से शुरू करते हैं (भले ही अनजाने में) और उन मापदंडों के बारे में हमारी राय को परिष्कृत करने के लिए डेटा का उपयोग करें। दोनों एक मॉडल विकसित करने की कोशिश कर रहे हैं जो टिप्पणियों को समझा सकता है और भविष्यवाणियां कर सकता है; अंतर मान्यताओं में है (वास्तविक और दार्शनिक दोनों)। एक पिथी, गैर-कठोर, कथन के रूप में, कोई भी कह सकता है कि लगातारवादी का मानना ​​है कि पैरामीटर तय हो गए हैं और डेटा यादृच्छिक है; बायेसियन का मानना ​​है कि डेटा तय हो गया है और पैरामीटर यादृच्छिक हैं। कौन सा बेहतर या बेहतर है? यह उत्तर देने के लिए कि आपको बस खोदना और महसूस करना हैक्या धारणाएं प्रत्येक को लुभाती हैं (उदाहरण के तौर पर पैरामीटर विषम रूप से सामान्य हैं?)।


2
बहुत बढ़िया और दिलचस्प जवाब, लेकिन इसने मेरे सवालों का सबसे सीधे जवाब दिया। धन्यवाद
HFBrowning

@ एवराम का पहला लिंक टूट गया है
एरिक हैम्बर्ज़ुमियान

1
@ErikHambardzumyan धन्यवाद Wayback मशीन पर सहेजा गया संस्करण मिला।
अवराम

10

दो दृष्टिकोणों के बीच विरोधाभासों के कई दिलचस्प पहलुओं में से एक यह है कि हम लगातार डोमेन में प्राप्त कई मात्राओं के लिए औपचारिक व्याख्या करना बहुत मुश्किल है। एक उदाहरण दंड विधि (सिकुड़न) के बढ़ते हुए महत्व का है। जब कोई दंडित अधिकतम संभावना अनुमान प्राप्त करता है, तो पक्षपाती बिंदु अनुमान और "आत्मविश्वास अंतराल" व्याख्या करना बहुत मुश्किल होता है। दूसरी ओर, बेयसियन पीछे के मापदंडों के लिए वितरण जो शून्य की ओर दंडित किया गया है एक शून्य से पहले केंद्रित वितरण का उपयोग पूरी तरह से मानक व्याख्याएं हैं।


1
यह लाभप्रद है। मुझे आश्चर्य है कि अगर यह मुख्य रूप से सच है जब लैंबडा को एक प्राथमिकता-प्राथमिकता का चयन किया जाता है, हालांकि। अक्सर, कोई नमूना भविष्यवाणी त्रुटि के बाहर का अनुकूलन करने के लिए क्रॉस-वैलिडेशन का उपयोग कर लैम्ब्डा का चयन कर सकता है। किस मामले में, यह मुझे यह कहने के लिए अजीब लगता है कि लैंबडा 'पूर्व सूचना' के बराबर है जिसे आपने विश्लेषण में लाया था।
गूँग - मोनिका

1
λ=σ2λ

3
मैं कहता हूं कि लैंबडा पूर्व का एक हाइपर-पैरामीटर था (जिसके लिए अधिक बायेसियन होने पर आप हाइपर-पूर्व और हाशिए पर हो सकते थे और साथ ही jmlr.org/papers/volume8/cawley07a/awawley07a.pdf )
डिक्रान मार्सुपियल

5

मैं स्टेन उपयोगकर्ताओं के समूह से इस थोक चोरी कर रहा हूँ। माइकल बेटनकोर्ट ने बायेसियन इंट्रेंस में पहचान की यह वास्तव में अच्छी चर्चा प्रदान की , जो मुझे विश्वास है कि दो सांख्यिकीय स्कूलों के विपरीत आपके अनुरोध पर भालू है।

बायेसियन विश्लेषण के साथ पहला अंतर पुजारियों की उपस्थिति होगी, जो कमजोर होने पर भी उन 4 मापदंडों के लिए एक परिमित पड़ोस में बड़े पैमाने पर दबाव डालेगा (अन्यथा आपके पास पहले से वैध नहीं होगा)। इसके बावजूद, आप अभी भी इस अर्थ में गैर-पहचान कर सकते हैं कि पीछे की ओर अनंत डेटा की सीमा में एक बिंदु द्रव्यमान में परिवर्तित नहीं होगा। बहुत वास्तविक अर्थों में, हालांकि, इससे कोई फर्क नहीं पड़ता क्योंकि (ए) अनंत डेटा सीमा वास्तविक नहीं है और (बी) बायेसियन इंट्रेंस पॉइंट अनुमानों को नहीं बल्कि वितरणों को रिपोर्ट करता है। व्यवहार में इस तरह की गैर-पहचान से मापदंडों के बीच बड़े संबंध होंगे (शायद गैर-उत्तलता भी) लेकिन एक उचित बायेसियन विश्लेषण उन सहसंबंधों की पहचान करेगा। भले ही आप एकल पैरामीटर मार्जिन की रिपोर्ट करें '

μ1μ2N(x|μ1+μ2,σ)μ1+μ2=0μ1μ2

μ1μ2μ1μ2


3

बायेसियन और अक्सरवादी दृष्टिकोणों के बीच महत्वपूर्ण अंतर एक संभावना की परिभाषा में निहित है, इसलिए यदि एक लंबी अवधि की आवृत्ति के रूप में प्रायिकताओं के साथ सख्ती से व्यवहार करना आवश्यक है, तो लगातारवादी दृष्टिकोण उचित हैं, यदि ऐसा नहीं है तो आपको बायेसियन दृष्टिकोण का उपयोग करना चाहिए। यदि या तो व्याख्या स्वीकार्य है, तो बायेसियन और अक्सरवादी दृष्टिकोण उचित होंगे।

इसे लगाने का एक और तरीका है, यदि आप यह जानना चाहते हैं कि आप किसी विशेष प्रयोग से कौन-कौन से निष्कर्ष निकाल सकते हैं, तो आप शायद बायेसियन बनना चाहते हैं; यदि आप प्रयोगों की कुछ आबादी (जैसे गुणवत्ता नियंत्रण) के बारे में निष्कर्ष निकालना चाहते हैं, तो लगातार विधियां अच्छी तरह से अनुकूल हैं।

अनिवार्य रूप से, महत्वपूर्ण बात यह जानना है कि आप किस प्रश्न का उत्तर चाहते हैं, और विश्लेषण के रूप को चुनें जो प्रश्न का सबसे सीधे उत्तर देता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.