एबीसी और एमसीएमसी अपने अनुप्रयोगों में कैसे भिन्न होते हैं?


15

मेरी समझ से अनुमानित बायेसियन कम्प्यूटेशन (एबीसी) और मार्कोव चेन मोंटे कार्लो (एमसीएमसी) का उद्देश्य समान है। नीचे मैं इन तरीकों की मेरी समझ का वर्णन करता हूं और मैं वास्तविक जीवन डेटा के लिए उनके आवेदन में अंतर कैसे महसूस करता हूं।

अनुमानित बायेसियन कम्प्यूटेशन

एबीसी एक पैरामीटर के नमूने पर होते हैं θ के माध्यम से, एक पूर्व से संख्यात्मक सिमुलेशन गणना एक आंकड़ा जो कुछ मनाया की तुलना में है । अस्वीकृति एल्गोरिथ्म के आधार पर, x i को या तो बरकरार रखा जाता है या खारिज कर दिया जाता है। बनाए रखा की सूची एक्स मैं पिछला वितरण किया जाता रहा है।x o b sxixobsxixi

मार्कोव चेन मोंटे कार्लो

एमसीएमसी पैरामीटर के एक पूर्व वितरण के नमूने पर होते हैं । यह एक पहला नमूना लेता θ 1 , गणना पी ( एक्स बी एस | θ 1 ) पी ( θ 1 ) और फिर एक नया मान (कुछ नियम के अनुसार) कूद θ 2 जिसके लिए पी ( एक्स बी एस | θ 2 ) पी ( θ 2 ) फिर से की जाती है। अनुपात P ( x o b s)θθ1P(xobs|θ1)P(θ1)θ2P(xobs|θ2)P(θ2) गणना की जाती है और कुछ सीमा मूल्य के आधार पर, अगले कूद पहली या दूसरी स्थिति से हो जाएगा। के अन्वेषणθमूल्यों और एक चला जाता है और अंत तक बरकरार रखा के वितरणθमूल्यों पिछला वितरण है,पी(θ|x)(एक कारण अब भी मुझे इस बात से अनजान है कि के लिए)।P(xobs|θ2)P(θ2)P(xobs|θ1)P(θ1)θθP(θ|x)

मुझे एहसास है कि मेरी व्याख्याएं उन तरीकों की विविधता का प्रतिनिधित्व करने के लिए याद आती हैं जो इन शर्तों में से प्रत्येक के तहत मौजूद हैं (विशेष रूप से एमसीएमसी के लिए)।

एबीसी बनाम एमसीएमसी (पेशेवरों और विपक्ष)

एबीसी लाभ यह है कि एक विश्लेषणात्मक हल करने में सक्षम होने की जरूरत है नहीं है । चूंकि एबीसी जटिल मॉडल के लिए सुविधाजनक है, जहां एमसीएमसी इसे नहीं बनाएगा।P(x|θ)P(θ)

MCMC सांख्यिकीय परीक्षण (संभावना अनुपात परीक्षण, G- परीक्षण, ...) बनाने की अनुमति देता है, जबकि मुझे नहीं लगता कि यह ABC के साथ संभव है।

क्या मैं अभी तक सही हूं?

सवाल

  • एबीसी और एमसीएमसी अपने अनुप्रयोगों में कैसे भिन्न होते हैं? एक या दूसरे तरीके का इस्तेमाल करने का फैसला कैसे किया जाता है?

1
"MCMC में पैरामीटर prior के पूर्व वितरण का नमूना लेना शामिल है।" जबकि एक निश्चित रूप से यह कर सकता है, यह आवश्यक नहीं है, और न ही ज्यादातर मामलों में वांछनीय है। कई MCMC अनुप्रयोगों के लिए, हम (1 के आसपास केंद्रित एक उम्मीदवार वितरण से dev2 का नमूना लेते हैं (उदाहरण के लिए, एक छोटे मानक विचलन के साथ एक गाऊसी), फिर स्वीकार / अस्वीकार अनुपात की गणना करें जैसा कि आप ऊपर उल्लेख करते हैं। यह एबीसी के विपरीत है, जहां हम पूर्व से नमूना लेते हैं (और यह एबीसी में पूर्व सूचना को शामिल करने का एकमात्र तरीका है, आम तौर पर)।
z_dood

जवाबों:


12

ब्योर्न के जवाब के शीर्ष पर कुछ अतिरिक्त टिप्पणियां:

  1. एबीसी को पहली बार रुबिन (1984) द्वारा बायेसियन इंट्रेंस की प्रकृति के स्पष्टीकरण के रूप में प्रस्तुत किया गया था, बजाय कम्प्यूटेशनल उद्देश्यों के लिए। इस पत्र में उन्होंने बताया कि कैसे नमूना वितरण और पूर्व वितरण के बाद के वितरण का उत्पादन करने के लिए बातचीत करते हैं।

  2. एबीसी को मुख्य रूप से कम्प्यूटेशनल कारणों से शोषण किया जाता है। जनसंख्या आनुवंशिकीविद पेड़ आधारित मॉडल पर विधि के साथ आए, जहां देखे गए नमूने की संभावना अचूक थी। ऐसी सेटिंग में उपलब्ध MCMC (डेटा ऑग्मेंटेशन) योजनाएँ काफी हद तक अक्षम थीं और इसलिए एक ही आयाम के एक पैरामीटर के साथ भी महत्वपूर्ण नमूने थे ... इसके मूल में, ABC MCMC या PMO जैसे मोंटे कार्लो विधियों का एक विकल्प है। वे सभी व्यावहारिक उद्देश्यों के लिए उपलब्ध नहीं हैं। जब वे उपलब्ध होते हैं, तो एबीसी एक प्रॉक्सी के रूप में प्रकट होता है जिसका उपयोग उन्हें तेजी से चलाने पर उन्हें कैलिब्रेट करने के लिए किया जा सकता है।

  3. अधिक आधुनिक परिप्रेक्ष्य में, मैं व्यक्तिगत रूप से एबीसी को कम्प्यूटेशनल तकनीक के बजाय एक अनुमानित अनुमान पद्धति के रूप में मानता हूं। एक अनुमानित मॉडल का निर्माण करके, एक सटीक मॉडल पर भरोसा किए बिना ब्याज के पैरामीटर पर अनुमान खींच सकते हैं। जबकि इस सेटिंग में कुछ हद तक सत्यापन आवश्यक है, यह मॉडल औसत या गैर-पैरामीट्रिक्स करने से कम वैध नहीं है। वास्तव में, एबीसी को एक विशेष प्रकार के गैर-पैरामीट्रिक बायेसियन आंकड़ों के रूप में देखा जा सकता है।

  4. यह भी दिखाया जा सकता है कि (शोर) एबीसी एक पूरी तरह से परिभाषित बायेसियन दृष्टिकोण है यदि कोई मूल मॉडल और डेटा को एक शोर के साथ बदलता है। जैसा कि यह सभी बेयसियन इनफॉर्म्स के लिए अनुमति देता है, जिसके बारे में कोई सोच सकता है। परीक्षण सहित। एबीसी और परिकल्पना परीक्षण के बारे में बहस करने के लिए हमारा इनपुट यह है कि एबीसी अंतर्निहित अनुमानित मॉडल खराब हो सकता है क्योंकि आंकड़ों को देखते हुए एक परिकल्पना की प्रासंगिकता का आकलन करने के लिए खराब सुसज्जित है, लेकिन जरूरी नहीं , जो आबादी में एबीसी के अधिकांश अनुप्रयोगों के साथ ही है। जेनेटिक्स मॉडल की पसंद से संबंधित हैं।

  5. एक और भी हाल के परिप्रेक्ष्य में, हम एबीसी को अप्रत्यक्ष अनुमान के बायेसियन संस्करण के रूप में देख सकते हैं जहां एक सांख्यिकीय मॉडल के पैरामीटर पूर्व-निर्धारित सांख्यिकीय के क्षणों से संबंधित हैं। यदि यह आँकड़ा इन मापदंडों की पहचान करने के लिए पर्याप्त (या पर्याप्त अर्थ में) है, तो ABC को टिप्पणियों की संख्या के साथ मापदंडों के वास्तविक मूल्य में परिवर्तित करने के लिए दिखाया जा सकता है


2
मैंने इस उत्तर की जाँच की, लेकिन पहले ब्योर्न के उत्तर (+1) और फिर शीआन के उत्तर को पढ़ने की सिफारिश करना चाहता हूँ।
रेमी

12

अंतर यह है कि एबीसी के साथ आपको एक विश्लेषणात्मक अभिव्यक्ति की आवश्यकता नहीं है और इसके बजाय डेटा का अनुकरण और देखकर यह अनुमान लगाने की जो मूल्यों के लिए θP(x|θ)θनकली डेटा सबसे अधिक (लगभग) मनाया डेटा से मेल खाता है (प्रस्तावित मूल्यों के साथ जैसे कि पूर्व से यादृच्छिक रूप से खींचा गया)। सरल मामलों के लिए, जैसे कि एक भी द्विपद यादृच्छिक चर, बहुत बड़े नमूने के आकार के साथ नहीं, यहां तक ​​कि आपको एक सटीक मिलान की भी आवश्यकता हो सकती है और उन मामलों में, वास्तव में ऐसा कुछ भी नहीं है जो आप इन पीछे के नमूनों के साथ नहीं कर सकते हैं जो आप भी नहीं कर सकते हैं मानक MCMC नमूने। निरंतर के साथ और अधिक जटिल स्थितियों के लिए (यहां तक ​​कि बहुभिन्नरूपी असतत परिणामों के लिए) और एक सटीक मैच की आवश्यकता वाले संभावित बहुभिन्नरूपी परिणामों के लिए अब संभव नहीं है।

वास्तव में एबीसी के एमसीएमसी संस्करण हैं, जो इस मुद्दे को संबोधित करता है कि अगर आपके पास एक पूर्व है जो निकटवर्ती के समान नहीं है (उदाहरण के लिए क्योंकि पूर्व बहुत असंक्रामक है) पूर्व से ड्राइंग करके नमूना अत्यधिक अक्षम है, क्योंकि बहुत कम ही होगा। मनाया और नकली डेटा के बीच एक करीबी मेल मिलता है।

P(x|θ)P(x|θ)P(x|θ)विश्लेषणात्मक रूप से उपलब्ध नहीं है। निश्चित रूप से ऐसे मामलों में कुछ अन्य संभावित विकल्प हो सकते हैं (जैसे कि INLA, द्विघाती सन्निकटन की संभावना आदि) जो कि विशेष समस्याओं के लिए अधिक कुशल / सफल हो सकते हैं। एक तरह से, एबीसी से पीछे के नमूनों के साथ आप क्या कर सकते हैं, इसकी कोई भी सीमा केवल वास्तविक और सिम्युलेटेड डेटा (यदि आपको एक सटीक मिलान की आवश्यकता हो सकती है, तो कोई समस्या नहीं होगी, के बीच एक मैच) की आवश्यकता होती है। कई अच्छे परिचयात्मक कागजात हैं जैसे मारिन एट अल। (2012) । सह-लेखकों में से कम से कम एक लेखक (@ शीआन) यहां सक्रिय योगदानकर्ता है और मुझे यहां उनके विचार भी पसंद आएंगे, - मेरा मानना ​​है कि वह परीक्षण विषय पर बहुत अधिक कहने में सक्षम हो सकते हैं।


मुझे आशा है कि मैं अब लिंक को ठीक करने में कामयाब रहा (यह अब मेरे लिए काम करता है)।
ब्योर्न

1
(+1) बहुत अच्छे अंक!
शीआन

1
"जब P (x | θ) विश्लेषणात्मक रूप से उपलब्ध है, तो मुझे लगता है कि यह लगभग हमेशा मानक MCMC का उपयोग करने के लिए बेहतर होगा।" लगभग, लेकिन हमेशा नहीं। कल्पना कीजिए कि कई मापदंडों के साथ संयुक्त एक बहुत बड़ा नमूना आकार (10 ^ 9) है। मापदंडों के प्रत्येक सेट के लिए संभावना को फिर से स्थापित करना बहुत महंगा हो जाता है। एबीसी के साथ, कई तरकीबें हैं जिनका उपयोग करके इसे गति दी जा सकती है। MCMC के साथ, इतना नहीं।
z_dood

2
@z_dood: जब वास्तव में संभावना की गणना करने के लिए बहुत सारे अवलोकन हैं, जैसे, उदाहरण के लिए, जब उन्हें विभिन्न कंप्यूटरों पर संग्रहीत करने की आवश्यकता होती है, तो यह तर्कपूर्ण हो जाता है कि संभावना फ़ंक्शन विश्लेषणात्मक रूप से उपलब्ध नहीं है।
शीआन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.