MCMC एल्गोरिदम में त्रुटियों के उदाहरण


28

मैं मार्कोव चेन मोंटे कार्लो के तरीकों की स्वचालित जाँच के लिए एक विधि की जाँच कर रहा हूँ, और मैं कुछ ऐसे उदाहरणों को पसंद करूँगा जो ऐसे एल्गोरिदम का निर्माण या कार्यान्वित करते समय हो सकते हैं। प्रकाशित अंक में गलत पद्धति का उपयोग किए जाने पर बोनस अंक।

मैं उन मामलों में विशेष रूप से दिलचस्पी रखता हूं जहां त्रुटि का मतलब है कि श्रृंखला में गलत इंवेरिएंट वितरण है, हालांकि अन्य प्रकार की त्रुटियां (जैसे श्रृंखला एर्गोडिक नहीं) भी ब्याज की होगी।

जब मेट्रोपोलिस-हेस्टिंग्स एक प्रस्तावित कदम को खारिज कर देता है, तो ऐसी त्रुटि का एक उदाहरण एक आउटपुट को विफल करने में विफल होगा।


7
मेरे पसंदीदा उदाहरणों में से एक हार्मोनिक माध्य अनुमानक है क्योंकि इसमें अस्वाभाविक गुण हैं लेकिन यह व्यवहार में काम करने में विफल रहता है। रेडफोर्ड नील ने अपने ब्लॉग में इस पर चर्चा की: "बुरी खबर यह है कि इस अनुमानक के लिए सही उत्तर के करीब पहुंचने के लिए आवश्यक अंकों की संख्या अक्सर अवलोकन योग्य ब्रह्मांड में परमाणुओं की संख्या से अधिक होगी"। इस पद्धति को व्यापक रूप से अनुप्रयोगों में लागू किया गया है।

3
नील के एक अन्य सौजन्य से।
सियान

5
@Cyan For Neal को गंभीरता से लिया जाना चाहिए मुझे लगता है कि उन्हें एक ऐसी पत्रिका मिलनी चाहिए थी जो उनके लेख को इंटरनेट पर प्रस्तुत करने के बजाय स्वीकार कर लेती। मैं आसानी से विश्वास कर सकता हूं कि वह सही है और रेफरी और लेखक गलत हैं। हालांकि यह प्रकाशित करना मुश्किल है कि विरोधाभासी प्रकाशित परिणाम और जेएएसए अस्वीकृति हतोत्साहित कर रही है, मुझे लगता है कि उन्हें कई अन्य पत्रिकाओं की कोशिश करनी चाहिए थी जब तक कि वे सफल नहीं हो गए। अपने निष्कर्षों में विश्वसनीयता जोड़ने के लिए आपको एक निष्पक्ष और स्वतंत्र रेफरी की आवश्यकता होती है।
माइकल आर। चेरनिक

4
हमेशा प्रो.नील को गंभीरता से लेना चाहिए! ओ) गंभीरता से यह एक शर्म की बात है कि इस तरह के परिणाम प्रकाशित होने में मुश्किल होते हैं, और दुर्भाग्य से आधुनिक शैक्षणिक संस्कृति उस तरह की चीज को महत्व नहीं देती है, इसलिए यह समझ में आता है कि यह उसके लिए उच्च प्राथमिकता वाली गतिविधि नहीं है। दिलचस्प सवाल है, मुझे जवाबों में बहुत दिलचस्पी है।
डिक्रान मार्सुपियल

6
@ मिचेल: शायद। प्रो.नील की स्थिति सहित कई स्थितियों में सभी पक्षों पर रहा है, कई मौकों पर, मेरी महत्वपूर्ण टिप्पणियां यह हैं कि पेपर रिजेक्शन बहुत मामलों में बहुत कम सूचना सामग्री के रूप में होता है, जैसा कि कई स्वीकार करते हैं। सहकर्मी समीक्षा परिमाण का आदेश है कि लोग ध्यान देने की तुलना में अधिक शोर करते हैं और अक्सर, जैसा कि यहां मामला हो सकता है, खेलने में आंशिक और दिलचस्पी वाले (यानी, स्वतंत्र नहीं) पार्टियां और हित हैं। उस ने कहा, मुझे अपनी मूल टिप्पणी का इरादा नहीं था कि हम इस विषय को अब तक हाथ में लें। इस मामले पर अपने विचार साझा करने के लिए धन्यवाद।
कार्डिनल

जवाबों:


11

1. सीमांत संभावना और हार्मोनिक मतलब अनुमानक

सीमांत संभावना पिछला वितरण की सामान्य निरंतर रूप में परिभाषित किया गया है

p(x)=Θp(x|θ)p(θ)dθ.

इस मात्रा का महत्व बेस कारकों के माध्यम से मॉडल की तुलना में यह भूमिका निभाता है

इस मात्रा का अनुमान लगाने के लिए कई तरीके प्रस्तावित किए गए हैं। Raftery एट अल। (2007) हार्मोनिक माध्य अनुमानक का प्रस्ताव है , जो अपनी सादगी के कारण जल्दी से लोकप्रिय हो गया। विचार में संबंध का उपयोग करना शामिल है

1p(x)=Θp(θ|x)p(x|θ)dθ.

इसलिए, यदि हम पीछे से एक नमूना है, कहते हैं कि , इस मात्रा इसका अनुमान लगाया जा सकता है(θ1,...,θN)

1p(x)1Nj=1N1p(x|θj).

यह सन्निकटन महत्व नमूनाकरण की अवधारणा से संबंधित है ।

बड़ी संख्या के कानून द्वारा, जैसा कि नील के ब्लॉग में चर्चा की गई है , हमारे पास है कि यह अनुमानक सुसंगत है । समस्या यह है कि एक अच्छे सन्निकटन के लिए आवश्यक बहुत बड़ा हो सकता है। नील के ब्लॉग या रॉबर्ट के ब्लॉग 1 , 2 , 3 , 4 को कुछ उदाहरणों के लिए देखें।N

वैकल्पिक

सन्निकटन p ( x ) के लिए कई विकल्प हैंp(x)चोपिन और रॉबर्ट (2008) कुछ महत्व के नमूने-आधारित तरीके पेश करते हैं।

2. अपना MCMC नमूना लंबे समय तक नहीं चलाना (विशेषकर बहुमूत्रता की उपस्थिति में)

मेंडोज़ा और Gutierrez-पेना (1999) अनुमान संदर्भ से पहले / पीछे दो सामान्य उपायों के अनुपात के लिए और इस मॉडल एक असली डेटा सेट का उपयोग कर के साथ प्राप्त अनुमान का एक उदाहरण प्रस्तुत करते हैं। एमसीएमसी तरीकों का उपयोग कर, वे आकार का एक नमूना प्राप्त साधन के अनुपात के पीछे की φ जो नीचे दिखाया गया है2000φ

यहाँ छवि विवरण दर्ज करें

और के लिए HPD अंतराल प्राप्त ( 0.63 , 5.29 ) । पीछे के वितरण की अभिव्यक्ति के विश्लेषण के बाद, यह देखना आसान है कि इसमें 0 पर एक विलक्षणता है और पीछे के हिस्से को वास्तव में इस तरह दिखना चाहिए ( 0 पर विलक्षणता पर ध्यान दें)φ (0.63,5.29)00 )

यहाँ छवि विवरण दर्ज करें

(0,7.25)

3. कुछ अन्य मुद्दे जैसे कि अभिसरण का आकलन, मूल्य निर्धारण का विकल्प, श्रृंखला का खराब व्यवहार इस चर्चा में गेलमैन, कारलिन और नील द्वारा पाया जा सकता है ।

4. महत्व का नमूना

जी

मैं=(एक्स)एक्स=(एक्स)जी(एक्स)जी(एक्स)एक्स

जी(एक्स1,,एक्सएन)मैं के रूप में इस प्रकार है

मैं1एनΣj=1एन(एक्सj)जी(एक्सj)

एक संभावित मुद्दा यह है कि जी भारी / से / के समान पूंछ होनी चाहिए या आवश्यकता है एनएक अच्छे सन्निकटन के लिए बहुत बड़ा हो सकता है। आर में निम्नलिखित खिलौना उदाहरण देखें।

# Integrating a Student's t with 1 d.f. using a normal importance function   
x1 = rnorm(10000000)   # N=10,000,000
mean(dt(x1,df=1)/dnorm(x1))

# Now using a Student's t with 2 d.f. function
x2 = rt(1000,df=2)
mean(dt(x2,df=1)/dt(x2,df=2))

2
वे कुछ महान उदाहरण हैं। रुचि रखने वाले किसी व्यक्ति के लिए, आकृति के साथ संपादक का पत्र यहां है: onlinelibrary.wiley.com/doi/10.1002/bimj.200800256/abstract
सिमोन बायर

2
बहुत अच्छा और स्पष्ट सारांश !! (+1)
गुइउमाँ

12

डेरेन विल्किंसन अपने ब्लॉग पर रैंडम वॉक मेट्रोपोलिस-हेस्टिंग्स में एक सामान्य गलती का विस्तृत उदाहरण देते हैं। मैं इसे पूर्ण रूप से पढ़ने की सलाह देता हूं, लेकिन यहां tl; dr संस्करण है।

यदि लक्ष्य वितरण एक आयाम में सकारात्मक (जैसे गामा वितरण आदि ) है, तो यह उन प्रस्तावों को अस्वीकार करने के लिए लुभाता है जिनके पास उस आयाम पर नकारात्मक मान है। गलती उन प्रस्तावों को फेंकने की है जैसे वे कभी नहीं हुए थे और केवल अन्य लोगों के मेट्रोपोलिस-हेस्टिंग्स (एमएच) स्वीकृति अनुपात का मूल्यांकन करते हैं। यह एक गलती है क्योंकि यह एक गैर सममित प्रस्ताव घनत्व का उपयोग करने के लिए है।

लेखक एक दो सुधारों को लागू करने का सुझाव देता है।

  1. "नकारात्मक" को असफल स्वीकृति के रूप में गिनें (और थोड़ी दक्षता खो दें)।

  2. उस मामले में सही एमएच अनुपात का उपयोग करें, जो है

π(एक्स*)π(एक्स)Φ(एक्स)Φ(एक्स*),

कहा पे π लक्ष्य घनत्व है और Φ काटे गए यादृच्छिक वॉक प्रस्ताव का सामान्यीकरण स्थिरांक है φ, यानी Φ(x)=0ϕ(yx)dy.


1
+1 Interesting example. I was also thinking about other issues with MH related to the acceptance rate. I think the 0.234 optimal rate has been overused.

@Procrastinator you know the MCMC literature very well. Is this your domain of expertise?
gui11aume

Thanks for your comment. I like Bayesian statistics, then I need to carry the MCMC cross ;).

1

A very clear case (connected with the marginal likelihood approximation mentioned in the first answer) where true convergence is the example of the problem of label switching in mixture models coupled with the use of Chib's (1995) estimator. As pointed out by Radford Neal (1999), if the MCMC chain does not converge correctly, in the sense that it does explore some of the mode of the target distribution, the Monte Carlo approximation of Chib fails to reach the right numerical value.

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.