हमें MCMC परिणामों के लिए ट्रेस प्लॉट की आवश्यकता क्यों है


12

मैं MCMC विधियों का उपयोग करके शोध पत्र पढ़ रहा हूं और मुझे लगता है कि उनमें से अधिकांश ट्रेस प्लॉट प्रदान करते हैं। मोंटे कार्लो मार्कोव चेन में ट्रेस भूखंडों की आवश्यकता क्यों है? मापदंडों का एक ट्रेस प्लॉट क्या दर्शाता है?

जवाबों:


17

आप यह सुनिश्चित करने के लिए पैरामीटर ट्रेस प्लॉट बनाते हैं कि आपकी प्राथमिकताओं को अच्छी तरह से कैलिब्रेट किया गया है जो आपके मापदंडों द्वारा इंगित किया जाता है कि एमसीएमसी एल्गोरिथ्म के रूप में पर्याप्त राज्य परिवर्तन होता है।

एक चरम उदाहरण यह है कि आप अपने प्राथमिक वितरण संस्करण को 0. पर सेट करते हैं। तब पीछे के पैरामीटर का अनुमान कभी नहीं बदलेगा। आपका एल्गोरिदम यह कहेगा कि आपके पास सबसे अच्छा पैरामीटर अनुमान है, लेकिन यह निर्धारित करने के लिए पर्याप्त संख्या में मापदंडों की जांच नहीं की गई है कि क्या यह वास्तव में सबसे उपयुक्त है। यदि आप एक प्राथमिकता वितरण संस्करण बहुत अधिक सेट करते हैं, तो आपको एक समान समस्या मिलती है। ऐसा इसलिए है क्योंकि नया पैरामीटर आपके डेटा से संबंधित होने की संभावना कम है - इसलिए आपके नए पैरामीटर के साथ गणना की जाने वाली लॉग संभावना पुराने पैरामीटर का उपयोग करके लॉग संभावना से बेहतर होने की संभावना नहीं है। (एक उदाहरण है यदि आपका "सही" पैरामीटर 0.5 है और आपका प्रारंभिक अनुमान 2 है, लेकिन आप सामान्य वितरण से 2 के मतलब और 10,000 के संस्करण के साथ चयन कर रहे हैं, तो आपको एक पैरामीटर मिलने की संभावना नहीं है जो 1 के करीब है। ।

आपको एक प्राथमिकताओं का चयन करने की आवश्यकता है जो आपके पैरामीटर राज्यों को पर्याप्त रूप से बदलने की अनुमति देता है जो कि आप स्थानीय न्यूनतम और अधिकतम सीमा पर लॉगलीकेलिहाइड वितरण में नहीं फंसते हैं, लेकिन फिर भी पर्याप्त ठीक है कि आपको उचित पैरामीटर अनुमान मिलता है। अधिकांश साहित्य बताता है कि आप समय के 40-60% राज्यों को बदलने के लिए अपने मापदंडों को प्राप्त करते हैं।

ट्रेस भूखंडों के लिए एक और कारण में जल रहा है। आमतौर पर जला अवधि भूखंड में स्पष्ट है (उदाहरण के लिए, यदि वास्तविक पैरामीटर 1.5 है और आपका प्रारंभिक अनुमान 4 है तो आपको पैरामीटर अनुमानों को 4 से 1.5 तक जल्दी से आगे बढ़ना चाहिए। और फिर "बाउंसिंग" लगभग 1.5)। आमतौर पर, आप केवल पहले n पुनरावृत्तियों को बाहर करते हैं, जहाँ n इतना बड़ा होता है कि आप निश्चित रूप से बर्न इन (1000) कहते हैं, लेकिन यदि गणना में समय लगता है या यदि आपके पैरामीटर अनुमान आपके n से अधिक समय ले रहे हैं तो तब आप जलने के लिए कम या ज्यादा टिप्पणियों को छोड़ना चाहते हैं। आप यह देखने के लिए अपने भूखंडों की जांच कर सकते हैं कि पीरियड्स में जलन यह सुनिश्चित करने के लिए समाप्त हो जाती है कि जलना आपके परिणामों को प्रभावित नहीं कर रहा है।

ध्यान दें कि मैं पैरामीटर बिंदु अनुमानों के संदर्भ में बात कर रहा हूं। यदि आप पैरामीटर परिवर्तन का अनुमान लगा रहे हैं, तो यह सुनिश्चित करना कि आपके पास उपयुक्त राज्य परिवर्तन हैं, और भी महत्वपूर्ण है।


5
+1 लेकिन इसका दूसरा पक्ष यह है कि हम औपचारिक अभिसरण निदानों पर पूरी तरह से भरोसा नहीं करते हैं और इससे पहले कि हम दावा करते हैं कि हम इसका अभिसरण कर लें। क्या यह पूरी तरह तर्कसंगत है, एक और सवाल है ...
संयुक्ताक्षरी

1
इस पुरानी पोस्ट को खोदने के लिए क्षमा करें। लेकिन क्या पूर्व मूल्य (पूर्व वितरण से उत्पन्न) अप्रासंगिक माना जाता है जब तक कि पुनरावृत्तियों की पर्याप्त संख्या है?
msnnvrsy 8

@mscnvrsy: यदि आप अपने पूर्व को कम जानकारी प्रदान करना चाहते हैं तो आप जेफ्री की पूर्व या वर्दी की तरह गैर-सूचनात्मक डाल सकते हैं।
बेंजामिन

3
मैं इस धारणा से पूरी तरह असहमत हूं कि एमसीएमसी ट्रेस प्लॉट किसी भी तरह से पूर्व वितरण को कैलिब्रेट करने से संबंधित हैं। एक MCMC एल्गोरिथ्म का उद्देश्य किसी पूर्ववर्ती वितरण में पूर्व की पसंद के अप्रासंगिक होना है, और उचित परिस्थितियों में एक मार्कोव श्रृंखला बनाता है जो इस स्थिर वितरण में परिवर्तित होता है। ट्रेस भूखंडों को देखना केवल मार्कोव श्रृंखला के अभिसरण या अभाव का आकलन करने में उपयोगी है।
शीआन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.