हैमिल्टनियन मोंटे कार्लो: मेट्रोपोलिस-हस्टिंग के प्रस्ताव को कैसे समझें?


9

मैं हैमिल्टन मोंटे कार्लो (एचएमसी) के आंतरिक कामकाज को समझने की कोशिश कर रहा हूं, लेकिन जब हम मेट्रोपोलिस-हस्टिंग प्रस्ताव के साथ नियतात्मक समय-एकीकरण की जगह लेते हैं, तो उस हिस्से को पूरी तरह से समझ नहीं सकते हैं। मैं माइकल बेटनकोर्ट द्वारा हैमिल्टन मोंटे कार्लो का भयानक परिचयात्मक पत्र ए कंसेप्टिकल इंट्रोडक्शन पढ़ रहा हूं , इसलिए मैं उसमें प्रयुक्त एक ही संकेतन का पालन करूंगा।

पृष्ठभूमि

मार्कोव चेन मोंटे कार्लो (MCMC) का सामान्य लक्ष्य वितरण को अनुमानित करना है π(q) एक लक्ष्य चर की q

एचएमसी का विचार एक सहायक "गति" चर पेश करना है p, मूल चर के साथ संयोजन के रूप में qकि "स्थिति" के रूप में मॉडलिंग की जाती है। स्थिति-गति जोड़ी एक विस्तारित चरण स्थान बनाती है और इसे हैमिल्टन की गतिशीलता द्वारा वर्णित किया जा सकता है। संयुक्त वितरणπ(q,p) सूक्ष्मजीव विघटन के संदर्भ में लिखा जा सकता है:

π(q,p)=π(θE|E)π(E),

कहाँ पे θE मापदंडों का प्रतिनिधित्व करता है (q,p) किसी दिए गए ऊर्जा स्तर पर E, जिसे एक विशिष्ट सेट के रूप में भी जाना जाता है । चित्र 21 के चित्र के 22 और अंजीर को देखें।

यहाँ छवि विवरण दर्ज करें

मूल HMC प्रक्रिया में निम्नलिखित दो वैकल्पिक चरण होते हैं:

  • एक स्टोकेस्टिक कदम जो ऊर्जा स्तरों के बीच यादृच्छिक संक्रमण करता है, और

  • एक नियतात्मक कदम जो एक निश्चित ऊर्जा स्तर के साथ समय एकीकरण (आमतौर पर लीपफ्रॉग संख्यात्मक एकीकरण के माध्यम से कार्यान्वित) करता है।

कागज में, यह तर्क दिया जाता है कि लीपफ्रॉग (या सिम्पेक्टिक इंटीग्रेटर) में छोटी त्रुटियां हैं जो संख्यात्मक पूर्वाग्रह का परिचय देंगे। इसलिए, इसे एक नियत कदम के रूप में मानने के बजाय, हमें इस कदम को स्टोचस्टिक बनाने के लिए इसे मेट्रोपोलिस-हस्टिंग (एमएच) प्रस्ताव में बदलना चाहिए, और परिणामस्वरूप प्रक्रिया वितरण से सटीक नमूने प्राप्त करेगी।

एमएच प्रस्ताव प्रदर्शन करेगा Lमेंढक कूद के संचालन के कदम और फिर फ्लिप गति। तब प्रस्ताव को निम्नलिखित स्वीकृति संभावना के साथ स्वीकार किया जाएगा:

a(qL,pL|q0,p0)=min(1,exp(H(q0,p0)H(qL,pL)))

प्रशन

मेरे प्रश्न हैं:

1) एमएच प्रस्ताव में नियतात्मक समय-एकीकरण को चालू करने का यह संशोधन संख्यात्मक पूर्वाग्रह को रद्द क्यों करता है ताकि उत्पन्न नमूने बिल्कुल लक्ष्य वितरण का पालन करें?

2) भौतिकी के दृष्टिकोण से, ऊर्जा किसी दिए गए ऊर्जा स्तर पर संरक्षित है। इसलिए हम हैमिल्टन के समीकरणों का उपयोग करने में सक्षम हैं:

dqdt=Hp,dpdt=Hq

इस अर्थ में, ऊर्जा को सेट पर हर जगह स्थिर होना चाहिए , इसलिएH(q0,p0) के बराबर होना चाहिए H(qL,pL)ऊर्जा में अंतर क्यों है जो हमें स्वीकृति संभावना का निर्माण करने की अनुमति देता है?

जवाबों:


7

नियतात्मक हैमिल्टनियन प्रक्षेपवक्र केवल इसलिए उपयोगी हैं क्योंकि वे लक्ष्य वितरण के अनुरूप हैं। विशेष रूप से, लक्ष्य वितरण की उच्च संभावना वाले क्षेत्रों पर एक विशिष्ट ऊर्जा परियोजना के साथ प्रक्षेपवक्र। यदि हम हैमिल्टन के समीकरणों को ठीक से एकीकृत कर सकते हैं और स्पष्ट हैमिल्टन के प्रक्षेपवक्र का निर्माण कर सकते हैं, तो हमारे पास पहले से ही एक पूर्ण एल्गोरिथ्म होगा और किसी भी स्वीकृति कदम की आवश्यकता नहीं होगी

दुर्भाग्य से कुछ बहुत ही सरल उदाहरणों के बाहर हम हैमिल्टन के समीकरणों को बिल्कुल एकीकृत नहीं कर सकते हैं। इसलिए हमें सहानुभूतिपूर्ण एकीकरणकर्ताओं में लाना होगा । सिम्पलेक्टिक इंटीग्रेटर्स का उपयोग सटीक हैमिल्टन ट्रैजेक्ट्रीज़ के लिए उच्च सटीकता वाले संख्यात्मक अनुमानों का निर्माण करने के लिए किया जाता है जिन्हें हम विश्लेषणात्मक रूप से नहीं कर सकते हैं। सिम्पेक्टिक इंटीग्रेटर्स में निहित छोटी त्रुटि इन संख्यात्मक प्रक्षेपवक्रों को वास्तविक प्रक्षेपवक्र से विचलित करने का कारण बनती है, और इसलिए संख्यात्मक प्रक्षेपवक्र के अनुमान लक्ष्य वितरण के विशिष्ट सेट से दूर हो जाएंगे। हमें इस विचलन के लिए सही करने का एक तरीका पेश करना होगा।

हैमिल्टन मोंटे कार्लो के मूल कार्यान्वयन ने प्रस्ताव के रूप में निश्चित लंबाई के प्रक्षेपवक्र में अंतिम बिंदु पर विचार किया, और फिर उस प्रस्ताव पर मेट्रोपोलिस स्वीकृति प्रक्रिया लागू की। यदि संख्यात्मक प्रक्षेपवक्र ने बहुत अधिक त्रुटि जमा की थी, और इसलिए प्रारंभिक ऊर्जा से बहुत अधिक विचलन हुआ, तो उस प्रस्ताव को अस्वीकार कर दिया जाएगा। दूसरे शब्दों में, स्वीकृति प्रक्रिया उन प्रस्तावों को फेंक देती है जो लक्ष्य वितरण के विशिष्ट सेट से बहुत दूर प्रोजेक्ट करना समाप्त कर देते हैं ताकि हमारे द्वारा रखे गए एकमात्र नमूने वे हों जो विशिष्ट सेट में आते हैं।

ध्यान दें कि मैं कंसेप्चुअल पेपर की जितनी अधिक आधुनिक कार्यान्वयन की वकालत करता हूं, वास्तव में मेट्रोपोलिस-हेस्टिंग्स एल्गोरिदम नहीं हैं। एक यादृच्छिक प्रक्षेपवक्र नमूनाकरण और फिर उस यादृच्छिक प्रक्षेपवक्र से एक यादृच्छिक बिंदु सहानुभूति इंटीग्रेटर्स द्वारा पेश किए गए संख्यात्मक त्रुटि के लिए सही करने के लिए एक अधिक सामान्य तरीका है। मेट्रोपोलिस-हेस्टिंग्स इस सामान्य एल्गोरिथ्म को लागू करने का सिर्फ एक तरीका है, लेकिन स्लाइस सैंपलिंग (जैसा कि एनयूटीएस में किया जाता है) और मल्टिनोमियल सैंपलिंग (जैसा कि वर्तमान में स्टेन में किया गया है) सिर्फ बेहतर नहीं होने पर काम करते हैं। लेकिन अंतत: अंतर्ज्ञान एक ही है - हम संभावित रूप से लक्ष्य वितरण से सटीक नमूने सुनिश्चित करने के लिए छोटी संख्यात्मक त्रुटि वाले बिंदुओं का चयन कर रहे हैं।


धन्यवाद @ मिचेल बेटनकोर्ट !! वैचारिक रूप से, अब मुझे समय-एकीकरण कदम को संभाव्य बनाने का विचार है, जो इस बात पर आधारित है कि एकीकृत राज्य प्रक्षेपवक्र से कितना विचलित होता है। हालांकि, जिस तरह से स्वीकृति की संभावना का निर्माण किया जाता है वह पूरी तरह से मेरे लिए समझ में नहीं आता है, क्योंकि ऐसा लगता है कि हम विचलन को प्रोत्साहित कर रहे हैं जिसके परिणामस्वरूप कम ऊर्जा होती है? अगरH(qL,pL) की तुलना में बहुत कम है H(q0,p0), क्या हम हमेशा प्रस्ताव को स्वीकार करते हैं, भले ही यह प्रक्षेपवक्र से बहुत अधिक विचलन करता है?
cwl

1
हां, लेकिन उच्च आयामी स्थानों में वॉल्यूम कैसे काम करता है (हमेशा एक सतह के बाहर की ओर अधिक मात्रा इसके अंदर की ओर की तुलना में), प्रक्षेपवक्र तेजी से कम ऊर्जा के मुकाबले उच्च ऊर्जा के लिए अधिक समय व्यतीत करते हैं। नतीजतन जब आप प्रस्ताव (जो उच्च ऊर्जा के पक्षधर हैं) को स्वीकृति के साथ जोड़ते हैं (जो कि निम्न ऊर्जा के पक्षधर हैं) तो आप प्रारंभिक ऊर्जा के आसपास संतुलन को ठीक करते हैं।
माइकल बेटनकोर्ट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.