किसी दिए गए MLE के साथ यादृच्छिक नमूनों का अनुकरण करना


17

यह क्रॉस वैलिडेटेड प्रश्न जो एक निश्चित राशि पर एक नमूना सशर्त का अनुकरण करने के बारे में पूछ रहा है, ने मुझे जॉर्ज कैसला द्वारा मेरे लिए निर्धारित एक समस्या की याद दिला दी ।

एक पैरामीट्रिक मॉडल f(x|θ) , और इस मॉडल से एक iid नमूना, , MLE of the द्वारा की दी गई मूल्य के लिए \ थीटा , वहाँ एक सामान्य तरीके एक आईआईडी नमूना अनुकरण करने के लिए है (x_1, \ ldots, X_n) सशर्त MLE \ hat {\ theta} (X_1, \ ldots, X_n) के मान पर ?(X1,,Xn)θ ( एक्स 1 , ... , x n ) = आर्ग मिनट n Σ मैं = 1 लॉग ( एक्स मैं | θ ) θ ( एक्स 1 , ... , एक्स एन ) θ ( एक्स 1 , , एक्स एन )θ

θ^(x1,,xn)=argmini=1nlogf(xi|θ)
θ(X1,,Xn)θ^(X1,,Xn)

उदाहरण के लिए, स्थान पैरामीटर \ mu के साथ एक T5 वितरण, जो घनत्व f (x | \ mu) = \ dfrac {\ Gamma (3)} {\ Gamma (1/2) \ Gamma है। 5/2)}, \ बायाँ [1+ (x- \ mu) ^ 2/5 \ right] ^ {- 3} यदि (X_1, \ ldots, X_n) \ stackrel {\ text {iid}} \ " sim} f (x। \ mu) हम कैसे अनुकरण कर सकते हैं (X_1, \ ldots, X_n) सशर्त पर \ hat {\ mu} (X_1, \ ldots, X_n) = \ mu_0 ? इस \ mathfrak {T} _5 उदाहरण में, \ _ \ _ {mu} (X_1, \ ldots, X_n) के वितरण में एक बंद फ़ॉर्म अभिव्यक्ति नहीं है।μ

f(x|μ)=Γ(3)Γ(1/2)Γ(5/2)[1+(xμ)2/5]3
(X1,,Xn)iidf(x|μ)
(X1,,Xn)μ^(X1,,Xn)=μ0T5μ^(X1,,Xn)

जवाबों:


20

एक विकल्प ब्रम्केर एट अल (1) द्वारा Implicitly परिभाषित Manifolds पर MCMC तरीकों के एक परिवार में वर्णित के रूप में एक विवश एचएमसी संस्करण का उपयोग करना होगा । इसके लिए आवश्यक है कि हम इस स्थिति को व्यक्त कर सकते हैं कि स्थान पैरामीटर का अधिकतम-अनुमानित अनुमान कुछ निश्चित बराबर है, कि कुछ स्पष्ट रूप से परिभाषित (और अलग-अलग) । हम फिर इस बाधा के लिए विवश हैमिल्टन के गतिशील विषय का अनुकरण कर सकते हैं, और मानक HMC के रूप में एक मेट्रोपोलिस-हेस्टिंग्स कदम के भीतर स्वीकार / अस्वीकार कर सकते हैं। c ( { x i } N i = 1 ) = 0μ0c({xi}i=1N)=0

नकारात्मक लॉग-सम्भाव्यता जिसमें पहले और दूसरे क्रम में आंशिक व्युत्पत्ति है। स्थान पैरामीटर एक अधिकतम संभावना का अनुमान तब निहित रूप से एक समाधान के रूप में परिभाषित किया गया है μएल

L=i=1N[logf(xi|μ)]=3i=1N[log(1+(xiμ)25)]+constant
μ μ0c=Ni=1[2(μ0-xi)
Lμ=3i=1N[2(μxi)5+(μxi)2]and2Lμ2=6i=1N[5(μxi)2(5+(μxi)2)2].
μ0
c=i=1N[2(μ0xi)5+(μ0xi)2]=0subject toi=1N[5(μ0xi)2(5+(μ0xi)2)2]>0.

मुझे यकीन है कि अगर वहाँ सुझाव के लिए एक अनूठा MLE के लिए नहीं होगा कोई परिणाम है नहीं कर रहा हूँ के लिए दिया - घनत्व लॉग-अवतल नहीं है तो यह प्रतीत नहीं होता यह गारंटी देने के लिए तुच्छ। अगर वहाँ केवल एक अद्वितीय समाधान है परोक्ष ऊपर एक जुड़ा को परिभाषित करता है आयामी कई गुना में एम्बेडेड के सेट करने के लिए इसी के लिए MLE साथ बराबर to{ x i } N i = 1 μ N - 1 R N { x i } N i = 1 μ μ 0μ{xi}i=1NμN1RN{xi}i=1Nμμ0। यदि कई समाधान हैं तो कई गुना गैर-जुड़े घटकों में से कुछ शामिल हो सकते हैं जिनमें से कुछ संभावना फ़ंक्शन में मिनिमा के अनुरूप हो सकते हैं। इस मामले में हमें गैर-कनेक्टेड घटकों के बीच स्थानांतरित करने के लिए कुछ अतिरिक्त तंत्र की आवश्यकता होगी (जैसा कि सिम्युलेटेड डायनामिक आमतौर पर किसी एक घटक तक सीमित रहेगा) और दूसरे-क्रम की स्थिति की जांच करें और एक चाल को अस्वीकार करें यदि वह चलती से मेल खाती है संभावना में एक मिनीमा।

यदि हम वेक्टर को देने के लिए का उपयोग करते हैं और द्रव्यमान मैट्रिक्स और एक Lagrange के साथ एक संयुग्म गति राज्य परिचय। स्केलर बाधा लिए गुणक फिर ODEs प्रणाली का समाधान [ x 1x N ] T p M λ c ( x ) d xx[x1xN]TpMλc(x)एक्स(0)=एक्स0,पी(0)=पी0सी(एक्स0)=0

dxdt=M1p,dpdt=Lxλcxsubject toc(x)=0andcxM1p=0
दिए गए प्रारंभिक शर्त साथ और , एक विवश हैमिल्टनियन डायनामिक को परिभाषित करता है जो बाधा के कई गुना तक ही सीमित है, समय प्रतिवर्ती है और वास्तव में हैमिल्टन और कई गुना आयतन को संरक्षित करता है। अगर हम विवश हैमिल्टनियन सिस्टम जैसे SHAKE (2) या RATTLE (3) के लिए एक सहानुभूतिपूर्ण इंटीग्रेटर का उपयोग करते हैं, जो कि लैग्रेंज गुणक के लिए हल करके प्रत्येक टाइमस्टेप पर कसना बनाए रखते हैं, तो हम सटीक डायनेमिक फ़ॉरवर्ड Lretrete timesteps अनुकरण कर सकते हैंx(0)=x0, p(0)=p0c(x0)=0एलδटीएक्स,cx|x0M1p0=0Lδtकुछ प्रारंभिक बाधा संतोषजनक और प्रस्तावित नई राज्य जोड़ी को प्रायिकता यदि हम इन गतिकी को गैसियन सीमांत से क्षण के आंशिक / पूर्ण पुनरुत्पादन के साथ अद्यतन करते हैं (केवल द्वारा परिभाषित रैखिक उप-सीमा तक सीमितएक्स ,x,p मिनट { 1 ,x,p
min{1,exp[L(x)L(x)+12pTM1p12pTM1p]}.
सीएक्स-1पी=0) तब कई गैर-जुड़े बाधाएं कई गुना घटकों के होने की संभावना को , समग्र MCMC गतिशील ergodic होना चाहिए और कॉन्फ़िगरेशन राज्य के नमूने को लक्ष्य घनत्व में वितरण में बाधा को कई गुना तक सीमित कर देगा।एक्स

यह देखने के लिए कि इस मामले के लिए विवश एचएमसी ने यहां किस तरह का प्रदर्शन किया, मैंने जियोडेसिक इंटीग्रेटर आधारित विवश एचएमसी कार्यान्वयन को (4) में वर्णित किया और जीथब पर यहां उपलब्ध है (पूर्ण प्रकटीकरण: मैं एक लेखक हूं (4) और गीथूब भंडार का मालिक हूं), स्टोकेस्टिक ऑर्स्टीन-उहलेनबेक कदम के बिना (5) में प्रस्तावित 'जियोडेसिक-बाओएबी' इंटीग्रेटर योजना की विविधता का उपयोग करता है। मेरे अनुभव में यह जियोडेसिक इंटीग्रेशन स्कीम आम तौर पर बाधा (कई) में इस्तेमाल किए गए RATTLE स्कीम की तुलना में थोड़ा आसान है, क्योंकि कॉन्ट्रास्ट मैनिफोल्ड पर जियोडेसिक मोशन के लिए कई छोटे इनर स्टेप्स का उपयोग करने की अतिरिक्त लचीलापन है। परिणाम उत्पन्न करने वाला एक IPython नोटबुक यहां उपलब्ध है

मैंने , और । न्यूटन के तरीके से एक MLE of लिए एक प्रारंभिक पाया गया (दूसरे क्रम व्युत्पन्न की संभावना की अधिकतम सुनिश्चित करने के लिए जाँच की गई)। मैंने 1000 अपडेट्स के लिए पूर्ण गति के रेफरल में , साथ एक विवश गतिशील को चलाया । नीचे दिए गए कथानक तीन घटकों पर परिणामी निशान हैंएन=3μ=1μ0=2एक्सμ0δटी=0.5एल=5एक्स

3 डी उदाहरण के लिए ट्रेस भूखंड

और नकारात्मक लॉग-लिबेलिटी के पहले और दूसरे क्रम के डेरिवेटिव के संबंधित मूल्य नीचे दिखाए गए हैं

लॉग-सम्भावित व्युत्पन्न ट्रेस भूखंड

जिसमें से यह देखा जा सकता है कि हम सभी नमूना के लिए लॉग- अधिकतम सीमा पर हैं । हालाँकि यह अलग-अलग ट्रेस प्लॉट्स से आसानी से स्पष्ट नहीं होता है, नमूना एक 2 डी गैर-रेखीय मैनिफोल्ड पर निहित है जो में एम्बेडेड है - नीचे दिया गया एनीमेशन 3D में नमूने दिखाता हैएक्सएक्सआर3

2 डी के लिए नमूनों की 3 डी कल्पना कई गुना तक सीमित है

बाधा की व्याख्या के आधार पर यह कुछ (4) में वर्णित के रूप में कुछ याकूबियन कारक द्वारा लक्ष्य घनत्व को समायोजित करने के लिए आवश्यक हो सकता है। विशेष रूप से अगर हम चाहते हैं कि एक एबीसी का उपयोग करने के लिए एबीसी का उपयोग सीमा साथ सुसंगत परिणाम बनाए रखने के लिए लगभग बाधा के रूप में कदमों का प्रस्ताव करके और स्वीकार करें यदि , फिर हमें लक्ष्य घनत्व को से गुणा करने की आवश्यकता है । उपरोक्त उदाहरण में मैंने इस समायोजन को शामिल नहीं किया है, इसलिए नमूने मूल लक्ष्य घनत्व से हैं जो बाधा को कई गुना तक सीमित करते हैं।ε0आरएन|c(x)|<ϵcxTcx

संदर्भ

  1. एमए ब्रूबेकर, एम। साल्ज़मैन, और आर। उराटसुन। अनुमानित रूप से परिभाषित कई गुना पर MCMC तरीकों का एक परिवार। में आर्टिफिशियल इंटेलिजेंस और सांख्यिकी पर 15 वीं अंतर्राष्ट्रीय सम्मेलन की कार्यवाही , 2012
    http://www.cs.toronto.edu/~mbrubake/projects/AISTATS12.pdf

  2. जे.-पी. रेकैर्ट, जी। सिसकोटी, और एचजे बेरेन्डसेन। गति के साथ एक प्रणाली की गति के कार्टेशियन समीकरणों का संख्यात्मक एकीकरण: एन-अल्केन्स की आणविक गतिशीलता। कम्प्यूटेशनल भौतिकी के जर्नल , 1977.
    http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.399.6868

  3. एचसी एंडरसन RATTLE: आणविक गतिकी गणना के लिए SHAKE एल्गोरिदम का एक "वेग" संस्करण। कम्प्यूटेशनल भौतिकी के जर्नल , 1983।
    http://www.sciencedirect.com/science/article/pii/002199918394141

  4. एमएम ग्राहम और एजे स्टॉर्क। संभावना-मुक्त मॉडल में एसिम्पोटिक रूप से सटीक अनुमान। arXiv प्री-प्रिंट arXiv: 1605.07826v3 , 2016.
    https://arxiv.org/abs/1.0.02626

  5. बी। लीमुखेलर और सी। मैथ्यूज। जियोडेसिक एकीकरण और विलायक-विलेय विभाजन का उपयोग करते हुए कुशल आणविक गतिशीलता। प्रोक। आर। सोक। उ। वॉल्यूम। 472. नंबर 2189. द रॉयल सोसाइटी , 2016.
    http://rspa.royalsocietypublishing.org/content/472/2189/20160138.abstract


3
शानदार और नए और उज्ज्वल दृष्टिकोण! धन्यवाद।
शीआन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.