महत्व नमूनाकरण द्वारा निर्मित मोंटे कार्लो के अनुमानों पर परिणाम


13

मैं पिछले एक साल से काफी बारीकी से महत्व के नमूने पर काम कर रहा हूं और कुछ खुले हुए सवाल हैं जिनके साथ मुझे कुछ मदद मिलने की उम्मीद थी।

महत्व के नमूने योजनाओं के साथ मेरा व्यावहारिक अनुभव यह रहा है कि वे कभी-कभी शानदार कम-भिन्नता और कम-पूर्वाग्रह अनुमान पैदा कर सकते हैं। अधिक बार, हालांकि, वे उच्च-त्रुटि अनुमानों का उत्पादन करते हैं जिनमें कम नमूना विचरण होता है लेकिन बहुत अधिक पूर्वाग्रह होते हैं।

मैं सोच रहा हूं कि क्या कोई भी यह बता सकता है कि महत्व के नमूने के अनुमानों की वैधता को किस प्रकार के कारक प्रभावित करते हैं? विशेष रूप से, मैं सोच रहा हूँ:

1) क्या महत्व के नमूने के अनुमानों को सही परिणाम में परिवर्तित करने की गारंटी दी जाती है जब मूल वितरण के समान पूर्वाग्रह वितरण का समर्थन होता है? यदि हां, तो यह व्यवहार में इतना लंबा समय क्यों लगता है?

2) क्या महत्व के नमूने के माध्यम से उत्पन्न अनुमान में त्रुटि के बीच एक मात्रात्मक संबंध है और पूर्वाग्रह वितरण की "गुणवत्ता" है (अर्थात यह शून्य-भिन्न वितरण से कितना मेल खाता है)

3) आंशिक रूप से 1) और 2 पर आधारित) - क्या आप एक साधारण मोंटे कार्लो विधि की तुलना में एक महत्वपूर्ण नमूना डिजाइन का उपयोग करने से पहले बेहतर तरीके से वितरण के बारे में जानने के लिए 'कितना' जानना चाहते हैं।

जवाबों:


8

महत्व नमूनाकरण में मूल मोंटे कार्लो दृष्टिकोण के समान ही सत्यापन है। इसके मूल में, यह मूल मोंटे कार्लो है । दरअसल, यह केवल संदर्भ माप का एक परिवर्तन है, जो जा रहा है to to इस प्रकार अभिसरण दोनों मामलों में बड़ी संख्या के कानून द्वारा सारगर्भित है, अर्थात आप या से अनुकरण करते हैं । इसके अलावा, यदि शब्द परिमित है, तो केंद्रीय सीमा प्रमेय भी लागू होता है और अभिसरण की गति is

h(x)f(x)dx
h(x)f(x)g(x)g(x)dx
fg
h2(x)f2(x)g(x)dx
O(1/n)। यदि यह "व्यवहार में इतना लंबा समय लेता है", तो यह इसलिए है क्योंकि सीएलटी में उपरोक्त विचरण कारक काफी बड़ा हो सकता है। लेकिन, और मैं जोर देता हूं, गति नियमित मोंटे कार्लो, ।O(1/n)

एक महत्त्वपूर्ण नमूना वितरण की गुणवत्ता इस प्रकार सीधे उपरोक्त प्रसरण कारक से संबंधित है, जो "शून्य-प्रसरण वितरण" के लिए शून्य तक जाती है। आनुपातिक है ||h(x)|f(x)


2
मुझे संदेह है, यह देखते हुए कि ओपी पक्षपाती होने वाले छोटे विचरण अनुमानों की रिपोर्ट कर रहा है, लेकिन लगता है कि छोटे रूपांतर हैं, कि वह स्वयं सामान्यीकृत महत्व के नमूने के बारे में पूछ रहा हो सकता है। एक अच्छे उदाहरण के लिए हार्मोनिक माध्य अनुमानक पर रेडफोर्ड नील का शेख़ी देखें , जो कि 0 विचरण के साथ एक महत्वपूर्ण नमूना अनुमान होगा, और बकवास करता है। मुझे यकीन नहीं है कि यह नियमित महत्व के नमूने में कभी नहीं होता है, लेकिन यह निश्चित रूप से दुर्लभ है।
डेस्टिनेशन

यहां तक ​​कि अगर यह ओपी का इरादा नहीं था, तो मुझे कुछ बिंदुओं पर दिलचस्पी होगी कि यह कैसे पता लगाया जाए कि आत्म-सामान्यकरण बुरी तरह से गलत हो जाएगा।
डेस्टिनेशन

@ आइंस्टीन मुझे स्व-सामान्यीकरण प्रक्रिया और इसके नुकसान के बारे में पता नहीं था इसलिए इसके लिए धन्यवाद! किसी भी मामले में, मुझे लगता है कि मुद्दे मेरी आईएस योजना के गुणों के लिए प्रासंगिक हो सकते हैं, इसलिए मैं इस विचार का कुछ और पता लगाना चाहूंगा यदि आप में से किसी के भी विचार हैं।
बर्क यू।

@ आइंस्टीन आईएस योजना जो मैं उपयोग कर रहा हूं, वह बिना हाथ में नमूना वितरण बिना काम करने के लिए डिज़ाइन की गई है। इस योजना में शून्य अंक वितरण से अंक को अनुकरण करने के लिए पहले MCMC प्रक्रिया का उपयोग किया जाता है । अगला उस पर कर्नेल घनत्व आकलन का उपयोग करता उत्पादन करने के लिए । साथ हाथ में, मैं तो नमूना कर सकते हैं नया अंक मेरी IS अनुमान लगाए $ \ योग {घंटा (y_i) च (y_i) / टोपी के रूप में {ग्राम (y_i)} $g(x)Mx1..xMg(x)=h(x)f(x)/h(x)f(x)dxx1..xMg(x)^g(x)^Ny1...yN
बर्क यू।

गैर-पैरामीट्रिक अनुमान का उपयोग करना मोंटे कार्लो परिवर्तनशीलता की तुलना में उच्च क्रम की परिवर्तनशीलता का परिचय देता है, इसलिए मैं इसकी सलाह नहीं दूंगा।
शीआन

7

शीआन ने मानक महत्व के नमूने परिणामों को कवर किया है। आप स्वयं सामान्यीकृत महत्व नमूना है, जहां आप ही पता के बारे में पूछ रहे हैं, तो और ऊपर किसी अज्ञात सामान्य निरंतर करने के लिए, कुछ techiques शीआन और Casella पुस्तकों के दोनों के 4 अध्याय में चर्चा कर रहे हैं मोंटे कार्लो सांख्यिकीय तरीकों , और मोंटे का परिचय कार्लो मेथड्स विथ आर । मुझे यकीन है कि शीआन इससे कहीं अधिक विस्तार से मेरे बारे में विस्तार से बता सकते हैं, इसलिए एक अर्थ में यह उत्तर भालू के काटने का है।fg

स्व-सामान्यीकृत महत्व वाले नमूने के साथ, आप को एक वितरण से चुनकर जिसका घनत्व फ़ंक्शन का आनुपातिक है चयन करके लगभग प्रयास कर रहे हैं और कंप्यूटिंग डेल्टा विधि (मूल रूप से के टेलर श्रृंखला के रैखिक शब्दों तक ले ) और का उपयोग हम तथा

δ=h(x)f(x)dx
x1,,xng(x)
δ^=i=1nh(x)f(x)/g(x)i=1nf(x)/g(x).
X/Yω(X)=f(x)/g(X)
Eg(δ^)δ+δVarg(ω(X))Covg(ω(X),h(X)ω(X))n
Varg(δ^)Varg(h(X)ω(X))2δCovg(ω(X),h(X)ω(X))+δ2Varg(ω(X))n.

इसलिए, छोटे पूर्वाग्रह और छोटे भिन्नता प्राप्त करने के लिए, आप चाहते हैं कि आप को छोटा और सकारात्मक होना। दुर्भाग्य से ये सन्निकटन सही नहीं हैं (और सही ढंग से विभेदकों और सहूलियतों को निर्धारित करना प्रारंभिक समस्या को हल करने में उतना ही मुश्किल है)।Varg(ω(X))Covg(ω(X),h(X)ω(X))


इसके लिए शुक्रिया। यदि कोई टाइपो है तो मैं नोटेशन के बारे में थोड़ा अनिश्चित हूं / निश्चित नहीं हूं। स्पष्ट करने के लिए, आपके स्पष्टीकरण में वास्तव में और क्या हैं ? X/YG
बेरक यू

@BerkUstun कैपिटल जी एक छोटे के लिए एक टाइपो है जिसे मैं तुरंत ठीक कर दूंगा। X / Y यादृच्छिक चर का एक सामान्य अनुपात है। IIRC यह सब लियू की मोंटे कार्लो पुस्तक (शीर्षक में वैज्ञानिक के साथ कुछ) में
समझाया गया है

@ आइंस्टीन: ग्रेट पॉइंट! वास्तव में, स्व-सामान्यीकृत संस्करणों के गुण निष्पक्ष महत्व वाले नमूना अनुमानक से काफी भिन्न होते हैं। सिद्धांत रूप में, किसी को हर का अनुमान लगाने के लिए एक अलग महत्व के नमूने की आवश्यकता होगी।
शीआन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.