क्या घनत्व के आकलन के लिए जलने के बाद MCMC पुनरावृत्तियों का उपयोग किया जा सकता है?


10

बर्न-इन के बाद, क्या हम घनत्व के आकलन के लिए सीधे MCMC पुनरावृत्तियों का उपयोग कर सकते हैं, जैसे कि हिस्टोग्राम, या कर्नेल घनत्व आकलन की साजिश रचने से? मेरी चिंता यह है कि MCMC पुनरावृत्तियों आवश्यक रूप से स्वतंत्र नहीं हैं, हालांकि वे सबसे अधिक पहचान वाले वितरित हैं।

क्या होगा अगर हम आगे MCMC पुनरावृत्तियों में थिनिंग लागू करते हैं? मेरी चिंता यह है कि MCMC पुनरावृत्तियों अधिकांश असंबंधित हैं, और अभी तक स्वतंत्र नहीं हैं।

जिस ग्राउंड को मैंने अनुभवजन्य वितरण फ़ंक्शन का उपयोग करने के लिए सीखा था, वह सच वितरण फ़ंक्शन के आकलन के रूप में ग्लिवेनको-कैंटेली प्रमेय पर आधारित है , जहाँ अनुभवजन्य वितरण फ़ंक्शन की गणना एक आईआईडी नमूने के आधार पर की जाती है। मुझे हिस्टोग्राम्स, या कर्नेल घनत्व अनुमानों के घनत्व घनत्व के रूप में उपयोग करने के लिए कुछ आधार (स्पर्शोन्मुख परिणाम?) देखने को मिले, लेकिन मैं उन्हें याद नहीं कर सकता।

जवाबों:


9

आप कर सकते हैं - और लोग एमसीएमसी नमूनाकरण से घनत्व का अनुमान लगाते हैं।

एक बात का ध्यान रखें कि जब हिस्टोग्राम और केडीई सुविधाजनक होते हैं, कम से कम सरल मामलों (जैसे गिब्स नमूना) में, घनत्व के बहुत अधिक कुशल अनुमान उपलब्ध हो सकते हैं।

यदि हम विशेष रूप से गिब्स के नमूने पर विचार करते हैं, तो आप जिस सशर्त घनत्व से नमूना ले रहे हैं उसका उपयोग नमूना मूल्य के स्थान पर घनत्व के औसत अनुमान लगाने में किया जा सकता है। परिणाम काफी सहज हो जाता है।

में दृष्टिकोण पर चर्चा की गई है

गेलफैंड और स्मिथ (1990), "सैम्पलिंग-बेस्ड अप्रोच्स टू कैलकुलेटिंग मार्जिनल डेंसिटीज़"
जर्नल ऑफ़ द अमेरिकन स्टैटिस्टिकल एसोसिएशन , वॉल्यूम। 85, नंबर 410, पीपी। 398-409

(हालांकि गीयर ने चेतावनी दी है कि अगर नमूना निर्भरता काफी अधिक है तो यह हमेशा विचरण को कम नहीं करता है और ऐसा करने के लिए शर्तें देता है)

इस दृष्टिकोण पर भी चर्चा की जाती है, उदाहरण के लिए, रॉबर्ट, सीपी और कैसला, जी (1999) मोंटे कार्लो सांख्यिकीय तरीके

आपको स्वतंत्रता की आवश्यकता नहीं है, आप वास्तव में एक औसत की गणना कर रहे हैं। यदि आप एक गणना करना चाहते हैं एक घनत्व अनुमान (या एक cdf) की मानक त्रुटि की , तो आपको निर्भरता का हिसाब देना होगा।

एक ही धारणा अन्य उम्मीदों पर लागू होती है, ज़ाहिर है, और इसलिए इसका उपयोग कई अन्य प्रकार के औसत के अनुमानों को बेहतर बनाने के लिए किया जा सकता है।


धन्यवाद! क्या इसका मतलब यह है कि, क्योंकि सीमांत वितरण संयुक्त वितरण की अपेक्षा कर रहे हैं, इसलिए सीमांत वितरण का अनुमान लगाने के लिए सहसंबद्ध MCMC पुनरावृत्तियों का उपयोग करना कोई मायने नहीं रखता है? संयुक्त वितरण का अनुमान लगाने के लिए सहसंबद्ध पुनरावृत्तियों का उपयोग करने पर क्या होगा? अभी भी ठीक?
टिम

नहीं, यही मेरा मतलब है। मेरा मतलब है कि जिन अनुमानक के साथ हम काम कर रहे हैं वे औसत हैं, और जनसंख्या मात्रा का अनुमान लगाने के लिए उपयोग किया जा रहा है जो उन चीजों की अपेक्षाओं के अनुरूप हो सकती है। हां, आप समान अर्थों में संयुक्त वितरण का अनुमान लगाने के लिए निर्भर ड्रॉ का उपयोग कर सकते हैं।
Glen_b -Reinstate Monica

हम संयुक्त वितरण का अनुमान लगाने के लिए सहसंबद्ध पुनरावृत्तियों का उपयोग क्यों कर सकते हैं? मुझे नहीं लगता, क्योंकि संयुक्त वितरण से किसी चीज की उम्मीद नहीं है। ध्यान दें कि Glivenko-Cantelli प्रमेय में, अनुभवजन्य cdf को iid नमूने पर शांत किया जाता है।
टिम

घनत्व के लिए, आप उदाहरण के लिए यहां वर्णित नमूना अनुमान की तरह कुछ विचार कर सकते हैं (और इसे तेजी से संकीर्ण डिब्बे के साथ हिस्टोग्राम की सीमा के रूप में माना जा सकता है); यह एक औसत है, और मेरा मानना ​​है कि इसकी उम्मीद घनत्व है। Cdf के संबंध में आप इस पर विचार करना पसंद कर सकते हैं कि क्या आप इसे औसत के रूप में बनाने के लिए आनुभविक cdf के साथ कुछ कर सकते हैं। दोनों विचारों को एक संयुक्त वितरण से नमूने के साथ काम करना प्रतीत होगा।
Glen_b -Reinstate मोनिका

3

बायोडाटा

आप सीधे किसी भी चीज़ के लिए MCMC पुनरावृत्तियों का उपयोग कर सकते हैं क्योंकि आपके अवलोकन का औसत मूल्य asymptotically सही मूल्य पर पहुंच जाएगा (क्योंकि आप बर्न-इन के बाद हैं)।

हालांकि, ध्यान रखें कि इस औसत का विचरण नमूनों के बीच संबंध से प्रभावित होता है। इसका मतलब है कि अगर नमूने परस्पर संबंधित होते हैं, जैसा कि एमसीएमसी में आम है, तो हर माप को संग्रहीत करने से कोई वास्तविक लाभ नहीं होगा।

सिद्धांत रूप में, आपको एन चरणों के बाद मापना चाहिए, जहां एन आपके द्वारा देखे जा रहे अवलोकन के ऑटोकॉरेलेशन समय के क्रम का है।

विस्तृत विवरण

एक्सटीटी

एक्सटीआर=(एक्स)एक्स[,+Δ]एक्सटीपी(एक्स)

एफ=1एनΣमैं=1एन(एक्समैं)

एफपी(एक्स)

एफ=1एनΣमैं=1एन(एक्समैं)=(एक्स)

जो आप प्राप्त करना चाहते हैं।

एफ2-एफ2

Σमैं=1एनΣजे=1एन(एक्समैं)(एक्सजे)

एक्सटीजे=मैं+Δआर(Δ)

तो, पुनरावृत्ति करने के लिए:

  • यदि कम्प्यूटेशनल रूप से हर उपाय को स्टोर करने के लिए कुछ भी खर्च नहीं होता है, तो आप इसे कर सकते हैं, लेकिन ध्यान रखें कि सामान्य सूत्र का उपयोग करके विचरण की गणना नहीं की जा सकती है।

  • ττ


n

थिनिंग केवल उपयोगी डेटा की बर्बादी है। यह अनुमान के विचरण को कम नहीं करता है। इस सवाल के लिए टिप्पणियाँ देखें : ysts.stackexchange.com/a/258529/58675
DeltaIV

@ डेल्टिव, हाँ। यहाँ मेरा कहना यह था कि पतले होने या न होने के बावजूद, प्रासंगिक समय-स्केल अभी भी स्वायत्तता का समय है।
जॉर्ज लेइताओ
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.