सशर्त वितरण का उपयोग करके सीमांत वितरण से नमूनाकरण?


12

मैं एक univariate घनत्व से नमूना लेना चाहता लेकिन मैं केवल संबंध जानता हूं:fX

fX(x)=fX|Y(x|y)fY(y)dy.

मैं MCMC (सीधे अभिन्न प्रतिनिधित्व पर) के उपयोग से बचना चाहता हूं और, चूंकि और से नमूना लेना आसान है, मैं निम्नलिखित नमूने का उपयोग करने के बारे में सोच रहा था :f Y ( y )fX|Y(x|y)Y(y)

  1. के लिए ।जे=1,...,एन
  2. नमूना ।yजे~Y
  3. नमूना ।एक्सजे~एक्स|Y(|yजे)

फिर, मैं जोड़े और केवल सीमांत नमूने ले लूंगा । क्या ये सही है?(एक्स1,y1),,(एक्सएन,yएन)(एक्स1,...,एक्सएन)

जवाबों:


10

हां यह सही है। मूल रूप से, आपके पास है

एक्स,Y(एक्स,y)=एक्स|Y(एक्स|y)Y(y),

और जैसा कि आपने कहा, आप संयुक्त घनत्व से नमूना कर सकते हैं। नमूनों में से सिर्फ s को उठाकर आप सीमांत वितरण के नमूने पर ले जाते हैं।एक्स

इसका कारण यह है कि को अनदेखा करने का कार्य उस पर एकीकरण करने के समान है। इसे एक उदाहरण से समझते हैं।y

मान लीजिए = माताओं की ऊंचाई और = बेटी की ऊंचाई। बेटियों और उनकी माताओं की ऊंचाइयों के बीच के संबंध को समझने के लिए लक्ष्य से एक नमूना प्राप्त करना है । (मैं यह धारणा बना रहा हूं कि परिवार में केवल एक बेटी है, और पूर्ण विकास सुनिश्चित करने के लिए 18 वर्ष से अधिक आयु की सभी बेटियों के लिए जनसंख्या को सीमित करना)।वाई ( एक्स , वाई )एक्सY(एक्स,Y)

आप बाहर जाते हैं और एक प्रतिनिधि नमूना

(एक्स1,y1),...,(एक्सएन,yएन)

इस प्रकार प्रत्येक माँ के लिए, आपके पास उनकी बेटी की ऊंचाई है। और बीच स्पष्ट संबंध होना चाहिए । अब मान लें कि आपके डेटासेट से, आप बेटियों के सभी डेटा को अनदेखा करते हैं ( ड्रॉप करें ), तो आपके पास क्या है? आपके पास यादृच्छिक रूप से चुनी गई माताओं की बिल्कुल ऊंचाइयां हैं जो के सीमांत से ड्रॉ होंगी ।वाई वाई एन एक्सएक्सYYएनएक्स


इसके लिए धन्यवाद, यह मददगार है। क्या आप जानते हैं कि इस नमूने की रणनीति को औपचारिक रूप से सही ठहराने के लिए गिब्स के नमूने से जोड़ा जा सकता है या नहीं?
रॉड

1
यदि आप संयुक्त वितरण से आसानी से नमूना ले सकते हैं, तो लिए सीमांत प्राप्त करने के लिए को अनदेखा करना औचित्य की आवश्यकता नहीं है। यह एक आम बात है। शायद, आप कह सकते हैं कि एक लिंचपिन चर है , लेकिन चूंकि आपको से नमूने के लिए गिब्स नमूने की आवश्यकता नहीं है , इसलिए यहां MCMC की कोई आवश्यकता नहीं है। x yyएक्सyy
ग्रीनपार्क

1
ग्रीनपार्क, लेकिन क्या उस दावे का एक औपचारिक प्रमाण है, यानी संयुक्त से लिए गए नमूने के केवल एक हिस्से पर विचार करने से सीमांत से एक नमूना मिलता है?
समुद्र में एक बूढ़ा आदमी।

नमूने (एक्स, वाई) द्वारा नमूना "एक्स = माताओं" और एक्स को लेने से वास्तव में आपको "उन माताओं के नमूने मिलते हैं जिनकी बिल्कुल एक बेटी है", जो "माताओं" के समान नहीं है। लेकिन यहां तक ​​कि अगर हम यह कहने के लिए आपके उदाहरण को बदलते हैं कि आप "एक्स = माताओं में रुचि रखते हैं, जिनके पास बिल्कुल एक पूरी तरह से विकसित बेटी है", नमूना द्वारा एक्स पर हो रही है (एक्स, वाई) वाई पी के वितरण के आधार पर अपने नमूने को स्कैन करें (वी) ) = ((U in सपोर्ट (U)) (p (u, v)) = ∑ (u in सपोर्ट (U)) (p (v | u) * p (u)) = = (1 / sampleSize () यू)) *) (यू इन सैंपल (यू)) (पी (वी। यू))), क्योंकि यू का प्रत्येक मान संभावना पी (यू) के साथ नमूने में दिखाई देता है - इसलिए पी को औसत करने की आवश्यकता है (वी | यू | ड्रॉ
radumanolescu
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.