सामान्य वितरण के परिमित मिश्रण से नमूने खींचना?


10

कुछ बायेसियन अपडेट चरणों के बाद, मुझे सामान्य वितरण के मिश्रण के पीछे के वितरण के साथ छोड़ दिया जाता है,यही है, पैरामीटर \ थाटा एक वितरण से तैयार किया गया है जिसका पीडीएफ सामान्य पीडीएफ के भारित मिश्रण के रूप में दिया गया है, और सामान्य आरवी का योग नहीं है। मैं इस पोस्टीरियर के एक महत्वपूर्ण नमूने सन्निकटन में उपयोग करने के लिए नमूने \ थीटा \ सिम \ पीआर (\ थीटा | \ पाठ {डेटा}) आकर्षित करना चाहूंगा । व्यवहार में, मेरे ऊपर योग की एक बड़ी संख्या हो सकती है, जिससे कि मैं एक शब्द का चयन करने के लिए अव्यावहारिक हो सकता है, जो कि वज़न \ {w_i \} के अनुसार है और फिर \ theta \ sim N (\ mu_i, \ sigma ^) ड्रा करें 2)

Pr(θ|data)=i=1kwiN(μi,σ2).
θ ~ पीआर ( θ | डेटा ) मैं मैं { w मैं } θ ~ एन ( μ मैं ,θθPr(θ|data)ii{wi}θN(μi,σ2)। क्या इस फॉर्म के पिछले हिस्से से नमूने खींचने का एक कुशल तरीका है?

क्या आपने वास्तव में सेलेक्ट थ्रो विधि की कोशिश की है? चयन को ओ (के) चरणों के चलते तेजी से किया जा सकता है।
dmckee --- पूर्व-संचालक बिल्ली का बच्चा

1
यदि बैरोन का समाधान वास्तव में सही नहीं है, और आप वास्तव में एक "मिश्रण मॉडल" का मतलब है, तो क्या आप उस शब्द का उपयोग कर सकते हैं?
नील जी

1
नील जी: मैं व्यापार से एक सांख्यिकीविद् नहीं हूं, बल्कि एक भौतिक विज्ञानी हूं जिसे कभी-कभी आंकड़ों का उपयोग करने की आवश्यकता होती है। इस तरह, मुझे उपयुक्त शब्द नहीं पता था कि मुझे क्या चाहिए। मैं इस प्रश्न को अभी संपादित कर सकता हूं, हालांकि, यह स्पष्ट करने के लिए कि पीडीएफ को सारांशित किया जा रहा है और आरवी को नहीं।
क्रिस ग्रेनडे

1
@ क्रिसग्रेनडे: मैं आपके नीचे आने की कोशिश नहीं कर रहा था। मैं सिर्फ यह सुनिश्चित करना चाहता था कि आपका क्या मतलब है, और संपादन का सुझाव देना है।
नील जी

1
क्यों कि वज़न पर आधारित और पर समान वितरण से एक नमूना , फिर नमूना ? यह केवल एक सामान्य वितरण के नमूने की तुलना में अधिक महंगा है, लागत मिश्रित वितरण की संख्या से स्वतंत्र है और उन वितरणों के सामान्य होने पर भरोसा नहीं करता है। { w मैं } [ 0 , 1 ] एन ( μ मैं , σ 2 ) कश्मीरi{wi}[0,1]N(μi,σ2)k
जेड ब्राउन

जवाबों:


6

सिद्धांत रूप में, प्रत्येक उप-वितरण से निकाले जाने वाले नमूनों की संख्या का अनुमान लगाया जा सकता है, फिर प्रत्येक उप वितरण को केवल एक बार देखें और अंकों की संख्या से अधिक ड्रा करें।

अर्थात्

  1. यादृच्छिक सेट जैसे कि और वज़न का सम्मान करें।n = Σ कश्मीर मैं = 1 n मैं<n1,n2,,nk>n=i=1kni

    मैं तुम्हें करके ऐसा कर कि विश्वास करते हैं एक प्वासों बंटन ड्राइंग मतलब की एक बहुपद वितरण (टिप्पणी देखें) प्रत्येक उप-वितरण के लिए और उसके बाद के लिए योग को सामान्य ।एनwinn

    यहाँ कामO(k)O(n)

  2. फिर करो

    for (i=1; i<=k; ++i)
       for (j=1; j<=n[i]; ++j)
          theta ~ N(mu[i],sigma[i])
    

    यहाँ कामO(n)

हालांकि इसका मतलब यह है कि आपको यादृच्छिक क्रम में नहीं मिलता है। यदि यादृच्छिक क्रम की आवश्यकता होती है, तो आपको ड्रॉ को फेरबदल करना होगा (बड़े )।O(n)

ऐसा लगता है कि पहला कदम रन टाइम में और भोली एल्गोरिथ्म के समान क्रम में हावी है, लेकिन यदि आप सुनिश्चित हैं कि सभी आप सामान्य वितरण के साथ वितरण को अनुमानित कर सकते हैं और पहले चरण को गति दे सकते हैं।win1


के वितरण एक प्वासों बंटन अगर नहीं है तय हो गई है, लेकिन एक द्विपद बंटन। nnin
फ्रेडेरिक ग्रॉंस

@ FrédéricGrosshans उह ... यहाँ मैं संभावना में मेरी व्यथित कमजोरी स्वीकार करते हैं। मुझे लगता है कि आप सही हो सकते हैं। मेरे पास मनमाने द्विपदीय वितरण फेंकने के लिए लिंक नहीं है, लेकिन विकिपीडिया के कुछ संदर्भ हैं । पोइसन और द्विपद के बीच एक संबंध भी है जो मैं दावा करने जा रहा हूं जो मेरी अनिश्चितता के लिए जिम्मेदार था। हाँ, वह टिकट है।
dmckee --- पूर्व-मध्यस्थ ने बिल्ली का बच्चा

1
@ मिडी: एक मिश्रण मॉडल से ड्राइंग के लिए अच्छा जवाब, सिवाय इसके कि यह चरण 1 में एक पॉइज़न वितरण के बजाय एक बहुराष्ट्रीय वितरण होना चाहिए
नील जी

3

नोट: इस प्रश्न का मूल संस्करण "सामान्य वितरण का भारित योग" है, जिसके बारे में निम्नलिखित उत्तर उपयोगी हो सकते हैं। हालाँकि, इस उत्तर पर अच्छी चर्चा के बाद, @Geoff द्वारा उत्तर, और स्वयं प्रश्न पर, यह स्पष्ट हो गया कि प्रश्न वास्तव में "सामान्य वितरण के मिश्रण" के नमूने पर था, जिसके लिए यह उत्तर लागू नहीं है।


सामान्य वितरण का योग एक सामान्य वितरण है, इसलिए आप इस एकल वितरण के मापदंडों की गणना कर सकते हैं और फिर बस उसी से नमूने खींच सकते हैं। यदि हम उस वितरण को , तो "N(μsum,σsum2)

μsum=i=1kwiμi

σsum2=i=1kwi2σi2

3
इसे आसानी से कहने के लिए, क्रिस संभाव्यता घनत्व कार्यों को सम्‍मिलित करता है, यादृच्छिक चर नहीं।
ज्योफ ऑक्सीबेरी

2
क्रिस एक पीडीएफ चाहता है जिसमें (कम से कम सिद्धांत रूप में) इसमें कई बम्प्स हों। यानी वह पीडीएफ का योग था, योग का पीडीएफ नहीं।
dmckee --- पूर्व-संचालक बिल्ली का बच्चा

1
यह सच है कि सामान्य रूप से वितरित यादृच्छिक चर का योग अपने आप में सामान्य रूप से वितरित यादृच्छिक चर है। हालांकि, सामान्य वितरण का योग एक सामान्य वितरण नहीं है। तो अगर और , यह सच है कि , लेकिन । (स्पष्टीकरण के लिए श्रेय @ChrisGranade को जाता है।)एक्स 2 ~ एन ( μ 2 , σ 2 2 ) एक्स 1 + एक्स 2 ~ एन ( μ 1 + μ 2 , σ 2 1 + σ 2 2 ) पी डी एफ ( एक्स 1 + एक्स 2 ) पी डी एफ (X1N(μ1,σ12)X2N(μ2,σ22)X1+X2N(μ1+μ2,σ12+σ22)PDF(X1+X2)PDF(X1)+PDF(X2)
ज्योफ ऑक्सीबेरी

2
@ डमकी: यह "सामान्य वितरणों का भारित योग" नहीं है, यह "सामान्य वितरणों का मिश्रण" है।
नील जी

2
@Barron टिप्पणियों को पेज का एक अनिवार्य हिस्सा नहीं माना जाता है। आपको टिप्पणियों के सार को शामिल करने के लिए अपने जवाब को निश्चित रूप से संपादित करना चाहिए ताकि जो पाठक टिप्पणियों को नहीं देखते हैं वे गुमराह न हों।
डेविड केचेसन

2

अद्यतन : यह उत्तर गलत है, शब्दावली में भ्रम से उपजी है (विवरण के लिए नीचे टिप्पणी श्रृंखला देखें); मैं केवल इसे एक गाइडपोस्ट के रूप में छोड़ रहा हूं ताकि लोग इस उत्तर (बैरन के अलावा) को न दोहराएं। कृपया इसे ऊपर या नीचे मत डालें।

मैं बस यादृच्छिक चर के गुणों का उपयोग करूँगा इसे कम करने के लिए एक सामान्य रूप से वितरित यादृच्छिक चर। दो स्वतंत्र का योग है, सामान्य रूप से वितरित यादृच्छिक चर अपने आप में एक यादृच्छिक चर है , इसलिए यदि और , फिरएक्स 2 ~ एन ( μ 2 , σ 2 2 )X1N(μ1,σ12)X2N(μ2,σ22)

X1+X2N(μ1+μ2,σ12+σ22).

इसके अलावा, अगर , तोw1R

w1X1N(w1μ1,w12σ12).

इन दो परिणामों का उपयोग करके संयुक्त, फिर

Pr(θ|data)N(i=1kwiμi,i=1kwi2σi2).

तो इस मामले में, आपको केवल एक ही वितरण से नमूने खींचने की आवश्यकता होगी, जो बहुत अधिक ट्रैक्टेबल होना चाहिए।


2
यह एक अलग समस्या का समाधान है जिसे इस तथ्य से देखा जा सकता है कि मूल वितरण बहु-मोडल है और आपका सुझाव यूनी-मोडल है।
क्रिस फेरी

@ChrisFerrie: मेरा मानना ​​है कि, लेकिन संकेतन के आधार पर, मैं उलझन में हूँ कि ऊपर का वितरण मल्टीमॉडल क्यों होगा, जबकि दो स्वतंत्र गाऊसी यादृच्छिक चर का योग नहीं होगा। मुझे यहां क्या समझ नहीं आ रहा है?
ज्योफ ऑक्सीबेरी

मुझे लगता है कि भ्रम यह है कि हम यादृच्छिक चर का योग नहीं देख रहे हैं, लेकिन एक पीडीएफ जो कई पीडीएफ का योग है। ये हमेशा समान नहीं होते हैं, क्योंकि । इसके बजाय, हमारे पीडीएफ को यादृच्छिक चर पर हाशिए पर रखने के रूप में सोचा जा सकता है । मैंp(X1+X2)p(X1)+p(X2)i
क्रिस ग्रेनडे

आह, आप पीडीएफ की रकम देख रहे हैं। हां, यह पूरी तरह से एक अलग जानवर है। अब जब मैंने प्रश्न को अधिक बारीकी से पढ़ा, तो मैं देख रहा हूं कि आप क्या कह रहे हैं, और मैं अपनी प्रतिक्रिया को नष्ट करने जा रहा हूं। धन्यवाद!
ज्योफ ऑक्सीबेरी

मैंने अपने पहले हटाए गए उत्तर को केवल दूसरों के लिए एक मार्गदर्शिका के रूप में सेवा करने के लिए हटा दिया है ताकि कोई और इस सवाल का जवाब न दे सके जैसे कि बैरन और मैंने किया था। कृपया अब मेरे उत्तर को मत छोड़िए या मत लाइए।
ज्योफ ऑक्सीबेरी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.