दो गॉसियन के भारित मिश्रण का प्रसरण क्या है?


38

मान लें कि मेरे पास दो सामान्य वितरण हैं A और B का अर्थ है और \ mu_B और variances \ sigma_A और \ sigma_B । मैं इन दो वितरणों का भार भार पी और क्यू का उपयोग करके लेना चाहता हूं, जहां 0 \ ली पी \ ली 1 और क्यू = 1-पी । मुझे पता है कि इस मिश्रण का मतलब \ mu_ {AB} = (p \ टाइम्स \ mu_A) + (q \ टाइम्स \ mu_B) होगाμAμBσAσBpq0p1q=1pμAB=(p×μA)+(q×μB)

विचरण क्या होगा?


एक ठोस उदाहरण होगा यदि मुझे पुरुष और महिला ऊंचाई के वितरण के मापदंडों का पता था। यदि मेरे पास 60% पुरुष लोगों का एक कमरा होता, तो मैं पूरे कमरे के लिए अपेक्षित औसत ऊँचाई पैदा कर सकता था, लेकिन विचरण के बारे में क्या?


पुन: शब्दावली: मिश्रण का बस एक मतलब और एक विचरण होता है; इन्हें "अपेक्षित" के रूप में योग्य बनाने में कोई समझदारी नहीं है, जब तक कि आप शायद यह संकेत नहीं दे रहे हैं कि p और q को यादृच्छिक चर माना जाना चाहिए।
whuber

मुझे पता है कि दो गाऊसी वितरण का मिश्रण पहचान योग्य है। लेकिन अगर दो डिस्ट्रीब्यूशन में एक ही एमेंस हो तो? Ie :, समान साधनों के साथ दो सामान्य वितरणों का मिश्रण है और विभिन्न मानक विचलन पहचान योग्य हैं? इस संदर्भ में कागजात हैं? अग्रिम धन्यवाद

1
इसी तरह के सवालों के जवाब (COVARIANCES के साथ भी) यहां दिए गए हैं: math.stackexchange.com/q/195911/96547
hplieninger

जवाबों:


62

विचरण पहले पल का वर्ग शून्य से दूसरे क्षण है, इसलिए यह मिश्रण के क्षणों की गणना करने के लिए पर्याप्त है।

सामान्य तौर पर, पीडीएफ के साथ दिए गए वितरण और निरंतर (गैर-यादृच्छिक) वजन , मिश्रण का पीडीएफ हैfipi

f(x)=ipifi(x),

जिससे यह किसी भी क्षण तुरंत बाद आता हैk

μ(k)=Ef[xk]=ipiEfi[xk]=ipiμi(k).

मैं लिखा है के लिए के क्षण और के लिए के क्षण ।μ(k)kthfμi(k)kthfi

इन सूत्रों का उपयोग करते हुए, विचरण को लिखा जा सकता है

Var(f)=μ(2)(μ(1))2=ipiμi(2)(ipiμi(1))2.

तुल्य, यदि का प्रसरण के रूप में दिया जाता है , तो , मिश्रण के विचरण को सक्षम करने के रूप में इसके घटकों के प्रकार और साधन के रूप में लिखा जा सकता हैfiσi2μi(2)=σi2+(μi(1))2f

Var(f)=ipi(σi2+(μi(1))2)(ipiμi(1))2=ipiσi2+ipi(μi(1))2(ipiμi(1))2.

शब्दों में, यह (भारित) औसत भिन्नता है और औसत वर्ग औसत माध्य का वर्ग घटा है। क्योंकि स्क्वेरिंग एक उत्तल कार्य है, जेन्सेन की असमानता का दावा है कि औसत चुकता औसत औसत के वर्ग से कम नहीं हो सकता है। यह हमें बताते हुए के रूप में सूत्र को समझ सकते हैं मिश्रण के विचरण प्रसरण का मिश्रण है प्लस एक गैर नकारात्मक अवधि (भारित) साधन के फैलाव के लिए लेखांकन।

आपके मामले में विचरण है

pAσA2+pBσB2+[pAμA2+pBμB2(pAμA+pBμB)2].

हम यह व्याख्या कर सकते हैं कि यह दो भिन्नताओं का एक भारित मिश्रण है, , प्लस (आवश्यक रूप से सकारात्मक) सुधार शब्द जो व्यक्ति से समग्र मिश्रण के सापेक्ष शिफ्ट के लिए है।pAσA2+pBσB2

डेटा की व्याख्या करने में इस विचरण की उपयोगिता, जैसे कि प्रश्न में दी गई है, संदेहजनक है, क्योंकि मिश्रण वितरण सामान्य नहीं होगा (और इससे बहुत हद तक विदाई हो सकती है, बिमोडिटी का प्रदर्शन करने की सीमा तक)।


8
विशेष रूप से, यह देखते हुए कि , आपकी अंतिम अभिव्यक्ति । pA+pB=1σ2=μ(2)μ2=pAσA2+pBσB2+pApB(μAμB)2
इल्मरी करोनें

2
या, अगर हम एक मिश्रण घनत्व के लिए एक संभाव्य व्याख्या करते हैं ( प्रोबायिटी की एक घटना है और दिया गया का सशर्त घनत्व जबकि का सशर्त घनत्व दिया गया है है ), तो वर सशर्त विचरण प्लस सशर्त मतलब के विचरण का मतलब का योग है। उत्तरार्द्ध मानों के साथ एक असतत आरवी संभाव्यता और साथApAXAN(μA,σA2)XAc=BN(μB,σB2)(X)YμA,μBpqऔर वर्ग कोष्ठक में आपकी अभिव्यक्ति को आसानी से माना जाता है । E[Y2](E[Y])2
दिलीप सरवटे

1
@Neodyme परिभाषा के अनुसार, विचरण दूसरे क्षण का शून्य से छोटा वर्ग है। इसलिए, दूसरा पल विचरण के साथ साथ माध्य वर्ग है।
whuber

1
@ नियोडाइम । E(X)=μ
whuber

1
@ किरन हालांकि कुछ मामलों में मिश्रण सामान्य लग सकता है , यह नहीं होगा। यह देखने का एक तरीका है कि यहां दिए गए सूत्रों का उपयोग करके इसके अतिरिक्त कुर्तोसिस की गणना की जाए। जब तक सभी मानक विचलन समान नहीं होंगे, तब तक यह नॉनज़ेरो होगा - जिस स्थिति में "मिश्रण" वास्तव में पहली जगह पर मिश्रण नहीं है।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.