क्यों दो सामान्य रूप से वितरित चर का मिश्रण केवल बिमोडल होता है यदि उनके साधन सामान्य मानक विचलन से कम से कम दो गुना भिन्न होते हैं?


28

दो सामान्य वितरणों के मिश्रण के तहत:

https://en.wikipedia.org/wiki/Multimodal_distribution#Mixture_of_two_normal_distributions

"दो सामान्य वितरणों के मिश्रण में अनुमान लगाने के लिए पांच पैरामीटर होते हैं: दो साधनों, दो भिन्नताओं और मिश्रण पैरामीटर। समान मानक विचलन वाले दो सामान्य वितरणों का मिश्रण केवल द्विगुणित होता है यदि उनके साधन सामान्य मानक विचलन से कम से कम दो बार भिन्न होते हैं। । "

मैं एक व्युत्पत्ति या सहज व्याख्या की तलाश में हूं कि यह क्यों सच है। मेरा मानना ​​है कि यह दो नमूना टी परीक्षण के रूप में समझाया जा सकता है:

μ1μ2σp

जहां σp जमा मानक विचलन है।


1
अंतर्ज्ञान यह है कि, यदि साधन बहुत करीब हैं, तो 2 घनत्वों के द्रव्यमान में बहुत अधिक ओवरलैप होगा, इसलिए साधनों में अंतर नहीं देखा जाएगा क्योंकि अंतर केवल दो के द्रव्यमान के साथ ही चमक जाएगा। घनत्व। यदि दोनों साधन अलग-अलग हैं, तो दोनों घनत्वों का द्रव्यमान अधिक नहीं होगा और साधनों में अंतर स्पष्ट नहीं होगा। लेकिन मैं इसका एक गणितीय प्रमाण देखना चाहूंगा। यह एक बकवास बयान है। मैंने इसे पहले कभी नहीं देखा।
२१:०६ पर मोटोफॉन

2
अधिक औपचारिक रूप से, के साथ एक ही एसडी दो सामान्य वितरण के 50:50 मिश्रण के लिए आप घनत्व बारे में यदि ( एक्स ) = 0.5 जी 1 ( x ) + 0.5 जी 2 ( एक्स ) मानकों दिखा पूर्ण रूप में, आप कि इसके दूसरा व्युत्पन्न परिवर्तन दो साधन के बीच मध्य में हस्ताक्षर देखेंगे जब नीचे से साधन बढ़ जाती है के बीच की दूरी 2 σ ऊपर करने के लिए। σ,f(x)=0.5g1(x)+0.5g2(x)2σ
ब्रूसेट

जवाबों:


53

उस विकी लेख से जुड़े पेपर का यह चित्र एक अच्छा चित्रण प्रदान करता है: यहाँ छवि विवरण दर्ज करें

वे जो प्रमाण प्रदान करते हैं वह इस तथ्य पर आधारित होता है कि सामान्य वितरण उनके मतलब के एक एसडी के भीतर अवतल होता है (एसडी सामान्य पीडीएफ का विभक्ति बिंदु है, जहां यह अवतल से उत्तल तक जाता है)। इस प्रकार, यदि आप दो सामान्य pdfs को एक साथ (समान अनुपात में) जोड़ते हैं, तो जब तक उनके साधन दो एसडी से कम भिन्न होते हैं, योग-पीडीएफ (अर्थात मिश्रण) दोनों साधनों के बीच के क्षेत्र में अवतल होगा, और इसलिए वैश्विक अधिकतम दो बिंदुओं के बीच बिंदु पर होना चाहिए।

संदर्भ: शिलिंग, एमएफ, वाटकिंस, एई, और वाटकिंस, डब्ल्यू (2002)। क्या मानव की ऊँचाई बिमोडल है? अमेरिकी सांख्यिकीविद्, 56 (3), 223–229। डोई: 10.1198 / +०००३१३००२६५


11
+1 यह एक अच्छा, यादगार तर्क है।
व्हीबर

2
आंकड़ा कैप्शन भी 'fl' संयुक्ताक्षर 'inflection' में गलत तरीके से प्रस्तुत होने का एक अच्छा चित्रण प्रदान करता है :-P
nekomatic

2
@ एक्समैन: उस संदर्भ को जोड़ने के लिए धन्यवाद - चूंकि यह थोड़ा सा उड़ा दिया गया था, मैं इसे खुद को जोड़ने की योजना बना रहा था, क्योंकि मैं वास्तव में सिर्फ उनके तर्क को दोहरा रहा हूं और मैं इसके लिए बहुत अधिक क्रेडिट नहीं लेना चाहता।
रुबिन वैन बर्गन

14

यह एक ऐसा मामला है जहां चित्रों को धोखा दिया जा सकता है, क्योंकि यह परिणाम सामान्य मिश्रण की एक विशेष विशेषता है : एक एनालॉग जरूरी अन्य मिश्रणों के लिए नहीं रखता है, यहां तक ​​कि जब घटक सममित असमान वितरण होते हैं! उदाहरण के लिए, दो स्टूडेंट टी डिस्ट्रीब्यूशन का एक समान मिश्रण जो उनके सामान्य मानक विचलन से दोगुना से थोड़ा कम अलग है, बिमोडल होगा। वास्तविक अंतर्दृष्टि के लिए, हमें सामान्य वितरण के विशेष गुणों के लिए कुछ गणित या अपील करनी होगी।


माप की इकाइयों पर घटक वितरण के साधन जगह (recentering और आवश्यकतानुसार rescaling द्वारा) चुनें ±μ, μ0, और उनके सामान्य विचरण एकता बनाने के लिए। चलो p, 0<p<1, मिश्रण में बड़े मतलब घटक की राशि हो। यह हमें पूरी घनत्व में मिश्रण घनत्व को व्यक्त करने में सक्षम बनाता है

2πf(x;μ,p)=pexp((xμ)22)+(1p)exp((x+μ)22).

क्योंकि दोनों घटक घनत्वों में वृद्धि होती है जहां x<μ और जहां x>μ, घटते हैं , केवल संभव मोड वहां होते हैं μxμ.X के संबंध में f को विभेदित करके और शून्य पर सेट करके उनका पता लगाएं । हमारे द्वारा प्राप्त किसी भी सकारात्मक गुणांक को साफ़ करनाx

0=e2xμp(xμ)+(1p)(x+μ).

f के दूसरे व्युत्पन्न के साथ समान संचालन करना और पूर्ववर्ती समीकरण द्वारा निर्धारित मूल्य द्वारा e2xμ जगह हमें किसी भी महत्वपूर्ण बिंदु पर दूसरी व्युत्पन्न का संकेत बताता है।

f(x;μ,p)(1+x2μ2)xμ.

के बाद से भाजक नकारात्मक है जब μ<x<μ, के हस्ताक्षर f है कि (1μ2+x2).यह स्पष्ट है कि जब μ1, संकेत नकारात्मक होना चाहिए। बहुविध वितरण में, हालांकि (क्योंकि घनत्व निरंतर है), किसी भी दो मोड के बीच एक एंटीमोड होना चाहिए , जहां संकेत गैर-नकारात्मक है। इस प्रकार, जब μ1 (एसडी) से कम होता है , तो वितरण अनिमॉडल होना चाहिए।

चूंकि साधनों का पृथक्करण 2μ, इस विश्लेषण का निष्कर्ष है

जब भी साधनों को दो बार से अधिक सामान्य मानक विचलन द्वारा अलग किया जाता है, तो सामान्य वितरण का मिश्रण असमान होता है।

यह तार्किक रूप से प्रश्न में कथन के बराबर है।


12

निरंतरता के लिए यहां ऊपर से टिप्पणी करें:

"[एफ] मौखिक रूप से, एक ही एसडी same के साथ दो सामान्य वितरण के 50:50 मिश्रण के लिए, यदि आप घनत्व

f(x)=0.5g1(x)+0.5g2(x)
को पूर्ण रूप में दिखाते हैं। पैरामीटर, आप देखेंगे कि इसके दूसरे व्युत्पन्न परिवर्तन दोनों के बीच के मध्य बिंदु पर हस्ताक्षर करते हैं जब साधनों के बीच की दूरी 2 "से ऊपर तक बढ़ जाती है।"

टिप्पणी जारी:

σ=1.3σ,2σ,σ,

enter image description here

आकृति के लिए R कोड:

par(mfrow=c(1,3))
  curve(dnorm(x, 0, 1)+dnorm(x,3,1), -3, 7, col="green3", 
    lwd=2,n=1001, ylab="PDF", main="3 SD: Dip")
  curve(dnorm(x, .5, 1)+dnorm(x,2.5,1), -4, 7, col="orange", 
    lwd=2, n=1001,ylab="PDF", main="2 SD: Flat")
  curve(dnorm(x, 1, 1)+dnorm(x,2,1), -4, 7, col="violet", 
    lwd=2, n=1001, ylab="PDF", main="1 SD: Peak")
par(mfrow=c(1,3))

1
सभी के जवाब बहुत अच्छे थे। धन्यवाद।
2:42 पर मिलीलीटर

3
2/30.001.

1
0.1% fx0)
f(x0)f(x)0.001f(x0)  |xx0|0.333433,
0.0010.95832
f(x0)f(x)0.001  |xx0|0.47916.

अच्छे अंक। दरअसल, संक्षिप्त भाषा 'फ्लैट' से मेरा मतलब शून्य था जो मिडपॉइंट पर बिल्कुल शून्य व्युत्पन्न था।
ब्रूसेट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.