CLT लिए काम क्यों नहीं करता है ?


16

तो हम जानते हैं कि पैरामीटर साथ poissons की राशि स्वयं साथ एक poisson है । इसलिए काल्पनिक रूप से, कोई भी और कह सकता है कि यह वास्तव में जहाँ प्रत्येक है: x , और काम करने के लिए CLT प्राप्त करने के लिए एक बड़ा n लें।λ n λ एक्स ~ पी मैं रों रों एन ( λ = 1 ) Σ n 1 एक्स मैं ~ पी मैं रों रों एन ( λ = 1 ) एक्स मैं एक्स मैं ~ पी मैं रों रों एन ( λ = 1 / n )nλnλxpoisson(λ=1)1nxipoisson(λ=1)xixipoisson(λ=1/n)

यह (स्पष्ट रूप से) काम नहीं करता है। मुझे लगता है कि यह कुछ करने के लिए है कि CLT यादृच्छिक चर के लिए "तेजी से" कैसे काम करता है जो सामान्य से "करीब" हैं, और यह कि छोटा लंबा है, जितना अधिक हम एक यादृच्छिक चर प्राप्त करते हैं जो कि ज्यादातर 0 होता है और शायद ही कभी कुछ और भिन्न होता है।

हालाँकि, मैंने जो समझाया वह मेरा अंतर्ज्ञान है। क्या यह समझाने का एक अधिक औपचारिक तरीका है कि यह मामला क्यों है?

धन्यवाद!


6
शुरुआत के लिए, CLT विभाजित करने के लिए आप की जरूरत है i=1nxi द्वारा n (जिस स्थिति में आप एक गॉसियन में परिवर्तित हो जाएंगे)।
एलेक्स आर।

1
@AlexR। नहीं, आप विभाजित करते हैं n, तो मानक विचलन का कारक होगा1/n
अक्षल

4
मैं यह नहीं देखता कि इस सवाल का CLT के साथ क्या करना है "काम नहीं कर रहा है।" सीएलटी एक दिए गए वितरण के साथ यादृच्छिक चर के मानकीकृत रकम की चिंता करता है , जबकि आप एक एकल यादृच्छिक चर ले रहे हैं और इसे विभाजित करने के असीम तरीके से विचार कर रहे हैं।
whuber

2
@AlexR सेटअप सभी गलत लगता है। यहां दो अलग-अलग प्रक्रियाएं चल रही हैं - समन और डिवीजन - और यह मानने का कोई कारण नहीं है कि उनके पास समान विषम विशेषताएं होनी चाहिए।
whuber

3
@ अक्षल: वास्तव में, एलेक्सआर सही है। आप से विभाजित हैं n , आप के रूप में एक पतित वितरण मिलता n । यदि आप √ से विभाजित करते हैंn , आप एसडी के साथ = 1 के रूप में एक सामान्य वितरण दृष्टिकोणn
क्लिफ एबी

जवाबों:


13

मैं @whuber से सहमत हूं कि भ्रम की जड़ आपके तर्क में कुछ प्रकार के विभाजन के साथ CLT में सम्‍मिलन विषमता की जगह लेती प्रतीत होती है। CLT हम मिल तय वितरण f(x,λ) तो आकर्षित n संख्या xi इसे से और योग की गणना x¯n=1ni=1nxi। अगर हम बढ़ती रखनाnतो एक दिलचस्प बात होता है:

n(x¯nμ)N(0,σ2)
जहांμ,σ2मतलब और वितरण के विचरण कर रहे हैंf(x)

क्या आप प्वासों से कोई लेना देना सुझाव दे रहे हैं कुछ हद तक पीछे की ओर है: बजाय एक से चर संक्षेप की तय वितरण, आप करना चाहते हैं विभाजित तय में वितरण कभी बदलते भागों। दूसरे शब्दों में आप एक चर ले x एक से तय वितरण f(x,λ) तो विभाजित इसे में xi इतना है कि

i=1nxix

इस प्रक्रिया के बारे में सीएलटी क्या कहता है? कुछ भी तो नहीं। ध्यान दें, कैसे CLT में हमने कभी √ को बदला है, और उसकेबदलतेवितरणn(x)है कि एक के लिए convergesतयवितरणएन(0,σ2)n(x¯nμ)fn(x)N(0,σ2)

आपके सेटअप में न तो योग और न ही इसका वितरण f ( x , λ ) बदल रहा है! वे तय कर रहे हैं। वे बदल नहीं रहे हैं, वे किसी भी चीज़ में परिवर्तित नहीं हो रहे हैं। इसलिए, सीएलटी को उनके बारे में कुछ नहीं कहना है।xf(x,λ)

इसके अलावा, CLT योग में तत्वों की संख्या के बारे में कुछ नहीं कहता है। आपके पास पोइसन (0.001) से 1000 चर हो सकते हैं और सीएलटी राशि के बारे में कुछ नहीं कहेंगे। सभी यह कहते हैं कि यदि आप N को बढ़ाते रहेंगे तो किसी समय यह राशि सामान्य वितरण 1 जैसी दिखने लगेगी। वास्तव में अगर N = 1,000,000 आपको सामान्य वितरण के करीब सन्निकटन मिलेगा।1Ni=1Nxi,xiPoisson(0.001)

आपका अंतर्ज्ञान योग में तत्वों की संख्या के बारे में ही सही है, यानी अधिक से अधिक शुरुआती वितरण सामान्य से अलग है, फिर सामान्य होने के लिए आपको अधिक तत्वों की आवश्यकता है। : और अधिक औपचारिक (लेकिन अभी भी अनौपचारिक) जिस तरह से प्वासों की विशेषता समारोह को देखकर किया जाएगा यदि आप λ > > 1 (wrt, आप टेलर विस्तार के साथ मिल टी ) नेस्टेड प्रतिपादक की: exp ( मैं λ टी - λ / 2 टी 2

exp(λ(exp(it)1))
λ>>1t यह सामान्य वितरण N ( λ , λ 2 ) की विशेषता है।
exp(iλtλ/2t2)
N(λ,λ2)

हालांकि, आपके अंतर्ज्ञान को सही तरीके से लागू नहीं किया जाता है: सीएलटी में आपके विस्थापन को किसी प्रकार के विभाजन के साथ चीजों को गड़बड़ कर देता है, और सीएलटी को अनुपयुक्त बना देता है।


+1 प्रचलित सामग्री अच्छी तरह से शब्द है, बहुत स्पष्ट है, और इस मुद्दे के दिल तक पहुँच जाती है।
whuber

7

आपके उदाहरण के साथ समस्या यह है कि आप पैरामीटर को परिवर्तनों के रूप में बदलने की अनुमति दे रहे हैं । CLT आपको बताता है कि परिमित माध्य और sd के साथ निश्चित वितरण के लिए , n that ,nn

,xμndN(0,σ)

जहां और σ मतलब और के वितरण के एसडी से हैं एक्सμσx

बेशक, अलग-अलग वितरणों (उदाहरण के लिए उच्च तिरछी) के लिए, इस प्रमेय से प्राप्त अनुमान से पहले बड़े की आवश्यकता होती है। अपने उदाहरण में, के लिए λ मीटर = 1 / मीटर , एक n > > मीटर से पहले सामान्य सन्निकटन उचित है की आवश्यकता है।nλm=1/mn>>m

संपादित करें

वहाँ के बारे में कैसे CLT मानकीकृत रकम के लिए रकम पर लागू नहीं होता है, बल्कि (यानी चर्चा है नहींxi)। सिद्धांत रूप में, यह निश्चित रूप से सच है: अधिकांश मामलों में अनपेक्षित राशि का अपरिभाषित वितरण होगा।xi/nxi

हालाँकि, व्यवहार में, आप निश्चित रूप से सीएलटी द्वारा निहित सन्निकटन को रकम के लिए लागू कर सकते हैं! यदि बड़े के लिए एक सामान्य CDF इसका अनुमान लगाया जा सकता है n , तो निश्चित रूप से एफ Σ एक्स भी कर सकते हैं, एक अदिश बरकरार रखता है सामान्य से गुणा करने के रूप में। और अगर आप इस समस्या में अभी इस देख सकते हैं: याद है कि अगर एक्स मैं ~ पी मैं रों ( λ ) , तो Y = Σ n मैं = 1 एक्स मैं ~ पी मैं रों ( एन λ )Fx¯nFxXiPois(λ)Y=i=1nXiPois(nλ)। और हम सब अपने ऊपरी विभाजन संभावना पाठ्यक्रम में सीखा है कि बड़े के लिए , एक की CDF पी मैं रों ( λ ) बहुत अच्छी तरह से एक सामान्य से साथ अनुमान लगाया जा सकता μ = λ , σ 2 = λ । तो किसी के लिए तय λ , हम की CDF का अनुमान लगा सकता Y ~ पी मैं रों ( एन λ ) काफी अच्छी तरह से साथ Φ ( y - एन λλPois(λ)μ=λσ2=λ λYPois(nλ)एक बड़े पर्याप्तn के लिएयदिλ>0(सन्निकटन तुच्छ रूप से लागू किया जा सकता है यदिλ=0, लेकिन सीडीएफ की गणना नहीं है जैसा कि मैंने लिखा है)।Φ(ynλnλ)nλ>0λ=0

जबकि CLT आसानी से रकम पर लागू नहीं होता है, CLT पर आधारित सन्निकटन निश्चित रूप से होता है। मेरा मानना ​​है कि यह वही है जो ओपी का उल्लेख कर रहा था जब योग को सीएलटी लागू करने पर चर्चा की गई थी।


5

सवाल यह है, मैं तर्क देता हूं, अगर अधिक सामान्यतः के बारे में सोचा जाता है, तो दिलचस्प है, माता-पिता पॉइसन के वितरण को पर निर्भर करते हुए , पैरामीटर λ n और λ n = 1 के साथ एक विशेष मामले के रूप में कहें । मुझे लगता है कि क्यों पूछने के लिए पूरी तरह से उचित है, और हम कैसे है कि समझ सकते हैं, एक केंद्रीय सीमा प्रमेय राशि के लिए नहीं रखता है एस एन = Σ n मैं = 1 एक्स मैं , एन । आखिरकार, उन समस्याओं में भी एक CLT लागू करना आम है जहां योग के घटकों का वितरण n पर निर्भर करता हैnλnλn=1Sn=i=1nXi,nn। पोइसन चर के योग के रूप में पोइसन वितरण को विघटित करना भी आम है, और फिर एक CLT लागू करें।

Xi,nnSnnSnPoi(n)Poi(λn)

The Lindeberg-Feller Central Limit Theorem for triangular arrays is often used to examine convergence of such sums. As you point out, SnPoi(1) for all n, so Sn cannot be asymptotically normal. Still, examining the Lindeberg-Feller condition sheds some light on when decomposing a Poisson into a sum may lead to progress.

A version of the theorem may be found in these notes by Hunter. Let sn2=Var(Sn). The Lindeberg-Feller condition is that, ϵ>0:

1sn2i=1nE[Xi,n1/n]2I(|Xi,n1/n|>ϵsn)0,n

Now, for the case at hand, the variance of the terms in the sum is dying off so quickly in n that sn=1 for every n. For fixed n, we also have that the Xi,n are iid. Thus, the condition is equivalent to

nE[X1,n1/n]2I(|X1,n1/n|>ϵ)0.

But, for small ϵ and large n,

nE[X1,n1/n]2I(|X1,n1/n|>ϵ)>nϵ2P(X1,n>0)=ϵ2n[1e1/n]=ϵ2n[1(11/n+o(1/n))]=ϵ2+o(1),

which does not approach zero. Thus, the condition fails to hold. Again, this is as expected since we already know the exact distribution of Sn for every n, but going through these calculations gives some indications of why it fails: if the variance didn't die off as quickly in n you could have the condition hold.


+1 This nicely illuminates a comment by @AlexR to the question, too.
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.