केंद्रीय सीमा प्रमेय (CLT) में कहां से आता है?


36

रूप में केंद्रीय सीमित प्रमेय का एक बहुत ही सरल संस्करण जो लिंडबर्ग-लेवी CLT है। मुझे समझ में नहीं आ रहा है कि बाईं ओर एक क्यों है। और लायपुनोव CLT कहते हैं कि लेकिन क्यों नहीं ? क्या कोई मुझे बताएगा कि ये कारक क्या हैं, ऐसे और ? हम उन्हें प्रमेय में कैसे प्राप्त करते हैं?

n((1ni=1nXi)μ) d N(0,σ2)
n
1sni=1n(Xiμi) d N(0,1)
snn1sn

3
यह आँकड़े.स्टैकएक्सचेंज . com / questions / 3734 पर समझाया गया है । यह उत्तर लंबा है, क्योंकि यह "अंतर्ज्ञान" के लिए पूछता है। यह निष्कर्ष निकालता है, "यह सरल सन्निकटन, हालांकि, बताता है कि मूल रूप से डी मोइवर को कैसे संदेह हो सकता है कि एक सार्वभौमिक सीमित वितरण है, कि इसका लघुगणक एक द्विघात कार्य है, और यह कि उचित पैमाने का कारक को समानुपाती होना चाहिए। ... " snn
whuber

1
सहज रूप से, अगर सभी तो और दूसरी पंक्ति 1 पंक्ति से इस प्रकार है: द्वारा विभाजित करें (बेशक लयापुणोव स्थिति, संयोजन बंद; सभी , एक और सवाल है)σi=σsn=σi2=nσ
n((1ni=1nXi)μ)=1ni=1n(Xiμ)d N(0,σ2)
σ=snnσ मैं
1ni=1n(Xiμ)snn=1sni=1n(Xiμi)d N(0,1)
σi
सेक्स्टस एम्पिरिकस

जवाबों:


33

अच्छा सवाल (+1) !!

आपको याद होगा कि स्वतंत्र यादृच्छिक चर और , और । इसलिए का \ sum_ {i = 1} ^ n \ sigma ^ 2 = n \ sigma ^ 2 है , और \ bar {X} = \ \ बराक {1} का विचरण। {n} \ sum_ {i = 1} ^ n x_i है n \ सिग्मा ^ 2 / n ^ 2 = \ सिग्मा ^ 2 / एनवाई वी एक आर ( एक्स + Y ) = वी एक आर ( एक्स ) + वी एक आर ( वाई ) वी एक आर ( एक एक्स ) = एक 2वी एक आर ( एक्स )XYVar(X+Y)=Var(X)+Var(Y)Var(aX)=a2Var(X)Σ n मैं = 1 σ 2 = n σ 2 ˉi=1nXii=1nσ2=nσ2nσ2/n2=σ2/nX¯=1ni=1nXinσ2/n2=σ2/n

यह विचरण के लिए है । यादृच्छिक चर का मानकीकरण करने के लिए, आप इसे इसके मानक विचलन द्वारा विभाजित करते हैं। जैसा कि आप जानते हैं, का अपेक्षित मान , इसलिए चर μX¯μ

एन(0,

X¯E(X¯)Var(X¯)=nX¯μσ
में मान 0 और विचरण 1. अपेक्षित है। इसलिए यदि यह एक गाऊसी के लिए जाता है, तो इसे मानक गाऊसी । पहले समीकरण में आपका सूत्रीकरण बराबर है। बाएं हाथ को से गुणा करके आप विचरण को सेट करते हैं ।σ σ N(0,1)σσ2

आपके दूसरे बिंदु के बारे में, मेरा मानना ​​है कि ऊपर दिखाया गया समीकरण दिखाता है कि आपको समीकरण को मानकीकृत करने के लिए और not से विभाजित करना है, यह समझाते हुए कि आप ( का अनुमानक का उपयोग क्यों करते हैं और नहीं ।σ sn )σσsnσ)sn

इसके अलावा: @whuber चर्चा करने के लिए पता चलता है क्यों द्वारा स्केलिंग की । वह वहां करता है , लेकिन क्योंकि उत्तर बहुत लंबा है, मैं उसके तर्क के निबंध को पकड़ने की कोशिश करूंगा (जो डी मोइवर के विचारों का पुनर्निर्माण है)।n

यदि आप बड़ी संख्या में + 1 और -1 की संख्या जोड़ते हैं , तो आप इस संभावना को अनुमानित कर सकते हैं कि योग प्रारंभिक गणना द्वारा होगा । इस संभावना का लॉग आनुपातिक है । इसलिए यदि हम चाहते हैं कि ऊपर दी गई संभाव्यता निरंतर रूप से बड़ी हो जाए, तो हमें में एक सामान्यीकरण कारक का उपयोग करना होगा ।j - j 2 / n n हे ( njj2/nnO(n)

आधुनिक (पोस्ट डी मोइवर) गणितीय साधनों का उपयोग करते हुए, आप ऊपर उल्लिखित अनुमान को देख सकते हैं कि ध्यान देने योग्य संभावना है

P(j)=(nn/2+j)2n=n!2n(n/2+j)!(n/2j)!

जिसे हम स्टर्लिंग के सूत्र द्वारा अनुमानित करते हैं

P(j)nnen/2+jen/2j2nen(n/2+j)n/2+j(n/2j)n/2j=(11+2j/n)n+j(112j/n)nj.

log(P(j))=(n+j)log(1+2j/n)(nj)log(12j/n)2j(n+j)/n+2j(nj)/nj2/n.

कृपया माइकल सी और आदमी द्वारा पिछले उत्तरों के लिए मेरी टिप्पणियाँ देखें।
whuber

प्रथम समीकरण (LL CLT) s / b ? इसने मुझे भ्रमित कर दिया और साथ ही साथ विचरण के रूप में दिखाई दिया। n((1ni=1nXi)μ) d N(0,1)σ2
B_Miner

यदि आप माध्य और विचरण (मानक विचलन नहीं) के साथ गॉसियन को परिमार्जित करते हैं तो मेरा मानना ​​है कि ओपी का फॉर्मूला सही है।
gui11aume

1
आह्ह..वह है कि अगर हम गुणा करते हैं तो हम अगर हम द्वारा हम प्राप्त करते हैं जो ओपी ( रद्द) द्वारा दिखाया गया था : अर्थात् । लेकिन हम जानते हैं कि VAR (aX) = a ^ 2Var (X) जहां इस मामले में a = और Var (X) 1 है, इसलिए वितरण । X¯E(X¯)Var(X¯)=nX¯μσd N(0,1)X¯E(X¯)Var(X¯)σσn((1ni=1nXi)μ)σ2N(0,σ2)
B_Miner

गुई, अगर बहुत देर नहीं हुई तो मैं यह सुनिश्चित करना चाहता था कि मेरे पास यह सही है। यदि हम मान लेते हैं और हम एक स्थिरांक ( ) से गुणा करते हैं , इस मात्रा का अपेक्षित मान (यानी ), जो शून्य था अभी भी E [aX] = a * E [X] => * 0 = 0 के रूप में शून्य है। क्या ये सही है? X¯E(X¯)Var(X¯)=n(X¯μ)d N(0,1)σn(X¯μ)σ
B_Miner 20

8

इस बात का एक अच्छा सिद्धांत है कि किस प्रकार के वितरण यादृच्छिक चर के योगों के वितरण को सीमित कर सकते हैं। अच्छा संसाधन पेट्रोव की निम्नलिखित पुस्तक है, जिसे मैंने व्यक्तिगत रूप से बेहद पसंद किया है।

यह पता चला है, कि यदि आप इस प्रकार की सीमाओं की जाँच कर रहे हैं जहाँ स्वतंत्र यादृच्छिक चर हैं, सीमा के वितरण हैं केवल कुछ वितरण।

1ani=1nXnbn,(1)
Xi

तब बहुत सारी गणित चल रही होती है, जो कई प्रमेयों को उबालती है जो पूरी तरह से चरित्रवान होती है कि सीमा में क्या होता है। ऐसे प्रमेयों में से एक फेलर के कारण है:

प्रमेय Let स्वतंत्र यादृच्छिक चर का एक अनुक्रम हो, के वितरण समारोह हो , और सकारात्मक निरंतर का एक अनुक्रम हो। उस आदेश के क्रम में{Xn;n=1,2,...}Vn(x)Xnan

max1knP(|Xk|εan)0, for every fixed ε>0

तथा

supx|P(an1k=1nXk<x)Φ(x)|0

यह आवश्यक है और पर्याप्त है

k=1n|x|εandVk(x)0 for every fixed ε>0,

an2k=1n(|x|<anx2dVk(x)(|x|<anxdVk(x))2)1

तथा

an1k=1n|x|<anxdVk(x)0.

यह प्रमेय आपको एक विचार देता है कि को कैसा दिखना चाहिए।an

पुस्तक में सामान्य सिद्धांत का निर्माण इस तरह से किया गया है कि मानदंड निरंतर किसी भी तरह से प्रतिबंधित है, लेकिन अंतिम प्रमेय जो आवश्यक और पर्याप्त शर्तें देते हैं, अलावा अन्य निरंतर मानदंड के लिए कोई जगह नहीं छोड़ते हैं ।n


4

s नमूना माध्य के लिए नमूना मानक विचलन का प्रतिनिधित्व करता है। s नमूना माध्य के लिए नमूना विचरण है और यह S / n के बराबर है । जहां S जनसंख्या विचरण का नमूना अनुमान है। चूँकि s = S / √n यह बताता है कि पहले सूत्र में Sn कैसे प्रकट होता है। ध्यान दें कि यदि सीमा होती तो हर में एक σ होताnn2n2n2nn

एन (0,1) लेकिन सीमा एन (0, ) के रूप में दी गई है । चूँकि S of का एक सुसंगत अनुमान है, इसका उपयोग secnd समीकरण में a सीमा से बाहर ले जाने के लिए किया जाता है।2n


प्रश्न के अन्य (अधिक बुनियादी और महत्वपूर्ण) हिस्से के बारे में क्या: क्यों और फैलाव के कुछ अन्य उपाय नहीं? sn
whuber

@whuber चर्चा के लिए हो सकता है लेकिन यह सवाल का हिस्सा नहीं था। ओपी केवल यह जानना चाहता था कि CLT के सूत्र में _ और क्यों दिखाई देते हैं। बेशक S वहाँ है क्योंकि यह consistent के लिए संगत है और CLT the के उस रूप में हटा दिया जाता है। nn
माइकल आर। चेरिक

1
मेरे लिए यह बिल्कुल स्पष्ट नहीं है कि मौजूद है क्योंकि यह " लिए सुसंगत " है। ऐसा क्यों नहीं होगा कि, यह भी कहा जाए, कि का उपयोग चरम-मूल्य आँकड़ों को सामान्य करने के लिए किया जाना चाहिए (जो काम नहीं करेगा)? क्या मुझे कुछ सरल और स्व-स्पष्ट याद आ रही है? और, ओपी को प्रतिध्वनित करने के लिए, उपयोग क्यों न करें - आखिरकार, यह लिए संगत है ! snσsnsnσ
whuber

जैसा कि कहा गया है, प्रमेय ने N (0,1) में अभिसरण किया है, इसलिए यह पूरा करने के लिए कि आपको या तो σ जानना है और इसका उपयोग करना है या इसके एक सुसंगत अनुमान का उपयोग करना है जो स्लटस्की के प्रमेय के अनुसार काम करता है। क्या मैं अस्पष्ट था?
माइकल आर। चेरिक

मुझे नहीं लगता कि आप अस्पष्ट थे; मुझे लगता है कि एक महत्वपूर्ण बिंदु गायब हो सकता है। आखिरकार, कई वितरणों के लिए हम बजाय IQR का उपयोग करके एक सीमित सामान्य वितरण प्राप्त कर सकते हैं, फिर परिणाम उतना साफ नहीं है (सीमित वितरण का एसडी उस वितरण पर निर्भर करता है जो हम शुरू करते हैं)। मैं सिर्फ यह सुझाव दे रहा हूं कि इसे योग्य कहा जाए और समझाया जाए। यह उन लोगों के लिए बिल्कुल स्पष्ट नहीं होगा जिनके पास उन सभी वितरणों को मानकीकृत करने के 40 वर्षों तक विकसित अंतर्ज्ञान नहीं है जो वे मुठभेड़ करते हैं! sn
whuber

2

Intuitively, अगर के लिए कुछ हम उम्मीद करनी चाहिए कि के बराबर मोटे तौर पर है ; यह एक बहुत ही उचित उम्मीद की तरह लगता है, हालांकि मुझे नहीं लगता कि यह सामान्य रूप से आवश्यक है। के लिए कारण पहली अभिव्यक्ति में इस बात का विचरण है को जाता है की तरह और इतने विचरण बढ़ा-चढ़ाकर जाता है ताकि अभिव्यक्ति सिर्फ विचरण है के बराबर । दूसरी अभिव्यक्ति में, शब्द को रूप में परिभाषित किया गया हैZnN(0,σ2)σ2Var(Zn)σ2nX¯nμ01nnσ2sni=1nVar(Xi)जबकि अंश का विचरण तरह बढ़ता है , इसलिए हमारे पास फिर से यह है कि संपूर्ण अभिव्यक्ति का विचरण एक स्थिर ( इस मामले में ) है।i=1nVar(Xi)1

अनिवार्य रूप से, हम जानते हैं कि कुछ "दिलचस्प" के वितरण के साथ हो रहा है , लेकिन अगर हम ठीक से केंद्र नहीं करते हैं और पैमाने पर हम इसे नहीं देख पाएंगे। मैंने सुना है यह कभी-कभी माइक्रोस्कोप को समायोजित करने की आवश्यकता के रूप में वर्णित है। यदि हम उड़ाते नहीं हैं (उदाहरण के लिए) by तो हमारे पास कमजोर कानून द्वारा वितरण में है; यह अपने आप में एक दिलचस्प परिणाम है, लेकिन CLT के रूप में जानकारीपूर्ण नहीं है। अगर हम किसी भी कारक जो कि पर हावी है , तो भी हमें जबकि कोई भी कारक जो पर हावी हैX¯n:=1niXiX¯μnX¯nμ0annan(X¯nμ)0annदेता है । यह पता चलता है कि इस मामले में क्या चल रहा है, यह देखने के लिए सक्षम होने के लिए सिर्फ सही आवर्धन है (नोट: यहां सभी अभिसरण वितरण में है; आवर्धन का एक और स्तर है जो लगभग निश्चित अभिसरण के लिए दिलचस्प है, जो वृद्धि देता है iterated लघुगणक के कानून के लिए)।an(X¯nμ)n


4
एक अधिक मौलिक प्रश्न, जिसे पहले संबोधित किया जाना चाहिए, इसलिए एसडी का उपयोग फैलाव को मापने के लिए किया जाता है। क्यों नहीं पूर्ण केंद्रीय के कुछ अन्य मूल्य के लिए पल ? या आईक्यूआर या इसके किसी रिश्तेदार को क्यों नहीं? एक बार जब कि जवाब है, तो सहप्रसरण की साधारण गुण तुरंत देना निर्भरता (के रूप में @ Gui11aume हाल ही में विस्तार से बताया गया है।)kthkn
whuber

1
@ जब भी मैं सहमत हूं, यही कारण है कि मैंने इसे हेयुरिस्टिक के रूप में प्रस्तुत किया है। मुझे यकीन नहीं है कि यह एक सरल विवरण के लिए उत्तरदायी है, हालांकि मैं एक सुनना पसंद करूंगा। मेरे लिए मुझे यकीन नहीं है कि मेरे पास एक सरल, व्याख्यात्मक कारण है "क्योंकि वर्ग शब्द विशेषता फ़ंक्शन के टेलर विस्तार में प्रासंगिक शब्द है जब आप इसका मतलब निकाल लेते हैं।"
लड़का
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.