केंद्रीय सीमा प्रमेय के लिए कौन सी सहज व्याख्या है?


144

कई अलग-अलग संदर्भों में हम केंद्रीय सीमा प्रमेय का आह्वान करते हैं कि हम जो भी सांख्यिकीय पद्धति अपनाना चाहते हैं, उसे सही ठहराने के लिए (जैसे, सामान्य वितरण द्वारा द्विपद वितरण को अनुमानित करें)। मैं तकनीकी विवरणों को समझता हूं कि प्रमेय क्यों सच है लेकिन यह अभी मेरे साथ हुआ है कि मैं वास्तव में केंद्रीय सीमा प्रमेय के पीछे अंतर्ज्ञान को नहीं समझता हूं।

तो, केंद्रीय सीमा प्रमेय के पीछे अंतर्ज्ञान क्या है?

लेमैन स्पष्टीकरण आदर्श होगा। अगर कुछ तकनीकी विस्तार की आवश्यकता है, तो कृपया मान लें कि मैं एक pdf, cdf, यादृच्छिक चर आदि की अवधारणाओं को समझता हूं, लेकिन अभिसरण अवधारणाओं, विशेषता कार्यों या माप सिद्धांत के साथ कुछ भी करने का कोई ज्ञान नहीं है।


8
अच्छा सवाल है, हालांकि मेरी तत्काल प्रतिक्रिया, यह सिखाने के मेरे सीमित अनुभव द्वारा समर्थित है, यह है कि CLT शुरू में ज्यादातर लोगों के लिए सहज नहीं है। यदि कुछ भी हो, यह प्रति-सहज है!
onstop

2
@onestop AMEN! p = 1/2 के साथ द्विपद वितरण को घूरते हुए n बढ़ता है जैसा कि दिखाती है CLT गुप्त है - लेकिन इसके लिए अंतर्ज्ञान हमेशा मुझे बच गया है।
रोनफ

2
कुछ अच्छे विचारों के साथ इसी तरह का प्रश्न: सांख्यिकी.स्टैकएक्सचेंज.com

1
स्पष्टीकरण नहीं लेकिन यह अनुकरण इसे समझने में मददगार हो सकता है।
डेविड लेन

जवाबों:


119

मैं इस पोस्ट की लंबाई के लिए अग्रिम रूप से माफी माँगता हूँ: यह कुछ झिझक के साथ है जिसे मैंने इसे सार्वजनिक रूप से पूरा करने दिया, क्योंकि इसे पढ़ने में कुछ समय लगता है और निस्संदेह इसमें टाइपोग्राफिक त्रुटियां और एक्सपोज़ररी लैजेस हैं। लेकिन यहां यह उन लोगों के लिए है जो आकर्षक विषय में रुचि रखते हैं, इस उम्मीद में कि यह आपको स्वयं के जवाबों में आगे विस्तार के लिए CLT के कई हिस्सों में से एक या अधिक को पहचानने के लिए प्रोत्साहित करेगा।


सीएलटी को "समझाने" पर अधिकांश प्रयास चित्र या बस प्रतिबंध हैं जो यह कहते हैं कि यह सच है। वास्तव में मर्मज्ञ, सही स्पष्टीकरण के लिए बहुत सारी चीजों की व्याख्या करनी होगी।

इसे आगे देखने से पहले, आइए स्पष्ट करें कि सीएलटी क्या कहता है। जैसा कि आप सभी जानते हैं, ऐसे संस्करण हैं जो अपनी व्यापकता में भिन्न होते हैं। सामान्य संदर्भ यादृच्छिक चर का एक क्रम है, जो एक सामान्य संभाव्यता स्थान पर कुछ प्रकार के कार्य हैं। सहज ज्ञान युक्त स्पष्टीकरण के लिए, जो कठोर है, मुझे यह संभव लगता है कि एक अलग जगह के साथ एक संभाव्य स्थान के बारे में सोचना उपयोगी है। इससे कोई फर्क नहीं पड़ता कि वे वस्तुएं क्या हैं लेकिन मैं उन्हें "टिकट" कहूंगा। हम टिकटों को अच्छी तरह से मिलाकर और एक को खींचकर एक बॉक्स का एक "अवलोकन" करते हैं; वह टिकट अवलोकन का गठन करता है। बाद के विश्लेषण के लिए इसे रिकॉर्ड करने के बाद हम टिकट को बॉक्स में वापस कर देते हैं ताकि इसकी सामग्री अपरिवर्तित रहे। एक "यादृच्छिक चर" मूल रूप से प्रत्येक टिकट पर लिखा गया एक नंबर है।

1733 में, अब्राहम डी मोइवर ने एक एकल बॉक्स के मामले पर विचार किया जहां टिकटों पर संख्याएं केवल शून्य और अन्य ("बर्नौली परीक्षण") हैं, जिनमें से प्रत्येक संख्या में मौजूद हैं। वह बनाने की कल्पना की शारीरिक रूप से स्वतंत्र मूल्यों का एक अनुक्रम उपज टिप्पणियों, एक्स 1 , एक्स 2 , ... , एक्स एन , जो सभी के शून्य या एक कर रहे हैं। उन मानों का योग , y n = x 1 + x 2 + + x nnx1,x2,,xnyn=x1+x2++xn, यादृच्छिक है क्योंकि योग में शब्द हैं। इसलिए, यदि हम इस प्रक्रिया को कई बार दोहरा सकते हैं, तो विभिन्न रकम ( एन के माध्यम से से लेकर पूरे नंबर ) विभिन्न आवृत्तियों - कुल के अनुपात के साथ दिखाई देंगी। (नीचे हिस्टोग्राम देखें।)0n

अब कोई उम्मीद करेगा - और यह सच है - कि बहुत बड़े मूल्यों के लिए , सभी आवृत्तियां काफी छोटी होंगी। अगर हम इतनी बोल्ड (या मूर्ख) के रूप में "दो" एक सीमा ले "करने के लिए प्रयास करने के लिए या होना करने के लिए थे n करने के लिए जाना ", हम सही ढंग से निष्कर्ष निकालना होगा कि सभी आवृत्तियों को कम 0 । लेकिन अगर हम केवल आवृत्तियों का हिस्टोग्राम खींचते हैं , तो इस बात पर ध्यान दिए बिना कि इसकी कुल्हाड़ियों को कैसे लेबल किया जाता है, तो हम देखते हैं कि बड़े एन सभी के लिए हिस्टोग्राम समान दिखना शुरू होते हैं: कुछ अर्थों में, इन हिस्टोग्राम एक सीमा तक पहुंचते हैं , हालांकि फ्रीक्वेंसी खुद सभी शून्य पर जाते हैं।nn0n

हिस्टोग्राम

ये हिस्टोग्राम कई बार प्राप्त करने की प्रक्रिया को दोहराते हैं । n शीर्षकों में "परीक्षणों की संख्या" है।ynn

यहाँ अंतर्दृष्टि पहले हिस्टोग्राम खींचने और बाद में अपनी कुल्हाड़ियों को लेबल करने के लिए है । बड़े हिस्टोग्राम के साथ n / 2 (क्षैतिज अक्ष पर) के आसपास केंद्रित मानों की एक बड़ी श्रृंखला शामिल होती है और मानों का एक छोटा अंतराल (ऊर्ध्वाधर अक्ष पर) होता है, क्योंकि व्यक्तिगत आवृत्तियां काफी छोटी हो जाती हैं। इस वक्र को साजिश रचने वाले क्षेत्र में रखने से हिस्टोग्राम के स्थानांतरण और पुनर्वसन दोनों की आवश्यकता होती है । इसका गणितीय विवरण यह है कि प्रत्येक n के लिए हम हिस्टोग्राम और कुछ स्केल वैल्यू s n की स्थिति के लिए कुछ केंद्रीय मान m n (जरूरी नहीं कि अद्वितीय हो!) चुन सकते हैं।nn/2nmnsn(जरूरी नहीं कि अद्वितीय हो!) इसे कुल्हाड़ियों के भीतर फिट करने के लिए। इसे से z n = ( y n - m n ) / s n में बदलकर गणितीय रूप से किया जा सकता है ।ynzn=(ynmn)/sn

याद रखें कि हिस्टोग्राम इसके और क्षैतिज अक्ष के बीच के क्षेत्रों द्वारा आवृत्तियों का प्रतिनिधित्व करता है। इसलिए एन के बड़े मूल्यों के लिए इन हिस्टोग्राम की स्थिरता को क्षेत्र के संदर्भ में कहा जाना चाहिए। n इसलिए, आपके द्वारा पसंद किए गए मानों में से किसी भी अंतराल को चुनें, से b > a , के रूप में n बढ़ता है, z n के हिस्टोग्राम के हिस्से के क्षेत्र को ट्रैक करें जो कि अंतराल ( a , b ] को फैलाता है । CLT कई को सम्मिलित करता है। बातें:ab>anzn(a,b]

  1. कोई फर्क नहीं पड़ता और कर रहे हैं,ab अगर हम चुनें दृश्यों और रों n उचित रूप से (एक तरीका है कि पर निर्भर नहीं करता में एक या बी , इस क्षेत्र वास्तव में एक सीमा के करीब पहुंचती के रूप में सभी) n बड़े हो जाता है।mnsnabn

  2. सीक्वेंस और s n को इस तरह से चुना जा सकता है जो केवल n पर निर्भर करता है , बॉक्स में मानों का औसत और उन मूल्यों के प्रसार का कुछ माप है - लेकिन कुछ और नहीं - ताकि जो कुछ भी हो उसमें बॉक्स, सीमा हमेशा समान होती है। (यह सार्वभौमिकता अद्भुत है।)mnsnn

  3. विशेष रूप से, सीमित क्षेत्र वक्र के तहत क्षेत्र है कि के बीचएकऔर: इस है कि सार्वभौमिक सीमित हिस्टोग्राम के सूत्र है।y=exp(z2/2)/2πab

    सीएलटी का पहला सामान्यीकरण जोड़ता है,

  4. जब बॉक्स में शून्य और लोगों के अलावा संख्याएं हो सकती हैं, तो ठीक उसी तरह निष्कर्ष निकलते हैं (बशर्ते कि बॉक्स में बहुत बड़ी या छोटी संख्याओं के अनुपात "बहुत महान नहीं हैं", एक मानदंड जो सटीक और सरल मात्रात्मक बयान है) ।

    अगले सामान्यीकरण, और शायद सबसे आश्चर्यजनक एक, टिकटों के इस एकल बॉक्स को टिकटों के साथ अनिश्चित काल के लंबे सरणी के साथ बदल देता है। प्रत्येक बॉक्स में अलग-अलग अनुपात में इसके टिकट पर अलग-अलग नंबर हो सकते हैं। अवलोकन पहले बॉक्स से टिकट खींचकर बनाया गया है, एक्स 2 दूसरे बॉक्स से आता है, और इसी तरह।x1x2

  5. वास्तव में एक ही निष्कर्ष रखता है बक्सों की सामग्री "बहुत अलग नहीं है" (वहाँ कई सटीक, लेकिन अलग-अलग, मात्रात्मक लक्षण हैं जो "बहुत अलग नहीं है" का अर्थ है; वे अक्षांश की एक आश्चर्यजनक राशि की अनुमति देते हैं)।

कम से कम, इन पाँच सिद्धांतों की व्याख्या करने की आवश्यकता है। अभी और है। सेटअप के कई पेचीदा पहलू सभी कथनों में निहित हैं। उदाहरण के लिए,

  • राशि के बारे में क्या खास है ? हमारे पास संख्या के अन्य गणितीय संयोजनों जैसे कि उनके उत्पाद या उनकी अधिकतम के लिए केंद्रीय सीमा प्रमेय क्यों नहीं है? (यह पता चलता है कि हम करते हैं, लेकिन वे बहुत सामान्य नहीं हैं और न ही उनके पास हमेशा ऐसा साफ, सरल निष्कर्ष होता है जब तक कि उन्हें CLT में कम नहीं किया जा सकता है।) और s n के अनुक्रम अद्वितीय नहीं हैं, लेकिन वे लगभग भावना अंततः वे की राशि की उम्मीद के अनुमान लगाने के लिए है में अद्वितीय n टिकट और मानक विचलन क्रमशः (जो, CLT के पहले दो बयानों में, के बराबर होती है योग, की mnsnn ) बॉक्स का मानक विचलन)। n

    मानक विचलन मूल्यों के प्रसार का एक माप है, लेकिन यह किसी भी तरह से केवल एक ही नहीं है और न ही यह ऐतिहासिक या कई अनुप्रयोगों के लिए सबसे "प्राकृतिक" है। ( उदाहरण के लिए, बहुत से लोग माध्य से एक औसत निरपेक्ष विचलन जैसा कुछ चुनते हैं ।)

  • एसडी इतने आवश्यक तरीके से क्यों दिखाई देता है?

  • लिस्टिंग हिस्टोग्राम के फॉर्मूले पर विचार करें: जिसने इस तरह के फॉर्म को लेने की उम्मीद की होगी? यह संभावना घनत्व का लघुगणक एक द्विघात कार्य है। क्यों? क्या इसके लिए कुछ सहज या स्पष्ट, सम्मोहक स्पष्टीकरण है?


मैं स्वीकार करता हूं कि मैं उन उत्तरों की आपूर्ति के अंतिम लक्ष्य तक पहुंचने में असमर्थ हूं जो सहज और सरलता के लिए श्रीकांत के चुनौतीपूर्ण मानदंडों को पूरा करने के लिए पर्याप्त सरल हैं, लेकिन मैंने इस पृष्ठभूमि को इस उम्मीद में स्केच किया है कि दूसरों को कई अंतरालों में भरने के लिए प्रेरित किया जा सकता है। मुझे लगता है कि एक अच्छा प्रदर्शन अंततः कैसे के बीच मूल्यों की एक प्राथमिक विश्लेषण पर भरोसा करना होगा और β n = रों n + मीटर n योग बनाने में पैदा कर सकते एक्स 1 + x 2 + ... + x nαn=asn+mnβn=bsn+mnx1+x2++xn। CLT के सिंगल-बॉक्स संस्करण पर वापस जाना, एक सममित वितरण का मामला संभालना आसान है: इसका माध्य इसके माध्य के बराबर है, इसलिए 50% संभावना है कि बॉक्स के माध्य से कम होगा और 50% मौका वह x i उसके माध्य से अधिक होगा। इसके अलावा, जब n पर्याप्त रूप से बड़ा होता है, तो माध्य से सकारात्मक विचलन, माध्य में नकारात्मक विचलन के लिए क्षतिपूर्ति करना चाहिए। (इसके लिए कुछ सावधान औचित्य की आवश्यकता होती है, न कि केवल हाथ लहराते हुए।) इस प्रकार हमें मुख्य रूप से सकारात्मक और नकारात्मक विचलन की संख्या की गिनती के बारे में चिंतित होना चाहिए और केवल उनके आकारों के बारे में एक माध्यमिक चिंता है xixin (मेरे द्वारा यहां लिखी गई सभी चीजों में, यह CLT के काम करने के बारे में कुछ अंतर्ज्ञान प्रदान करने में सबसे उपयोगी हो सकता है। वास्तव में, सीएलटी के सामान्यीकरणों को अनिवार्य रूप से सच करने के लिए आवश्यक तकनीकी धारणाएं संभावना के विभिन्न तरीकों से अलग होती हैं। दुर्लभ विशाल विचलन पर्याप्त हिस्टोग्राम को उत्पन्न होने से रोकने के लिए संतुलन को परेशान करेंगे। "

यह कुछ हद तक दिखाता है, सीएलटी का पहला सामान्यीकरण वास्तव में ऐसी किसी भी चीज़ को उजागर नहीं करता है जो डी मोइवर के मूल बर्नौली परीक्षण संस्करण में नहीं थी।

इस बिंदु पर ऐसा लगता है कि इसके लिए कुछ भी नहीं है, लेकिन थोड़ा गणित करना है: हमें अलग-अलग तरीकों की संख्या की गणना करने की आवश्यकता है जिसमें औसत से सकारात्मक विचलन की संख्या किसी भी पूर्व निर्धारित मूल्य द्वारा नकारात्मक विचलन की संख्या से भिन्न हो सकती है , जहां जाहिर कश्मीर में से एक है - n , - एन + 2 , ... , n - 2 , एन । लेकिन क्योंकि ग़लती से छोटी त्रुटियां सीमा में गायब हो जाएंगी, हमें ठीक से गिनने की ज़रूरत नहीं है; हमें केवल गणना की आवश्यकता है। यह अंत करने के लिए यह जानने के लिए पर्याप्त हैkkn,n+2,,n2,n

The number of ways to obtain k positive and nk negative values out of n

equals nk+1k

times the number of ways to get k1 positive and nk+1 negative values.

(यह एक पूरी तरह से प्राथमिक परिणाम है इसलिए मैं औचित्य लिखने के लिए परेशान नहीं करूंगा।) अब हम लगभग थोक हैं। अधिकतम आवृत्ति तब होती है जब संभव के रूप में n / 2 के करीब होता है (प्राथमिक भी)। आइए m = n / 2 लिखें । फिर, अधिकतम आवृत्ति के सापेक्ष, की आवृत्ति मीटर + j + 1 सकारात्मक विचलन ( जे 0 ) उत्पाद का अनुमान हैkn/2m=n/2m+j+1j0

m+1m+1mm+2mj+1m+j+1

=11/(m+1)1+1/(m+1)12/(m+1)1+2/(m+1)1j/(m+1)1+j/(m+1).

डे मोइवर लिखने से 135 साल पहले, जॉन नेपियर ने गुणन को सरल बनाने के लिए लॉगरिथम का आविष्कार किया था, तो चलिए इसका लाभ उठाते हैं। सन्निकटन का उपयोग करना

log(1x1+x)2x,

हम पाते हैं कि सापेक्ष आवृत्ति का लॉग लगभग है

2/(m+1)4/(m+1)2j/(m+1)=j(j+1)m+1j2m.

चूँकि संचयी त्रुटि समानुपाती है , इसलिए यह अच्छी तरह से काम करना चाहिए बशर्ते j 4 m 3 के सापेक्ष छोटा हो । जे के मूल्यों की तुलना में अधिक से अधिक रेंज शामिल है। (यह केवल of के आदेश पर जम्मू के लिए काम करने के लिए निहित हैj4/m3j4m3jj जो asymptotically तुलना में काफी छोटा हैमीटर 3 / 4 ।)mm3/4


जाहिर है इस तरह के बहुत अधिक विश्लेषण सीएलटी में अन्य कथनों को सही ठहराने के लिए प्रस्तुत किए जाने चाहिए, लेकिन मैं समय, स्थान और ऊर्जा से बाहर चल रहा हूं और मैंने शायद 90% लोगों को खो दिया है जिन्होंने इसे वैसे भी पढ़ना शुरू कर दिया है। यह सरल सन्निकटन है, हालांकि, पता चलता है कि कैसे डी Moivre मूल रूप से संदिग्ध हो सकता है एक सार्वभौमिक सीमित वितरण होता है, कि अपनी लघुगणक द्विघात क्रिया है, और उचित पैमाने पहलू यह है कि के लिए आनुपातिक होना चाहिए sn (क्योंकिजे2/मी=2जे2/n=2(जे/n)। j2/m=2j2/n=2(j/n)2 यह कल्पना करना मुश्किल है कि किसी तरह की गणितीय जानकारी और तर्क के बिना इस महत्वपूर्ण मात्रात्मक संबंध को कैसे समझाया जा सकता है; कुछ भी कम एक पूर्ण रहस्य को सीमित वक्र के सटीक आकार को छोड़ देगा।


5
+1 आपके जवाब को पचाने में मुझे कुछ समय लगेगा। मैं स्वीकार करता हूं कि मैंने जो अड़चनें डालीं, उनमें सीएलटी के लिए एक अंतर्ज्ञान की मांग करना लगभग असंभव हो सकता है।

2
यह लिखने के लिए समय निकालने के लिए धन्यवाद, मैंने देखा है कि CLT का यह सबसे उपयोगी प्रदर्शन है जो गणितीय रूप से भी बहुत सुलभ है।
जेरेमी रेडक्लिफ

1
हां, काफी सघन .... इतने सारे सवाल। पहले हिस्टोग्राम में 2 बार कैसे होते हैं (केवल 1 परीक्षण था!); क्या मैं इसे अनदेखा कर सकता हूँ? और सम्मेलन आमतौर पर हिस्टोग्राम की सलाखों के बीच क्षैतिज अंतराल से बचने के लिए है, है ना? (क्योंकि, जैसा कि आप कहते हैं, क्षेत्र महत्वपूर्ण है, और क्षेत्र को अंततः एक निरंतर (यानी कोई अंतराल) डोमेन पर गणना की जाएगी? तो मैं अंतराल को भी अनदेखा करूँगा ...? यहां तक ​​कि मुझे अंतराल था जब मैंने पहली बार इसे समझने की कोशिश की थी :)
लाल मटर

1
@ आपके सवालों के लिए धन्यवाद। मैंने इन बिंदुओं को थोड़ा स्पष्ट करने के लिए इस पोस्ट के पहले भाग को संपादित किया है।
whuber

4
आह, हाँ, मैंने "परीक्षणों की संख्या = =" टिप्पणियों "को" कई बार दोहराया है (यह पूरी प्रक्रिया) दोहराई गई है। " इसलिए यदि एक टिकट में केवल दो मानों का मान हो सकता है, 0 या 1 , और आप केवल एक टिकट का निरीक्षण करते हैं , तो उन टिकटों के मूल्यों का योग केवल दो चीजों में से एक हो सकता है : 0, या 1 । इसलिए आपके पहले हिस्टोग्राम में दो बार होते हैं। इसके अलावा, इन पट्टियों की ऊंचाई लगभग बराबर होती है क्योंकि हम 0 और 1 के बराबर अनुपात में होने की उम्मीद करते हैं। n
लाल मटर

27

सबसे अच्छा एनीमेशन मुझे पता है: http://www.ms.uky.edu/~mai/java/stat/Galton.achin.html

समान रूप से दूरी वाले पिंस की 8 क्षैतिज परतें, प्रत्येक परत कंपित हुई, इन पिंस के माध्यम से गिराए गए गेंदों के लिए "पचिनको / पिनबॉल" शैली में बाधा उत्पन्न होती है।  प्रत्येक गेंद नीचे की ओर गिरती है, और गेंदों के ढेर के रूप में, उनकी ऊँचाई गाऊसी वक्र की एक रूपरेखा के निकट आती है।  इससे पता चलता है कि कई स्वतंत्र यादृच्छिक घटनाओं (परतों) का योग, परिणाम के गॉसियन वितरण (खड़ी गेंद की ऊंचाई) में परिणाम देगा।

मैंने जो सबसे सरल शब्द पढ़ा है: http://elonen.iki.fi/articles/centrallimit/index.en.html

यदि आप इन दस थ्रो के परिणामों को जोड़ते हैं, तो आपको जो मिलता है, वह अधिकतम 60, (सभी छक्के) या दूसरी तरफ, मीनुम, 10 (सभी वाले) की तुलना में 30-40 के करीब होने की संभावना है।

इसका कारण यह है कि आप चरम की तुलना में कई अलग-अलग तरीकों से मध्य मूल्यों को प्राप्त कर सकते हैं। उदाहरण: दो पासा फेंकते समय: 1 + 6 = 2 + 5 = 3 + 4 = 7, लेकिन केवल 1 + 1 = 2 और केवल 6 + 6 = 12।

यह है: भले ही आप छह में से कोई भी समान रूप से संभावना प्राप्त करते हैं जब एक मरने को फेंक देते हैं, तो चरम कई पासा के योगों में मध्य मूल्यों की तुलना में कम संभावित होते हैं।


20

अंतर्ज्ञान एक पेचीदा चीज है। यह हमारे हाथों में थ्योरी के साथ है जो हमारी पीठ के पीछे बंधा हुआ है।

CLT छोटे, स्वतंत्र गड़बड़ी के बारे में है। नमूना के अर्थ में "सम्स" का अर्थ है, परिमित विचरण (जनसंख्या का) के अर्थ में "छोटा", और एक केंद्रीय (जनसंख्या) मान के आसपास प्लस / माइनस के अर्थ में "गड़बड़ी"।

मेरे लिए, डिवाइस जो सीधे-सीधे अंतर्ज्ञान की अपील करता है, वह क्विनक्स, या 'गेल्टन बॉक्स' है, विकिपीडिया ('बीन मशीन' के लिए देखें)? यह विचार एक छोटी सी गेंद को एक जाली से सजे बोर्ड के चेहरे को रोल करने के लिए है? समान रूप से दूरी वाले पिन। गेंद के दाएं और बाएं डायवर्ट (... बेतरतीब ढंग से, स्वतंत्र रूप से) और नीचे की तरफ इकट्ठा होने के रास्ते में। समय के साथ, हम अपनी आंखों के ठीक सामने एक अच्छा घंटी के आकार का टीला देखते हैं।

CLT एक ही बात कहता है। यह इस घटना का गणितीय विवरण है (अधिक सटीक रूप से, क्विनक्सक्स द्विपद वितरण के लिए सामान्य सन्निकटन के लिए भौतिक साक्ष्य है)। धीरे-धीरे बोलना, सीएलटी का कहना है कि जब तक हमारी आबादी से अधिक दुर्व्यवहार नहीं किया जाता है (अर्थात, अगर पीडीएफ की पूंछ पर्याप्त रूप से पतली होती है), तो नमूना माध्य (ठीक से छोटा) व्यवहार करता है जैसे कि छोटी सी गेंद का चेहरा नीचे की ओर उछलता है quincunx: कभी-कभी यह बाईं ओर गिर जाता है, कभी-कभी यह दाईं ओर गिर जाता है, लेकिन अधिकांश समय यह बीच में दाईं ओर, एक अच्छी घंटी के आकार में होता है।

सीएलटी (मेरे लिए) की महिमा यह है कि अंतर्निहित आबादी का आकार अप्रासंगिक है। आकार केवल एक भूमिका निभाता है जैसे कि यह उस समय की लंबाई को दर्शाता है जिसे हमें प्रतीक्षा करने की आवश्यकता है (नमूना आकार के अर्थ में)।


17

CLT से संबंधित एक अवलोकन निम्नलिखित हो सकता है। जब आपके पास बहुत सारे यादृच्छिक घटकों का योग है, यदि कोई "सामान्य से छोटा" है, तो यह अधिकतर अन्य घटकों द्वारा "सामान्य से बड़ा" होने पर मुआवजा दिया जाता है। । दूसरे शब्दों में, घटक से नकारात्मक विचलन और सकारात्मक विचलन का अर्थ है एक दूसरे को समन में रद्द करना। व्यक्तिगत रूप से, मेरे पास कोई स्पष्ट अंतर्ज्ञान नहीं है कि क्यों वास्तव में शेष विचलन एक वितरण का निर्माण करते हैं जो आपके पास अधिक से अधिक सामान्य शब्द हैं।

S=X1+X2++Xn

सीएलटी के कई संस्करण हैं, कुछ दूसरों की तुलना में मजबूत हैं, कुछ आराम की शर्तों जैसे शर्तों के बीच एक मध्यम निर्भरता और / या गैर-समान वितरण। सबसे सरल करने वाली साबित CLT के संस्करणों में, सबूत आमतौर पर पल पैदा समारोह पर आधारित है (या लाप्लास-Stieltjes को बदलने या कुछ अन्य उचित घनत्व का बदलना) राशि के । इसे टेलर विस्तार के रूप में लिखना और केवल सबसे प्रमुख शब्द रखने से आपको सामान्य वितरण का पल-पल का कार्य मिलता है। इसलिए मेरे लिए व्यक्तिगत रूप से, सामान्यता एक ऐसी चीज है जो समीकरणों के एक समूह से आती है और मैं इससे आगे कोई अंतर्ज्ञान प्रदान नहीं कर सकता।S

ऐसा लगता है लेकिन उस राशि का वितरण, कभी नहीं वास्तव में है सामान्य रूप से वितरित, और न ही CLT का दावा है कि यह होगा नहीं करता है। यदि परिमित है, तो सामान्य वितरण के लिए कुछ दूरी बाकी है और यदि n = mean माध्य और विचरण दोनों ही अनंत हैं। उत्तरार्द्ध मामले में आप अनंत राशि का मतलब ले सकते हैं, लेकिन फिर आपको बिना किसी भिन्नता के एक निश्चित संख्या मिलती है, जिसे शायद ही "सामान्य रूप से वितरित" के रूप में लेबल किया जा सकता है।nn=

यह सीएलटी के व्यावहारिक अनुप्रयोगों के साथ समस्याएं पैदा कर सकता है। आमतौर पर, यदि आप इसके केंद्र के करीब के वितरण में रुचि रखते हैं, तो CLT ठीक काम करता है। हालांकि, सामान्य के लिए अभिसरण हर जगह समान नहीं है और आगे आप केंद्र से दूर हो जाते हैं, और अधिक शर्तें आपको एक उचित अनुमान लगाने की आवश्यकता होती हैं।S/n

आंकड़ों में केंद्रीय सीमा प्रमेय की सभी "पवित्रता" के साथ, इसकी सीमाओं को अक्सर सभी आसानी से अनदेखा कर दिया जाता है। नीचे मैं अपने पाठ्यक्रम से दो स्लाइड देता हूं जिससे सीएलटी पूरी तरह से पूंछ में विफल हो जाता है, किसी भी व्यावहारिक उपयोग के मामले में। दुर्भाग्य से, बहुत से लोग विशेष रूप से पूंछ संभावनाओं का अनुमान लगाने के लिए CLT का उपयोग करते हैं, जानबूझकर या अन्यथा।

यहां छवि विवरण दर्ज करें यहां छवि विवरण दर्ज करें


5
यह महान सामग्री और बुद्धिमान सलाह है। मैं इसे दुर्भाग्य से नहीं बढ़ा सकता, क्योंकि "यह सामान्यता एक गणितीय विरूपण साक्ष्य है और मुझे लगता है कि यह किसी भी गहरे सत्य की खोज के लिए उपयोगी नहीं है या इसके पीछे अंतर्ज्ञान" गहरा परेशान कर रहा है। वे सुझाव देते हैं कि (1) हमें सैद्धांतिक रूप से मदद करने के लिए गणित पर भरोसा नहीं करना चाहिए और (2) गणित को पहली बार में समझने का कोई मतलब नहीं है। मुझे उम्मीद है कि इस थ्रेड में अन्य पोस्ट पहले से ही दूसरे दावे को नापसंद करने की दिशा में एक लंबा रास्ता तय करेंगे। पहला इतना आत्म-असंगत है कि यह शायद ही आगे के विश्लेषण को सहन करता है।
whuber

2
@whuber। आप सही हैं, मैं शायद अपने लीग से बाहर हूं। मैं संपादित करूँगा।
StijnDeVuyst

3
समस्याग्रस्त भाग पर पुनर्विचार करने के लिए धन्यवाद, और बाकी के लिए एक बड़ा +1।
whuber

7

यह उत्तर सरल कलन तकनीक (आदेश 3 का टेलर विस्तार) का उपयोग करके केंद्रीय सीमा प्रमेय का एक सहज अर्थ देने की उम्मीद करता है। यहाँ रूपरेखा है:

  1. सीएलटी क्या कहता है
  2. सरल पथरी का उपयोग करके सीएलटी का एक सहज प्रमाण
  3. सामान्य वितरण क्यों?

हम बहुत अंत में सामान्य वितरण का उल्लेख करेंगे; इस तथ्य के कारण कि सामान्य वितरण अंततः सामने आता है, अधिक अंतर्ज्ञान को सहन नहीं करता है।

1. केंद्रीय सीमा प्रमेय क्या कहता है? CLT के कई संस्करण

xX1,,Xn

P(X1++Xnnx)n+xet2/22πdt.
X1.,,XnZ1,,Zn
E[f(X1++Xnn)]E[f(Z1++Znn)]n+0
fx
f(t)={1 if t<x0 if tx.
X1,,XnZ1,,Zn, बशर्ते कि यादृच्छिक चर मतलब शून्य, विचरण एक के साथ स्वतंत्र हों।

kX1,,XnZ1,,Znf

(CONV)E[f(X1++Xnn)]E[f(Z1++Znn)]n+0

निम्नलिखित कथनों के बीच समतुल्यता स्थापित करना संभव है ("यदि और केवल यदि") तो:

  1. ff(t)=1t<xf(t)=0txx
  2. f:RR
  3. C
  4. fsupxR|f(x)|1

उपरोक्त 4 बिंदुओं में से प्रत्येक कहता है कि अभिसरण एक बड़े वर्ग के कार्यों के लिए है। एक तकनीकी अनुमान तर्क द्वारा, एक दिखा सकता है कि ऊपर के चार बिंदु बराबर हैं, हम रीडर को अध्याय 7, डेविड पोलार्ड की पुस्तक 77 के पृष्ठ पर संदर्भित करते हैं, जो कि सैद्धांतिक संभावनाओं को मापने के लिए उपयोगकर्ता का मार्गदर्शन है , जिसमें से यह उत्तर अत्यधिक प्रेरित है।

इस उत्तर के शेष के लिए हमारी धारणा ...

supxR|f(x)|CC>0E[|Xi|3]E[|Zi|3]

E[f(X1++Xnn)]X1,...,Xn

X1,,XnZ1,,Zn

XiZiW=Z1++Zn1h(x)=f(x/n)

h(Z1++Zn1+Xn)=h(W)+Xnh(W)+Xn2h(W)2+Xn3/h(Mn)6h(Z1++Zn1+Zn)=h(W)+Znh(W)+Zn2h(W)2+Zn3h(Mn)6
MnMnXnWE[Xnh(W)]=E[Xn]E[h(W)]=0

(C/6)E[|Xn|3+|Zn|3](n)3.
Cf(n)3h(t)=f(t/n)/(n)3XnZn

Xn1Zn1W~=Z1+Z2++Zn2+Xn

h(Z1++Zn2+Xn1+Xn)=h(W~)+Xn1h(W~)+Xn12h(W~)2+Xn13/h(M~n)6h(Z1++Zn2+Zn1+Xn)=h(W~)+Zn1h(W~)+Zn12h(W~)2+Zn13/h(M~n)6.
Zn1W~Xn1W~

(C/6)E[|Xn1|3+|Zn1|3](n)3.
ZiXin
|E[f(X1++Xnn)]E[f(Z1++Znn)]|n(C/6)maxi=1,,nE[|Xi|3+|Zi|3](n)3.
nX1,,XnZ1,,ZnXiZiO(1/(n)3)XiZiO(1/n)

E[f(X1++Xnn)]X1,,XnE[Xi]=E[Zi]=0,E[Zi2]=E[Xi2]=1

3. सामान्य वितरण क्यों?

E[f(X1++Xnn)]XiO(1/n)

लेकिन अनुप्रयोगों के लिए, ऐसी मात्रा की गणना करना उपयोगी होगा। इस मात्रा लिए सरल अभिव्यक्ति प्राप्त करना भी उपयोगी होगाE[f(X1++Xnn)]

X1,,Xn(X1++Xn)/n

N(0,1)Z1,,ZnN(0,1)Z1++ZnnN(0,1)nZN(0,1)

E[f(Z1++Znn)]=E[f(Z)],
X1,,XnE[Xi]=0,E[Xi2]=1

|E[f(X1++Xnn)]E[f(Z)|supxR|f(x)|maxi=1,,nE[|Xi|3+|Z|3]6n.

आप सीएलटी के बजाय बड़ी संख्या के कानून का दावा करते हैं।
whuber

1
E[f((X1+...+Xn)/n)]E[f(Z)]ZN(0,1)f

2
मुझे पता है तुम्हारा क्या मतलब है। मुझे क्या विराम देता है कि आपके दावे में केवल अपेक्षाएं हैं और वितरण नहीं है, जबकि CLT एक सीमित वितरण के बारे में निष्कर्ष निकालता है। दोनों के बीच समानता तुरंत कई लोगों के लिए स्पष्ट नहीं हो सकती है। क्या मैं सुझाव दूंगा कि आप वितरण को सीमित करने के संदर्भ में अपने बयान और सीएलटी के सामान्य बयानों के बीच एक स्पष्ट संबंध प्रदान करें? (+1 माध्यम से: इस तर्क व्याख्या के लिए धन्यवाद।)
whuber

1

मैंने सहज ज्ञान युक्त संस्करण के साथ आने का प्रयास किया और कुछ सिमुलेशन के साथ आया। मेरे पास एक ऐसा प्रश्न है जो क्विनकुंक्स और कुछ अन्य लोगों का अनुकरण प्रस्तुत करता है जो यह दिखाते हैं कि यदि आप आरटी का प्रति विषय पर्याप्त संग्रह करते हैं तो एक तिरछी कच्ची प्रतिक्रिया समय वितरण भी सामान्य हो जाएगा। मुझे लगता है कि वे मदद करते हैं, लेकिन वे इस साल मेरी कक्षा में नए हैं और मैंने अभी तक पहली परीक्षा को वर्गीकृत नहीं किया है।

एक बात जो मुझे अच्छी लगी, वह थी बड़ी संख्या में कानून दिखाने में सक्षम होना। मैं दिखा सकता हूं कि छोटे नमूना आकार के साथ चर चीजें कैसे होती हैं और फिर दिखाती हैं कि वे बड़े लोगों के साथ कैसे स्थिर होते हैं। मैं अन्य बड़ी संख्या में डेमो का एक गुच्छा भी करता हूं। मैं यादृच्छिक प्रक्रियाओं की संख्या और नमूनों की संख्या के बीच Quincunx में बातचीत दिखा सकता हूं।

(पता चलता है कि मेरी कक्षा में चाक या सफेद बोर्ड का उपयोग नहीं किया जा सकता है)


हाय जॉन: लगभग नौ वर्षों के बाद इस पोस्ट के साथ आपको देखकर अच्छा लगा! इस दौरान सीएलटी और एलएलएन के विचार को पढ़ाने के लिए सिमुलेशन के आपके उपयोग के साथ आपके द्वारा किए गए अनुभवों के बारे में पढ़ना दिलचस्प होगा।
whuber

मैंने एक साल बाद उस कक्षा को पढ़ाना बंद कर दिया लेकिन बाद के प्रशिक्षक ने सिमुलेशन आइडिया पर विचार किया। वास्तव में, वह इसे बहुत आगे ले जाता है और चमकदार ऐप्स का एक क्रम विकसित किया है और छात्रों को 250 व्यक्ति वर्ग में चीजों के भार के लिए सिमुलेशन के साथ खेलते हैं। पास के रूप में मैं उच्च वर्ग को पढ़ाने से बता सकता हूं कि छात्रों को इससे बहुत कुछ मिलता है। उनके छात्रों और समकक्ष फीडर वर्गों के बीच का अंतर ध्यान देने योग्य है। (लेकिन, ज़ाहिर है, वहाँ बहुत सारे अनियंत्रित चर हैं)
जॉन

धन्यवाद, जॉन। एक कक्षा समाप्त होने के बाद स्थायी छात्र प्रदर्शन के बारे में भी महत्वपूर्ण प्रतिक्रिया प्राप्त करना इतना असामान्य है कि मुझे यह रुचि की सीमित जानकारी भी मिल जाए।
whuber

-8

जब आप यादृच्छिक वितरण के बहुत सारे हिस्टोग्राम जोड़ते हैं, तो आप या तो सामान्य वितरण आकार बनाए रखते हैं, क्योंकि सभी व्यक्तिगत हिस्टोग्राम के आकार पहले से ही होते हैं या आपको वह आकार मिलता है क्योंकि व्यक्तिगत हिस्टोग्राम में उतार-चढ़ाव एक बड़े को जोड़ने पर प्रत्येक को रद्द कर देते हैं। हिस्टोग्राम की संख्या। एक चर के यादृच्छिक वितरण का एक हिस्टोग्राम पहले से ही लगभग इस तरह से वितरित किया जाता है कि लोगों ने सामान्य वितरण को कॉल करना शुरू कर दिया है क्योंकि यह बहुत आम है और यह केंद्रीय सीमा प्रमेय का एक सूक्ष्म जगत है।

यह पूरी कहानी नहीं है, लेकिन मुझे लगता है कि यह जितना सहज है उतना ही सहज है।


2
2

5
18,14,12,14,18
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.