, या


40

मैं थोड़ी देर के लिए इस बारे में सोच रहा था; मुझे यह थोड़ा अजीब लगता है कि यह अचानक कैसे हो जाता है। असल में, हमें लिए केवल तीन वर्दी की आवश्यकता क्यों है Znजैसे कि यह बाहर करता है? और स्मूथिंग-आउट इतनी जल्दी क्यों होता है?

Z2 :

2

Z3 :

3

(छवियां बेशर्मी से जॉन डी। कुक के ब्लॉग से चोरी हुईं: http://www.johndcook.com/blog/2009/02/12/sums-of-uniform-random-values/ )

चार वर्दी वाले इसे क्यों नहीं कहते? या पाँच? या ...?


11
ठीक है, इतना सरल होना जितना कि सुस्पष्ट होना, क्योंकि 3 यूनिफ़ॉर्म का योग इसके pf में द्विघात सेगमेंट है, और एक बार जब आप दो या अधिक यूनिफ़ॉर्म प्राप्त करते हैं, तो आपके पास इस बीच एक शिखर होता है। एक द्विघात शिखर "चिकना" है ... और द्विघात टुकड़ों के बीच जुड़ाव 1 और 2 पर है, इसलिए यह 1.5 पर नहीं मार सकता है ; एक ही निष्कर्ष पर पहुंचने के अन्य तरीके हैं
ग्लेन_ब

जवाबों:


71

हम इसके लिए विभिन्न दृष्टिकोण अपना सकते हैं, जिनमें से कोई भी कुछ लोगों के लिए सहज और दूसरों के लिए सहज ज्ञान युक्त हो सकता है। इस तरह की भिन्नता को समायोजित करने के लिए, यह उत्तर कई ऐसे दृष्टिकोणों का सर्वेक्षण करता है, जो गणितीय विचार के प्रमुख विभाजनों को कवर करते हैं - विश्लेषण (अनंत और असीम), ज्यामिति / टोपोलॉजी (स्थानिक संबंध), और बीजगणित (प्रतीकात्मक हेरफेर के औपचारिक पैटर्न) - के रूप में साथ ही संभावना भी। यह एक अवलोकन में समाप्त होता है जो सभी चार दृष्टिकोणों को एकजुट करता है, प्रदर्शित करता है कि यहां उत्तर देने के लिए एक वास्तविक प्रश्न है, और यह दिखाता है कि मुद्दा क्या है। प्रत्येक दृष्टिकोण अपने तरीके से प्रदान करता है, स्वतंत्र वर्दी चर के योगों की संभाव्यता वितरण कार्यों के आकार की प्रकृति में गहन अंतर्दृष्टि।


पृष्ठभूमि

वर्दी वितरण[0,1] कई बुनियादी विवरण है। जब का ऐसा वितरण होता है,X

  1. संभावना है कि एक औसत दर्जे का सेट में निहित एक बस उपाय के (लम्बाई) है एक [ 0 , 1 ] , लिखित | एक [ 0 , 1 ] | XAA[0,1]|A[0,1]|

  2. इससे यह तात्कालिक है कि संचयी वितरण समारोह (सीडीएफ) है

    FX(x)=Pr(Xx)=|(,x][0,1]|=|[0,min(x,1)]|={0x<0x0x11x>1.

    CDF

  3. संभाव्यता घनत्व फ़ंक्शन (पीडीएफ), जो कि सीडीएफ का व्युत्पन्न है, लिए और अन्यथा है। (यह और पर अपरिभाषित है ।)fX(x)=1एक्स ( एक्स ) = 0 0 10x1fX(x)=001

    पीडीएफ


विशेषता कार्यों से विश्लेषण (विश्लेषण)

किसी भी यादृच्छिक चर की विशेषता फ़ंक्शन (CF) (जहां काल्पनिक इकाई है, ) की अपेक्षा है । एक समान वितरण के पीडीएफ का उपयोग करके हम गणना कर सकते हैंऍक्स्प ( i t X ) i i 2 = - 1Xexp(itX)ii2=1

ϕX(t)=exp(itx)fX(x)dx=01exp(itx)dx=exp(itx)it|x=0x=1=exp(it)1it.

सीएफ (पीडीएफ का फूरियर रूपांतरण का एक संस्करण है, । फूरियर रूपांतरणों के बारे में सबसे बुनियादी सिद्धांत हैं:ϕ(t)=f^(t)

  • स्वतंत्र चरों की राशि की सीएफ है उत्पाद उनके सीएफएस के।X+Y

  • जब मूल पीडीएफ निरंतर होता है और बाउंड होता है, तो फूरियर ट्रांसफॉर्म के बारीकी से संबंधित संस्करण द्वारा सीएफ से को पुनर्प्राप्त किया जा सकता है ,X ϕfXfϕ

f(x)=ϕˇ(x)=12πexp(ixt)ϕ(t)dt.
  • जब अलग है, तो इसके व्युत्पन्न को अभिन्न संकेत के तहत गणना की जा सकती है:f

    f(x)=ddx12πexp(ixt)ϕ(t)dt=i2πtexp(ixt)ϕ(t)dt.

    इसे अच्छी तरह से परिभाषित करने के लिए, अंतिम अभिन्न को पूर्ण रूप से परिवर्तित करना चाहिए; अर्थात्,

    |texp(ixt)ϕ(t)|dt=|t||ϕ(t)|dt

    एक परिमित मूल्य में परिवर्तित करना चाहिए। इसके विपरीत, जब यह अभिसरण करता है, इन व्युत्क्रम सूत्रों के आधार पर व्युत्पत्ति हर जगह मौजूद होती है।

अब यह स्पष्ट है कि समान चरों के योग के लिए PDF कितना भिन्न है: पहली गोली से, iid चर के योग का CF उनमें से एक का CF है जो पावर के लिए उठाया गया है , यहाँ बराबर है । अंश बद्ध है (यह साइन तरंगों से युक्त है) जबकि भाजक । हम द्वारा इस तरह के एक इंटीग्रैंड को गुणा कर सकते हैं और यह तब भी पूरी तरह से परिवर्तित होगा जब और सशर्त रूप से तब परिवर्तित होगा जब । इस प्रकार, तीसरी गोली के बार-बार आवेदन से पता चलता है कि समरूप चर के योग के लिए पीडीएफ लगातारn th ( एक्सप ( i t ) - 1 ) n / ( i t ) n O ( t n ) t s s < n - 1 s = n - 1 n n - 2 n - 1nnth(exp(it)1)n/(it)nO(tn)tss<n1s=n1nn2अलग-अलग समय और ज्यादातर जगहों पर, यह बार अलग अलग होगा।n1

एन = 10 के लिए सीएफ

नीला छायांकित वक्र iid समरूप चर के योग के वास्तविक भाग के निरपेक्ष मान का एक लॉग-लॉग प्लॉट है । धराशायी लाल रेखा एक स्पर्शोन्मुख है; इसका ढलान , जिससे पता चलता है कि पीडीएफ गुना भिन्न है। संदर्भ के लिए, ग्रे वक्र एक समान आकार के गॉसियन फ़ंक्शन (एक सामान्य पीडीएफ) के लिए सीएफ का वास्तविक हिस्सा प्लॉट करता है।- 10 10 - 2 = 8n=1010102=8


संभावना से अंतर्ज्ञान

चलो और स्वतंत्र यादृच्छिक चर जहां होना समान है वितरण। एक संकीर्ण अंतराल पर विचार करें । हम इस संभावना को विघटित करते हैं कि इस संभावना में कि पर्याप्त रूप से इस अंतराल के करीब है कि केवल सही आकार है। जगह पर इस अंतराल में, यह देखते हुए कि पास पर्याप्त है:एक्स एक्स [ 0 , 1 ] ( टी , टी + डी टी ] एक्स + वाई ( टी , टी + डी टी ] वाई एक्स एक्स + वाई वाईYXX[0,1](t,t+dt]X+Y(t,t+dt]YXX+YY

fX+Y(t)dt=Pr(X+Y(t,t+dt])=Pr(X+Y(t,t+dt]|Y(t1,t+dt])Pr(Y(t1,t+dt])=Pr(X(tY,tY+dt]|Y(t1,t+dt])(FY(t+dt)FY(t1))=1dt(FY(t+dt)FY(t1)).

अंतिम समानता के पीडीएफ के लिए अभिव्यक्ति से आती है । द्वारा दोनों पक्षों डिवाइडिंग और के रूप में सीमा लेने के देता हैडी टी डी टी 0Xdtdt0

fX+Y(t)=FY(t)FY(t1).

दूसरे शब्दों में, किसी भी चर एक समान चर को से एक भिन्न CDF में pdf बदल जाता है । क्योंकि पीडीएफ सीडीएफ का व्युत्पन्न है, इसका अर्थ है कि हर बार जब हम लिए एक स्वतंत्र समान चर जोड़ते हैं , तो परिणामस्वरूप पीडीएफ एक बार पहले की तुलना में अधिक भिन्न होता है।एक्स वाई एफ वाई वाई एफ वाई ( टी ) - एफ वाई ( टी - ) वाई[0,1]XYfYFY(t)FY(t1)Y

आइए एक समान चर साथ शुरू करते हुए, इस अंतर्दृष्टि को लागू करें । मूल PDF या पर भिन्न नहीं है : यह वहां बंद है। का पीडीएफ , , या भिन्न नहीं है , लेकिन यह उन बिंदुओं पर निरंतर होना चाहिए, क्योंकि यह के पीडीएफ के इंटीग्रल का अंतर है । एक और स्वतंत्र यूनिफ़ॉर्म वेरिएबल जोड़ें : का पीडीएफ , , और में भिन्न है , लेकिन जरूरी नहीं कि यह दूसरा हो0 1 Y + X 0 1 2 Y X 2 Y + X + X 2 0 1 2 3Y01Y+X012YX2Y+X+X2 0123उन बिंदुओं पर व्युत्पन्न। और इसी तरह।


ज्यामिति से अंतर्ज्ञान

पर CDF की राशि के आईआईडी वर्दी variates इकाई hypercube की मात्रा के बराबर होती है आधा अंतरिक्ष के भीतर झूठ बोल । वैरिएंट के लिए स्थिति को यहां , और फिर सेट के साथ दिखाया गया है ।tn[0,1]nx1+x2++xntn=3t1/23/25/2

3 डी क्यूब

के रूप में से प्रगति के माध्यम से , hyperplane पार कोने में , । हर बार क्रॉस सेक्शन का आकार बदल जाता है: आकृति में यह पहले एक त्रिकोण ( -simplex) है, फिर एक षट्भुज, फिर एक त्रिकोण। इन मूल्यों पर पीडीएफ की तीव्र झुकाव क्यों नहीं ?t0nHn(t):x1+x2++xn=tt=0t=1,,t=n2t

इसे समझने के लिए, पहले छोटे मूल्यों पर विचार करें । इधर, hyperplane एक बंद कटौती -simplex। सिंप्लेक्स के सभी आयाम सीधे समानुपाती होते हैं , जहां इसका "क्षेत्र" लिए आनुपातिक है । इसके लिए कुछ संकेतन बाद में काम आएंगे। चलो हो "इकाई कदम समारोह,"tHn(t)n1n1ttn1θ

θ(x)={0x<01x0.

यदि यह हाइपरक्यूब के अन्य कोनों की उपस्थिति के लिए नहीं था, तो यह स्केलिंग अनिश्चित काल तक जारी रहेगी। -simplex के क्षेत्र का एक भूखंड नीचे ठोस नीले वक्र की तरह दिखेगा: यह नकारात्मक मानों पर शून्य है और बराबरसकारात्मक एक पर, सुविधापूर्वक लिखा गया। यह मूल रूप से आदेश का एक "किंक" है , इस अर्थ में कि आदेश माध्यम से सभी डेरिवेटिव मौजूद हैं और निरंतर हैं, लेकिन क्रम बाएं और दाएं डेरिवेटिव मौजूद हैं, लेकिन मूल पर सहमत नहीं हैं ।n1tn1/(n1)!θ(t)tn1/(n1)!n2n3n2

(इस चित्र में दिखाए गए अन्य घटता (लाल), (सोना), और (- (काला)) केस में उनकी भूमिकाओं के बारे में नीचे चर्चा की गई है।)3θ(t1)(t1)2/2!3θ(t2)(t2)2/2!θ(t3)(t3)2/2!n=3

सरल क्षेत्र की साजिश

यह समझने के लिए कि पार होने पर क्या होता है , आइए मामले की विस्तार से जांच करें , जहां एक विमान में सभी ज्यामिति होती हैं। हम यूनिट "क्यूब" (अब सिर्फ एक वर्ग) को चतुर्भुज के रैखिक संयोजन के रूप में देख सकते हैं, जैसा कि यहां दिखाया गया है:t1n=2

चतुर्भाग

पहला चतुर्थांश निचले बाएँ पैनल में, ग्रे में दिखाई देता है। का मान , जो सभी पाँच पैनलों में दिखाई जाने वाली विकर्ण रेखा को निर्धारित करता है। सीडीएफ सही पर दिखाए गए पीले क्षेत्र के बराबर है। इस पीले क्षेत्र में निम्न शामिल हैं:t1.5

  1. निचले बाएं पैनल में त्रिकोणीय ग्रे क्षेत्र,

  2. शून्य से ऊपरी बाएं पैनल में त्रिकोणीय हरित क्षेत्र,

  3. निम्न मध्य पैनल में त्रिकोणीय लाल क्षेत्र का ऋण ,

  4. प्लस ऊपरी मध्य पैनल में किसी भी नीले क्षेत्र (लेकिन ऐसा कोई क्षेत्र नहीं है, और न ही तब तक होगा जब तक कि से अधिक न हो )।t2

इन क्षेत्रों में से प्रत्येक एक त्रिकोण का क्षेत्र है। जैसे पहले एक तराजू , अगले दो लिए शून्य हैं और अन्यथा जैसे , और अंतिम लिए शून्य और अन्यथा जैसे । इस ज्यामितीय विश्लेषण ने यह स्थापित किया है कि सीडीएफ, आनुपातिक है = ; समतुल्य, PDF तीन फ़ंक्शनों के योग के लिए आनुपातिक है , , और the the2n=4tn=t2t<1(t1)n=(t1)2t<2(t2)nθ(t)t2θ(t1)(t1)2θ(t1)(t1)2+θ(t2)(t2)2θ(t)t22θ(t1)(t1)2+θ(t2)(t2)2θ(t)t2θ(t1)(t1)θ(t2)(t2)(उनमें से प्रत्येक स्केलिंग रैखिक रूप से जब )। इस आकृति का बायाँ पैनल उनके रेखांकन को दिखाता है: जाहिर है, वे मूल ग्राफ के सभी संस्करण हैं , लेकिन (a) , द्वारा स्थानांतरित किया गया , और इकाइयाँ दाईं ओर और (b) rescaled , , और , क्रमशः।n=2θ(t)t012121

N = 2 के लिए रेखांकन

दायाँ पैनल इन ग्राफों का योग दिखाता है (ठोस काला वक्र, जिसे इकाई क्षेत्र के लिए सामान्यीकृत किया जाता है: यह मूल प्रश्न में कोणीय-दिखने वाला पीडीएफ है।

अब हम किसी भी राशि के iid वर्दी चर के पीडीएफ में "किंक" की प्रकृति को समझ सकते हैं। वे बिल्कुल "kink" की तरह हैं जो फ़ंक्शन में पर होता है , संभवतः rescaled है, और पूर्णांक के लिए स्थानांतरित कर दिया गया है जहां हाइपरप्लेन हाइपरक्यूब के कोने को पार करता है। के लिए , इस दिशा में एक दृश्य परिवर्तन है: के अधिकार के व्युत्पन्न पर है जबकि इसकी बाईं व्युत्पन्न है । के लिए , यह एक है निरंतर0θ(t)tn11,2,,nHn(t)n=2θ(t)t001n=3दिशा में परिवर्तन, लेकिन दूसरी व्युत्पन्न में अचानक (असंतोषजनक) परिवर्तन। सामान्य , ऑर्डर माध्यम से निरंतर व्युत्पन्न होगा लेकिन व्युत्पन्न में एक असंतोष ।nn2n1st


बीजगणितीय हेरफेर से अंतर्ज्ञान

CF की गणना करने के लिए एकीकरण, संभाव्य विश्लेषण में सशर्त संभाव्यता का रूप, और एक हाइपरक्यूब के संश्लेषण को क्वाड्रंट्स के रैखिक संयोजन के रूप में सभी मूल वर्दी वितरण में लौटने और इसे सरल चीजों के रैखिक संयोजन के रूप में फिर से व्यक्त करने का सुझाव देते हैं। । दरअसल, इसका पीडीएफ लिखा जा सकता है

fX(x)=θ(x)θ(x1).

हमें पारी ऑपरेटर परिचय चलो : यह किसी भी समारोह पर काम करता है सही करने के लिए अपने ग्राफ एक इकाई स्थानांतरण द्वारा:Δf

(Δf)(x)=f(x1).

औपचारिक रूप से, फिर, एक समान चर की पीडीएफ के लिए हम लिख सकते हैंX

fX=(1Δ)θ.

की राशि की पीडीएफ आईआईडी वर्दी के घुमाव के है के साथ ही बार। यह यादृच्छिक चर की राशि की परिभाषा से निम्नानुसार है: दो फ़ंक्शन और का दृढ़ संकल्प फ़ंक्शन हैnfXnfg

(fg)(x)=f(xy)g(y)dy.

यह सत्यापित करना आसान है कि कन्वेंशन । एकीकरण के चर को से बदलें :Δyy+1

(f(Δg))=f(xy)(Δg)(y)dy=f(xy)g(y1)dy=f((x1)y)g(y)dy=(Δ(fg))(x).

iid वर्दी के योग के पीडीएफ के लिए , हम अब बीजगणितीय रूप से लिखने के लिए आगे बढ़ सकते हैंn

f=fXn=((1Δ)θ)n=(1Δ)nθn

(जहाँ "शक्ति" बार-बार होने वाले दोष को दर्शाता है, बिंदुवार गुणन को नहीं!)। अब एक प्रत्यक्ष, प्रारंभिक एकीकरण है, दे रहा हैθ nnθn

θn(x)=θ(x)xn1n1!.

बाकी बीजगणित है, क्योंकि द्विपद प्रमेय लागू होता है (जैसा कि यह वास्तविक रूप से किसी भी संचारी बीजगणित में होता है):

f=(1Δ)nθn=i=0n(1)i(ni)Δiθn.

क्योंकि केवल उसके तर्क से बदलाव , इस प्रदर्शन पीडीएफ के लिए स्थानांतरित कर दिया संस्करणों में से एक रेखीय संयोजन के रूप में , वास्तव में हम ज्यामितीय निष्कर्ष निकाला है:Δiifθ(x)xn1

f(x)=1(n1)!i=0n(1)i(ni)(xi)n1θ(xi).

(जॉन कुक ने अपने ब्लॉग पोस्ट में बाद में नोटेशन for का उपयोग करते हुए इस सूत्र को उद्धृत किया ।(xi)+n1(xi)n1θ(xi)

तदनुसार, क्योंकि हर जगह एक सुचारू कार्य है, पीडीएफ का कोई भी एकवचन व्यवहार केवल उन्हीं स्थानों पर घटित होगा, जहां एकवचन है (स्पष्ट रूप से सिर्फ ) और उन स्थानों पर द्वारा दाईं ओर स्थानांतरित कर दिया गया है। । उस विलक्षण व्यवहार की प्रकृति - चिकनाई की डिग्री - इसलिए सभी स्थानों पर समान होगी xn1θ(x)01,2,,nn+1

यह चित्र लिए चित्र है , (बाएं पैनल में) योग में व्यक्तिगत शब्द (और दाएं पैनल में) आंशिक रकम है, योग में ही समापन (ठोस काला वक्र):n=8

N = 8 के लिए प्लॉट


टिप्पणियाँ बंद करना

यह नोट करना उपयोगी है कि इस अंतिम दृष्टिकोण ने आखिरकार iid वर्दी चर की राशि के पीडीएफ की गणना के लिए एक कॉम्पैक्ट, व्यावहारिक अभिव्यक्ति प्राप्त की है । (सीडीएफ के लिए एक सूत्र समान रूप से प्राप्त किया गया है।)n

केंद्रीय सीमा प्रमेय को यहां कहने के लिए बहुत कम है। आखिरकार, iid द्विपद चर का एक योग एक सामान्य वितरण में परिवर्तित होता है, लेकिन यह योग हमेशा असतत होता है: इसमें कभी भी पीडीएफ नहीं होता है! हमें CLT से आने वाले "kinks" या PDF की भिन्नता के अन्य उपायों के बारे में किसी भी अंतर्ज्ञान की उम्मीद नहीं करनी चाहिए।


12
(+1) शानदार! अब, इस सबको एक साथ रखने में आपको कितना समय लगा?
कार्डिनल

13
@ कार्डिनल यह आखिरी सवाल था जो मैंने पिछले सोमवार को सत्ता गंवाने से पहले पढ़ा था। आगामी सप्ताह के दौरान, लंबी अंधेरी शामों ने कई उत्तरों को विकसित करने के लिए :-) और, मनोरंजन के माध्यम से इसे सोचने का अवसर प्रदान किया। पिछले सप्ताहांत में सत्ता बहाल होने के बाद, यह केवल दृष्टांत बनाने और इसे लिखने में कुछ समय लगने की बात थी (जो मुझे उम्मीद से अधिक समय लगा, मैं स्वीकार करता हूं)। मुझे उम्मीद है कि शायद इस थ्रेड में से कुछ यादृच्छिक चर की राशि के बारे में भविष्य के संबंधित प्रश्नों के लिए एक संदर्भ के रूप में काम कर सकते हैं।
व्हीबर

1
वाह। काश मैं इस जवाब को 'पसंदीदा' कर पाता ।
Rhubbarb

2
व्हीबर, यह बिल्कुल आश्चर्यजनक है। मुझे कभी एहसास नहीं हुआ कि इतना आसान सवाल कितना गहरा हो सकता है। आपका जवाब लेने में मुझे थोड़ा समय लगेगा, लेकिन अभी के लिए, आपका बहुत-बहुत धन्यवाद!
टेट्राग्रामेटन

6
मैं टिप्पणियों पर एसई नीति का उल्लंघन करूंगा, यह कहकर कि हम (क्रॉस्लेटिड के सभी डॉट कॉम) को आपकी बिजली कंपनी को अधिक बार बिजली काटने के लिए रिश्वत देनी चाहिए :)
एमपिकेटस

1

आप तर्क दे सकते हैं कि एक समान रैंडम वैरिएबल की प्रायिकता घनत्व फ़ंक्शन परिमित है,

इसलिए इसका एक समान यादृच्छिक चर का संचयी घनत्व कार्य निरंतर है,

इसलिए दो समान यादृच्छिक चर के योग की संभाव्यता घनत्व कार्य निरंतर है,

इसलिए इसके दो समान यादृच्छिक चर के योग का संचयी घनत्व कार्य सुचारू है (लगातार भिन्न),

तो तीन समान यादृच्छिक चर के योग की प्रायिकता घनत्व कार्य सुचारू है।


1

मुझे लगता है कि अधिक आश्चर्यजनक बात यह है कि आपको लिए तेज चोटी मिलती है । n=2

केंद्रीय सीमा प्रमेय का कहना है कि बड़े पर्याप्त नमूने आकार के लिए माध्य का वितरण (और योग बस माध्य समय , प्रत्येक ग्राफ के लिए एक निश्चित स्थिरांक) लगभग सामान्य होगा। यह पता चला है कि वर्दी वितरण वास्तव में CLT (सममित, कोई भारी पूंछ नहीं है (अच्छी तरह से किसी भी पूंछ की ज्यादा नहीं है), आउटलेर्स की कोई संभावना नहीं है) के संबंध में अच्छा व्यवहार किया गया है, इसलिए वर्दी के लिए नमूना आकार "बड़ा पर्याप्त" होना चाहिए "बहुत बड़ा नहीं है (लगभग 5 या 6 एक अच्छे सन्निकटन के लिए), आप पहले से ही पर ठीक सन्निकटन देख रहे हैं ।nn=3

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.