सार
आपने सैंपल मेडियंस के लिए केंद्रीय सीमा प्रमेय में वर्णित निर्माण का एक हिस्सा फिर से खोजा है , जो नमूने के माध्यिका के विश्लेषण को दर्शाता है। (विश्लेषण स्पष्ट रूप से लागू होता है, म्यूटेटिस म्यूटेंडिस , किसी भी मात्रात्मक के लिए, केवल मंझला नहीं)। इसलिए यह कोई आश्चर्य की बात नहीं है कि बड़े बीटा मापदंडों (बड़े नमूनों के अनुरूप) के लिए एक सामान्य वितरण प्रश्न में वर्णित परिवर्तन के तहत उत्पन्न होता है। ब्याज क्या है सामान्य वितरण के करीब कैसे वितरण छोटे बीटा मापदंडों के लिए भी है । वह स्पष्टीकरण के योग्य है।
मैं नीचे एक विश्लेषण स्केच करूंगा। इस पोस्ट को एक उचित लंबाई पर रखने के लिए, इसमें बहुत सारे विचारोत्तेजक हाथ लहराते हैं: मैं केवल मुख्य विचारों को इंगित करना चाहता हूं। इसलिए मुझे यहाँ परिणामों को संक्षेप में प्रस्तुत करें:
जब β के करीब होता है , तो सब कुछ सममित होता है। यह सामान्य दिखने के लिए पहले से ही परिवर्तित वितरण का कारण बनता है।αβ
प्रपत्र के कार्यों नज़र काफी पहले स्थान पर सामान्य, यहां तक कि के छोटे मूल्यों के लिए अल्फा और β (बशर्ते दोनों से अधिक 1 और उनके अनुपात भी नहीं है 0 या 1 के करीब )।Φα−1(x)(1−Φ(x))β−1αβ101
रूपांतरित वितरण की स्पष्ट सामान्यता इस तथ्य के कारण है कि इसके घनत्व में एक फ़ंक्शन (2) में गुणा किए गए सामान्य घनत्व के होते हैं।
के रूप में और β वृद्धि, सामान्य से प्रस्थान लॉग घनत्व के लिए एक टेलर श्रृंखला में शेष संदर्भ में मापा जा सकता है। आदेश n की अवधि α और β की ( n - 2 ) / 2 शक्तियों के अनुपात में घट जाती है । यह है कि अंततः का तात्पर्य, पर्याप्त रूप से बड़े के लिए α और β , शक्ति के सभी मामले n = 3 या अधिक से अधिक अपेक्षाकृत छोटे हो गए हैं, केवल एक द्विघात छोड़ने: जो ठीक एक सामान्य वितरण की लॉग घनत्व है।αβn(n−2)/2αβαβn=3
सामूहिक रूप से, इन कार्यों अच्छी तरह से स्पष्टीकरण दें कि यहां तक कि छोटे के लिए और बीटा एक आईआईडी सामान्य नमूना नज़र लगभग सामान्य की गैर चरम quantiles।αβ
विश्लेषण
क्योंकि यह सामान्यीकरण करने के लिए उपयोगी हो सकता है, चलो हो किसी भी वितरण समारोह, हालांकि हम मन में है एफ = Φ ।FF=Φ
घनत्व समारोह एक बीटा की ( α , β ) चर परिभाषा के द्वारा, है, के लिए आनुपातिकg(y)(α,β)
yα−1(1−y)β−1dy.
दे संभावना अभिन्न की परिणत हो एक्स और लेखन च के व्युत्पन्न के लिए एफ , यह तत्काल है कि एक्स घनत्व आनुपातिक करने के लिएy=F(x)xfFx
G(x;α,β)=F(x)α−1(1−F(x))β−1f(x)dx.
क्योंकि यह एक दृढ़ता से अनिमॉडल डिस्ट्रीब्यूशन (एक बीटा) का एक मोनोटोनिक रूपांतरण है, जब तक कि अजीब नहीं है , तब तक ट्रांसफॉर्म किया गया डिसिप्लिन अनिमॉडल भी होगा। यह सामान्य होने के कितने करीब है, इसका अध्ययन करने के लिए, आइए इसके घनत्व के लघुगणक की जाँच करें,F
logG(x;α,β)=(α−1)logF(x)+(β−1)log(1−F(x))+logf(x)+C(1)
जहां सामान्यीकरण का एक अप्रासंगिक स्थिरांक है।C
के घटकों का विस्तार करें के आसपास आदेश से तीन टेलर श्रृंखला में एक मूल्य के एक्स 0 (जो एक मोड के पास हो जाएगा)। उदाहरण के लिए, हम के विस्तार लिख सकते हैं लॉग एफ के रूप मेंlogG(x;α,β)x0logF
logF(x)=cF0+cF1(x−x0)+cF2(x−x0)2+cF3h3
कुछ साथ | ज | ≤ | x - x 0 | । के लिए एक समान संकेतन का उपयोग लॉग ( 1 - एफ ) और लॉग च । h|h|≤|x−x0|log(1−F)logf
रेखीय शब्द
में रैखिक शब्द इस प्रकार बन जाता है(1)
g1(α,β)=(α−1)cF1+(β−1)c1−F1+cf1.
जब G का एक मोड है (x0 , यह अभिव्यक्ति शून्य है। नोट क्योंकि गुणांकों के निरंतर कार्य हैं कि एक्स 0 , के रूप में α और β अलग कर रहे हैं, मोड x 0 भी लगातार अलग अलग होंगे। इसके अलावा, एक बार α और ly पर्याप्त रूप से बड़े होते हैं, तो c f 1 शब्द अपेक्षाकृत असंगत हो जाता है। हम के रूप में सीमा का अध्ययन करने के उद्देश्य हैं अल्फा → ∞ और बीटा → ∞ जिसके लिए अल्फा : बीटा निरंतर अनुपात में रहता है γG(;α,β)x0αβx0αβcf1α→∞β→∞ α:βγ, इसलिए हम एक बार और सभी के लिए एक आधार बिंदु का चयन कर सकते हैं जिसके लिएx0
γcF1+c1−F1=0.
एक अच्छा मामले में जहां है , जहां α = β भर, और एफ के बारे में सममित है 0 । उस मामले में यह स्पष्ट है एक्स 0 = एफ ( 0 ) = 1 / 2 ।γ=1α=βF0x0=F(0)=1/2
हमने एक विधि प्राप्त की है जिसके द्वारा (ए) सीमा में, टेलर श्रृंखला में पहला-ऑर्डर शब्द गायब हो जाता है और (बी) विशेष रूप से वर्णित मामले में, पहला-ऑर्डर शब्द हमेशा शून्य होता है।
द्विघात शब्द
ये योग हैं
g2(α,β)=(α−1)cF2+(β−1)c1−F2+cf2.
एक सामान्य वितरण, जिसका द्विघात शब्द है की तुलना , हमारा अनुमान है कि हो सकता है - 1 / ( 2 जी 2 ( α , β ) ) लगभग की भिन्नता है जी । आइए इसके वर्गमूल द्वारा x को rescaling करके G को मानकीकृत करें । हमें वास्तव में विवरण की आवश्यकता नहीं है; यह समझने में कठिनाई होती है कि यह पुनर्विक्रय ( x) के गुणांक को गुणा करने वाला है−(1/2)(x−x0)2/σ2−1/(2g2(α,β))GGx से टेलर विस्तार में ( - 1 / ( 2 जी 2 ( α , β ) ) ) एन / 2 ।(x−x0)n(−1/(2g2(α,β)))n/2.
शेष पद
यहाँ पंचलाइन है: टेलर विस्तार में आदेश की अवधि हमारे संकेतन के अनुसार है,n
gn(α,β)=(α−1)cFn+(β−1)c1−Fn+cfn.
मानकीकरण के बाद, यह बन जाता है
g′n(α,β)=gn(α,β)(−2g2(α,β))n/2).
दोनों की affine संयोजन है α और β । करने के लिए विभाजक बढ़ाकर n / 2 बिजली, शुद्ध व्यवहार आदेश की है - ( n - 2 ) / 2 में से प्रत्येक में α और β । जैसा कि ये पैरामीटर बड़े होते हैं, फिर, टेलर के विस्तार में प्रत्येक शब्द के बाद दूसरा घटकर शून्य से कम हो जाता है। विशेष रूप से, तीसरे क्रम का शेष कार्यकाल मनमाने ढंग से छोटा हो जाता है।giαβn/2−(n−2)/2αβ
के सामान्य होने पर मामलाF
शेष अवधि का लुप्त होना विशेष रूप से तेज है जब मानक सामान्य है, क्योंकि इस मामले में एफ ( एक्स ) विशुद्ध रूप से द्विघात है: यह शेष शर्तों के लिए कुछ भी योगदान नहीं देता है। नतीजतन, का विचलन जी सामान्य से पूरी तरह से बीच विचलन पर निर्भर करता है एफ α - 1 ( 1 - एफ ) β - 1 और सामान्य।Ff(x)GFα−1(1−F)β−1
यह विचलन यहां तक कि छोटे के लिए काफी छोटा है और β । इसे समझने के लिए, मामले पर विचार α = β । जी सममित है, जहां आदेश -3 शब्द पूरी तरह से गायब हो जाता है। शेष x - x 0 = x में क्रम 4 का है । αβα=βG4x−x0=x
यहाँ एक प्लॉट दिखाया गया है कि छोटे मानों के साथ मानकीकृत चौथा क्रम अवधि कैसे बदलता है :α>1
मूल्य में बाहर शुरू होता है के लिए α = β = 1 (, क्योंकि तब वितरण स्पष्ट रूप से सामान्य है Φ - 1 एक समान वितरण, जो है क्या बीटा के लिए आवेदन किया ( 1 , 1 ) है, देता है एक मानक सामान्य वितरण)। यद्यपि यह तेजी से बढ़ता है, यह 0.008 से कम पर सबसे ऊपर है - जो व्यावहारिक रूप से शून्य से अप्रभेद्य है। उसके बाद एसिम्प्टोटिक पारस्परिक क्षय अंदर हो जाता है, जिससे वितरण कभी सामान्य से अधिक हो जाता है क्योंकि α 2 से अधिक बढ़ जाता है ।0α=β=1Φ−1(1,1)0.008α2