बीटा रैंडम वेरिएबल का उलटा सामान्य CDF क्या वितरण करता है?


14

मान लीजिए आप परिभाषित करते हैं:

XBeta(α,β)

YΦ1(X)

जहाँ मानक सामान्य वितरण के CDF का विलोम है ।Φ1

मेरा प्रश्न है: क्या कोई साधारण वितरण है जो अनुसरण करता है, या जो अनुमान लगा सकता है ? YY Y αमैं पूछ रहा हूं क्योंकि मुझे सिमुलेशन परिणामों के आधार पर एक मजबूत संदेह है (नीचे दिखाया गया है) कि एक सामान्य वितरण में परिवर्तित होता है जब और उच्च होते हैं, लेकिन मुझे नहीं पता कि यह गणितीय रूप से क्यों होगा। (बेशक जब , एक समान होगा और मानक सामान्य होगा, लेकिन उच्च मूल्यों के लिए यह सच क्यों होगा?)।Yαβα=1;β=1XY

यदि यह एक सामान्य में परिवर्तित होता है, तो उस और संदर्भ में उस सामान्य के पैरामीटर क्या होंगे ? (मुझे उम्मीद है कि इसका मतलब क्योंकि यह मोड का परिवर्तन है, लेकिन मुझे मानक विचलन का पता नहीं है)।αβΦ1(αα+β)

(एक और तरीका रखो, यह पूछ सकता है "does एक बीटा वितरण में परिवर्तित होता है, और की कुछ दिशा के लिए ?" मुझे यकीन नहीं है? इसका जवाब देना आसान है)।Φ(Norm(μ,σ))μσ

अनुकरण परिणाम

यहां मैं बताता हूं कि मुझे यह संदेह क्यों है कि परिणाम सामान्य है (क्योंकि मैं इसे गणित के साथ वापस नहीं कर सकता)। अनुकरण R के साथ और में किया जा सकता है । उदाहरण के लिए, उच्च पैरामीटर और चुनना :Yqnormrnormα=3000β=7000

hist(qnorm(rbeta(5000, 3000, 7000)))

यह सामान्य दिखता है, और qqnormऔर शापिरो-विल्क परीक्षण (जिसमें सामान्य रिक्त परिकल्पना है) का सुझाव है तो साथ ही साथ:

qqnorm(qnorm(rbeta(5000, 3000, 7000)))

shapiro.test(qnorm(rbeta(5000, 3000, 7000)))
#> 
#>  Shapiro-Wilk normality test
#> 
#> data:  qnorm(rbeta(5000, 3000, 7000))
#> W = 0.99954, p-value = 0.2838

सामान्यता को थोड़ा और गहरा करने के लिए, मैं 2,000 सिमुलेशन करता हूं, हर बार से 5,000 मूल्यों का अनुकरण करता है , फिर सामान्य की तुलना करने के लिए परीक्षण का प्रदर्शन करता है। (मैंने 5K मानों को चुना क्योंकि यह अधिकतम संभाल सकता है, और आदर्श से विचलन का पता लगाने की शक्ति को अधिकतम करता है)।Yshapiro.test

यदि वितरण सही मायने में सामान्य था, तो हम उम्मीद करेंगे कि पी-मान एक समान होगा (क्योंकि शून्य सत्य है)। वे वास्तव में वर्दी के करीब हैं, यह सुझाव देते हुए कि वितरण सामान्य के बहुत करीब है:

hist(replicate(2000, shapiro.test(qnorm(rbeta(5000, 3000, 7000)))$p.value))

कुछ प्रयोग से पता चलता है कि उच्च और होते हैं, वितरण बंद हो जाता है (जैसे सामान्य से काफी दूर है, लेकिन कोशिश करें और यह बीच में कहीं प्रतीत होता है)।αβrbeta(5000, 3, 7)hist(replicate(2000, shapiro.test(qnorm(rbeta(5000, 30, 70)))$p.value))


2
यहां कुछ भी दिलचस्प नहीं होता है। के रूप में और बीटा मान बड़े हो जाना, चलो वे उसी अनुपात में बने हुए हैं, या कम से कम है कि α / ( α + β ) से दूर रहता है 0 और 1 । फिर बीटा ( α , β ) वितरण सामान्य हो जाता है और एक मनमाने ढंग से संकीर्ण सीमा के भीतर केंद्रित होता है। Φ - 1 , वियोज्य होने के नाते, अनिवार्य रूप से रैखिक हो जाता है, जहां आप केवल लगभग-सामान्य चर के रैखिक परिवर्तन को देख रहे हैं। इस परिणाम के साथ क्या करना है कि अधिक से अधिक कुछ भी नहीं है Φ - 1αβα/(α+β)01(α,β)Φ1Φ1खुद और बीटा वितरण के बारे में कोई जानकारी नहीं जोड़ता है।
whuber

1
@whuber कि बड़े के लिए समझ में आता है और β (मैं कुछ सिमुलेशन कि मुझे लगता है कि यह बराबर सामान्य से सामान्य के करीब लगभग बीटा के लिए किया गया था, लेकिन फिर से चलाकर पर मुझे लगता है कि मैं समय पर एक गलती थी)। Α = 2 पर कोई विचार ; β = 2 ? डिस्ट सामान्य से बहुत दूर है, लेकिन इसके बारे में qnorm काफी करीब है। αβα=2β=2
डेविड रॉबिन्सन

1
@whuber Eg कोशिश करें hist(replicate(1000, shapiro.test(rbeta(5000, 2, 2))$p.value)), तब hist(replicate(1000, shapiro.test(qnorm(rbeta(5000, 2, 2)))$p.value))। दूसरे शब्दों में, जब सामान्य होता है क्योंकि बीटा एकसमान होता है, जब α और β उच्च होता है, क्योंकि बीटा लगभग सामान्य होता है- लेकिन जब वे समान और बीच में होते हैं तो यह काम क्यों करता है, यह न तो है सामान्य और न ही वर्दी? α=β=1αβ
डेविड रॉबिन्सन

5
यह निश्चित रूप से अधिक दिलचस्प है! आप सही हैं कि बीटा सामान्य के बहुत करीब नहीं है, लेकिन यह परिवर्तन लगभग सामान्य है, यहां तक ​​कि बीटा के छोटे मापदंडों के लिए भी। सामान्य से विचलन पूंछ में स्पष्ट बाहर, चारों ओर हो गया है या अधिक से अधिक है, लेकिन वितरण के पूरे शरीर में उल्लेखनीय छोटे हैं। अंततः यह बीटा टेल्स के पावर-लॉ व्यवहार के लिए उपलब्ध है। Z=±3
whuber

जवाबों:


7

सार

आपने सैंपल मेडियंस के लिए केंद्रीय सीमा प्रमेय में वर्णित निर्माण का एक हिस्सा फिर से खोजा है , जो नमूने के माध्यिका के विश्लेषण को दर्शाता है। (विश्लेषण स्पष्ट रूप से लागू होता है, म्यूटेटिस म्यूटेंडिस , किसी भी मात्रात्मक के लिए, केवल मंझला नहीं)। इसलिए यह कोई आश्चर्य की बात नहीं है कि बड़े बीटा मापदंडों (बड़े नमूनों के अनुरूप) के लिए एक सामान्य वितरण प्रश्न में वर्णित परिवर्तन के तहत उत्पन्न होता है। ब्याज क्या है सामान्य वितरण के करीब कैसे वितरण छोटे बीटा मापदंडों के लिए भी है । वह स्पष्टीकरण के योग्य है।

मैं नीचे एक विश्लेषण स्केच करूंगा। इस पोस्ट को एक उचित लंबाई पर रखने के लिए, इसमें बहुत सारे विचारोत्तेजक हाथ लहराते हैं: मैं केवल मुख्य विचारों को इंगित करना चाहता हूं। इसलिए मुझे यहाँ परिणामों को संक्षेप में प्रस्तुत करें:

  1. जब β के करीब होता है , तो सब कुछ सममित होता है। यह सामान्य दिखने के लिए पहले से ही परिवर्तित वितरण का कारण बनता है।αβ

  2. प्रपत्र के कार्यों नज़र काफी पहले स्थान पर सामान्य, यहां तक कि के छोटे मूल्यों के लिए अल्फा और β (बशर्ते दोनों से अधिक 1 और उनके अनुपात भी नहीं है 0 या 1 के करीब )।Φα1(x)(1Φ(x))β1αβ101

  3. रूपांतरित वितरण की स्पष्ट सामान्यता इस तथ्य के कारण है कि इसके घनत्व में एक फ़ंक्शन (2) में गुणा किए गए सामान्य घनत्व के होते हैं।

  4. के रूप में और β वृद्धि, सामान्य से प्रस्थान लॉग घनत्व के लिए एक टेलर श्रृंखला में शेष संदर्भ में मापा जा सकता है। आदेश n की अवधि α और β की ( n - 2 ) / 2 शक्तियों के अनुपात में घट जाती है । यह है कि अंततः का तात्पर्य, पर्याप्त रूप से बड़े के लिए α और β , शक्ति के सभी मामले n = 3 या अधिक से अधिक अपेक्षाकृत छोटे हो गए हैं, केवल एक द्विघात छोड़ने: जो ठीक एक सामान्य वितरण की लॉग घनत्व है।αβn(n2)/2αβαβn=3

सामूहिक रूप से, इन कार्यों अच्छी तरह से स्पष्टीकरण दें कि यहां तक कि छोटे के लिए और बीटा एक आईआईडी सामान्य नमूना नज़र लगभग सामान्य की गैर चरम quantiles।αβ


विश्लेषण

क्योंकि यह सामान्यीकरण करने के लिए उपयोगी हो सकता है, चलो हो किसी भी वितरण समारोह, हालांकि हम मन में है एफ = ΦFF=Φ

घनत्व समारोह एक बीटा की ( α , β ) चर परिभाषा के द्वारा, है, के लिए आनुपातिकg(y)(α,β)

yα1(1y)β1dy.

दे संभावना अभिन्न की परिणत हो एक्स और लेखन के व्युत्पन्न के लिए एफ , यह तत्काल है कि एक्स घनत्व आनुपातिक करने के लिएy=F(x)xfFx

G(x;α,β)=F(x)α1(1F(x))β1f(x)dx.

क्योंकि यह एक दृढ़ता से अनिमॉडल डिस्ट्रीब्यूशन (एक बीटा) का एक मोनोटोनिक रूपांतरण है, जब तक कि अजीब नहीं है , तब तक ट्रांसफॉर्म किया गया डिसिप्लिन अनिमॉडल भी होगा। यह सामान्य होने के कितने करीब है, इसका अध्ययन करने के लिए, आइए इसके घनत्व के लघुगणक की जाँच करें,F

(1)logG(x;α,β)=(α1)logF(x)+(β1)log(1F(x))+logf(x)+C

जहां सामान्यीकरण का एक अप्रासंगिक स्थिरांक है।C

के घटकों का विस्तार करें के आसपास आदेश से तीन टेलर श्रृंखला में एक मूल्य के एक्स 0 (जो एक मोड के पास हो जाएगा)। उदाहरण के लिए, हम के विस्तार लिख सकते हैं लॉग एफ के रूप मेंlogG(x;α,β)x0logF

logF(x)=c0F+c1F(xx0)+c2F(xx0)2+c3Fh3

कुछ साथ | | | x - x 0 | । के लिए एक समान संकेतन का उपयोग लॉग ( 1 - एफ ) और लॉग h|h||xx0|log(1F)logf

रेखीय शब्द

में रैखिक शब्द इस प्रकार बन जाता है(1)

g1(α,β)=(α1)c1F+(β1)c11F+c1f.

जब G का एक मोड है (x0 , यह अभिव्यक्ति शून्य है। नोट क्योंकि गुणांकों के निरंतर कार्य हैं कि एक्स 0 , के रूप में α और β अलग कर रहे हैं, मोड x 0 भी लगातार अलग अलग होंगे। इसके अलावा, एक बार α और ly पर्याप्त रूप से बड़े होते हैं, तो c f 1 शब्द अपेक्षाकृत असंगत हो जाता है। हम के रूप में सीमा का अध्ययन करने के उद्देश्य हैं अल्फा और बीटा जिसके लिए अल्फा : बीटा निरंतर अनुपात में रहता है γG(;α,β)x0αβx0αβc1fαβ α:βγ, इसलिए हम एक बार और सभी के लिए एक आधार बिंदु का चयन कर सकते हैं जिसके लिएx0

γc1F+c11F=0.

एक अच्छा मामले में जहां है , जहां α = β भर, और एफ के बारे में सममित है 0 । उस मामले में यह स्पष्ट है एक्स 0 = एफ ( 0 ) = 1 / 2γ=1α=βF0x0=F(0)=1/2

हमने एक विधि प्राप्त की है जिसके द्वारा (ए) सीमा में, टेलर श्रृंखला में पहला-ऑर्डर शब्द गायब हो जाता है और (बी) विशेष रूप से वर्णित मामले में, पहला-ऑर्डर शब्द हमेशा शून्य होता है।

द्विघात शब्द

ये योग हैं

g2(α,β)=(α1)c2F+(β1)c21F+c2f.

एक सामान्य वितरण, जिसका द्विघात शब्द है की तुलना , हमारा अनुमान है कि हो सकता है - 1 / ( 2 जी 2 ( α , β ) ) लगभग की भिन्नता है जी । आइए इसके वर्गमूल द्वारा x को rescaling करके G को मानकीकृत करें । हमें वास्तव में विवरण की आवश्यकता नहीं है; यह समझने में कठिनाई होती है कि यह पुनर्विक्रय ( x) के गुणांक को गुणा करने वाला है(1/2)(xx0)2/σ21/(2g2(α,β))GGx से टेलर विस्तार में ( - 1 / ( 2 जी 2 ( α , β ) ) ) एन / 2(xx0)n(1/(2g2(α,β)))n/2.

शेष पद

यहाँ पंचलाइन है: टेलर विस्तार में आदेश की अवधि हमारे संकेतन के अनुसार है,n

gn(α,β)=(α1)cnF+(β1)cn1F+cnf.

मानकीकरण के बाद, यह बन जाता है

gn(α,β)=gn(α,β)(2g2(α,β))n/2).

दोनों की affine संयोजन है α और β । करने के लिए विभाजक बढ़ाकर n / 2 बिजली, शुद्ध व्यवहार आदेश की है - ( n - 2 ) / 2 में से प्रत्येक में α और β । जैसा कि ये पैरामीटर बड़े होते हैं, फिर, टेलर के विस्तार में प्रत्येक शब्द के बाद दूसरा घटकर शून्य से कम हो जाता है। विशेष रूप से, तीसरे क्रम का शेष कार्यकाल मनमाने ढंग से छोटा हो जाता है।giαβn/2(n2)/2αβ

के सामान्य होने पर मामलाF

शेष अवधि का लुप्त होना विशेष रूप से तेज है जब मानक सामान्य है, क्योंकि इस मामले में एफ ( एक्स ) विशुद्ध रूप से द्विघात है: यह शेष शर्तों के लिए कुछ भी योगदान नहीं देता है। नतीजतन, का विचलन जी सामान्य से पूरी तरह से बीच विचलन पर निर्भर करता है एफ α - 1 ( 1 - एफ ) β - 1 और सामान्य।Ff(x)GFα1(1F)β1

यह विचलन यहां तक कि छोटे के लिए काफी छोटा है और β । इसे समझने के लिए, मामले पर विचार α = βजी सममित है, जहां आदेश -3 शब्द पूरी तरह से गायब हो जाता है। शेष x - x 0 = x में क्रम 4 का है । αβα=βG4xx0=x

यहाँ एक प्लॉट दिखाया गया है कि छोटे मानों के साथ मानकीकृत चौथा क्रम अवधि कैसे बदलता है :α>1

Figure

मूल्य में बाहर शुरू होता है के लिए α = β = 1 (, क्योंकि तब वितरण स्पष्ट रूप से सामान्य है Φ - 1 एक समान वितरण, जो है क्या बीटा के लिए आवेदन किया ( 1 , 1 ) है, देता है एक मानक सामान्य वितरण)। यद्यपि यह तेजी से बढ़ता है, यह 0.008 से कम पर सबसे ऊपर है - जो व्यावहारिक रूप से शून्य से अप्रभेद्य है। उसके बाद एसिम्प्टोटिक पारस्परिक क्षय अंदर हो जाता है, जिससे वितरण कभी सामान्य से अधिक हो जाता है क्योंकि α 2 से अधिक बढ़ जाता है ।0α=β=1Φ1(1,1)0.008α2


2

कन्वर्जेंस

α=βαε>0var(X)0P[|X0.5|>ε]0P[|Y|>ε]0Y वास्तव में यह वितरण में परिवर्तित होता है - सिंगलटन के लिए)।

सटीक वितरण

fXY

fY(y)=fX(Φ(y))ϕ(y).
ΦFullSimplify

यहाँ R में घनत्व है इसलिए आप इसे हिस्टोग्राम के बजाय प्लॉट कर सकते हैं।

f_y <- function(x, alpha, beta) {
  dbeta(pnorm(x), alpha, beta) * dnorm(x)
}

परिवर्तन

Z=Φ1(αX)
α=βvar(αX)1/8

1

kNk2XBeta(k,k)Y=Φ1(X)

n=2k1nU1,,UnU(1)U(n)

U(k)Beta(k,n+1k)

U(k)Beta(k,k)

nBeta(k,k)

Zi=Φ1(Ui). Then by the probability integral transform, the Zi are i.i.d. normally distributed. Also form the order statistics of the Zi (Z(1)Z(n)). Since Φ1 is strictly increasing, it follows that:

Φ1(U(k))=Z(k)

Therefore, to show that Y is approximately normal, we just have to argue that the sample median of n i.i.d. normal random variables is approximately normal.

For k large, this can be made precise by a central limit theorem for sample medians. For k small, say k=2, I will let everyone's gut feeling do the speaking.

For ab (but not too different) one can argue similarly by using corresponding quantiles.

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.