गामा वितरण और सामान्य वितरण के बीच संबंध


26

मैंने हाल ही में सामान्य के साथ एक सामान्य यादृच्छिक चर के वर्ग के लिए एक पीडीएफ प्राप्त करना आवश्यक पाया। 0. जो भी कारण के लिए, मैंने पहले से विचरण को सामान्य करने के लिए नहीं चुना। अगर मैंने इसे सही ढंग से किया है तो यह pdf इस प्रकार है:

एन2(एक्स;σ2)=1σ2πएक्स-एक्स2σ2

मैंने देखा कि यह वास्तव में एक गामा वितरण का एक समरूपता था:

एन2(एक्स;σ2)=गामा(एक्स;12,2σ2)

और फिर, इस तथ्य से कि दो गामा (समान स्केल पैरामीटर के साथ) एक और गामा के बराबर है, यह निम्नानुसार है कि गामा वर्ग के सामान्य यादृच्छिक चर के योग के बराबर है ।कश्मीर

एनΣ2(एक्स;कश्मीर,σ2)=गामा(एक्स;कश्मीर2,2σ2)

यह मेरे लिए थोड़ा आश्चर्यजनक था। भले ही मैं χ2 वितरण जानता था - चुकता मानक सामान्य आरवी के योग का एक वितरण - गामा का एक विशेष मामला था, मुझे नहीं पता था कि गामा अनिवार्य रूप से सामान्य के योग के लिए अनुमति देने वाला सामान्यीकरण था किसी भी विचरण के यादृच्छिक चर । यह उन अन्य चरित्रों की ओर भी ले जाता है जो मैं पहले नहीं आया था, जैसे कि घातीय वितरण दो वर्ग के सामान्य वितरण के योग के बराबर।

यह सब मेरे लिए कुछ रहस्यमय है। क्या सामान्य वितरण गामा वितरण की व्युत्पत्ति के लिए मौलिक है, जिस तरीके से मैंने ऊपर उल्लिखित किया है? मैंने जिन अधिकांश संसाधनों की जाँच की, उनमें यह उल्लेख नहीं है कि दो वितरण इस तरह से आंतरिक रूप से संबंधित हैं, या यहां तक ​​कि इस बात के लिए भी वर्णन किया गया है कि गामा कैसे व्युत्पन्न होता है। इससे मुझे लगता है कि कुछ निचले स्तर का सच खेलने में है जिसे मैंने केवल एक जटिल तरीके से उजागर किया है?


6
संभावना सिद्धांत पर कई स्नातक पाठ्यपुस्तकों में उपरोक्त सभी परिणामों का उल्लेख है; लेकिन शायद सांख्यिकी ग्रंथ इन विचारों को कवर नहीं करते हैं? किसी भी स्थिति में, एक यादृच्छिक चर सिर्फ जहां एक मानक सामान्य यादृच्छिक चर है, और इसलिए (iid चर के लिए) केवल एक स्केल किया गया यादृच्छिक चर उन लोगों के लिए आश्चर्यजनक नहीं है जिन्होंने संभावना सिद्धांत का अध्ययन किया है। एन(0,σ2)Yमैंσएक्समैंएक्समैंΣमैंYमैं2=σ2Σमैंएक्समैं2 χ2
दिलीप सरवटे

मैं कंप्यूटर विज़न बैकग्राउंड से हूं इसलिए आमतौर पर प्रायिकता सिद्धांत का सामना नहीं करते हैं। मेरी कोई भी पाठ्यपुस्तक (या विकिपीडिया) इस व्याख्या का उल्लेख नहीं करती है। मुझे लगता है कि मैं यह भी पूछ रहा हूं कि दो सामान्य वितरणों के वर्ग के योग के बारे में क्या खास है जो इसे प्रतीक्षा समय (यानी घातीय वितरण) के लिए एक अच्छा मॉडल बनाता है। यह अभी भी लगता है जैसे मैं कुछ गहरा याद कर रहा हूँ।
टाइमसीज

3
चूंकि विकिपीडिया chi-squared वितरण को en.wikipedia.org/wiki/Chi-squared_distribution#Definition पर स्क्वायर्ड नॉर्मल के योग के रूप में परिभाषित करता है और ची-वर्ग का उल्लेख गामा ( en.wikipedia.org/wiki पर) का एक विशेष मामला है। / Gamma_distribution # अन्य ), कोई भी इन दावों के बारे में अच्छी तरह से दावा कर सकता है कि वे अच्छी तरह से नहीं जानते हैं। विचरण ही सभी मामलों में माप की इकाई (एक स्केल पैरामीटर) की स्थापना करता है और इसलिए कोई अतिरिक्त जटिलता का परिचय नहीं देता है।
whuber

3
हालांकि ये परिणाम संभाव्यता और आंकड़ों के क्षेत्र में अच्छी तरह से जाना जाता है, अच्छी तरह से आप @timxyz के लिए उन्हें अपने विश्लेषण में rediscovering के लिए किया है।
मोनिका

कनेक्शन रहस्यमय नहीं है, यह इसलिए है क्योंकि वे वितरण संपत्ति के घातीय परिवार के सदस्य हैं, जिनमें से यह है कि वे चर और / या मापदंडों के प्रतिस्थापन द्वारा आ सकते हैं। उदाहरणों के साथ नीचे उत्तर देखें।
कार्ल

जवाबों:


18

प्रो। सरवटे की टिप्पणी के अनुसार, चुकता सामान्य और ची-वर्ग के बीच संबंध एक बहुत व्यापक रूप से फैला हुआ तथ्य है - क्योंकि यह भी तथ्य होना चाहिए कि ची-स्क्वायर गामा वितरण का सिर्फ एक विशेष मामला है:

XN(0,σ2)X2/σ2χ12X2σ2χ12=Gamma(12,2σ2)

गामा की स्केलिंग संपत्ति से निम्नलिखित अंतिम समानता।

घातांक के साथ संबंध के संबंध में, सटीक होने के लिए यह दो वर्ग शून्य-औसत मानदंडों का योग है जो प्रत्येक को दूसरे के विचरण द्वारा बढ़ाया जाता है, जो घातांक वितरण की ओर जाता है:

X1N(0,σ12),X2N(0,σ22)X12σ12+X22σ22χ22σ22X12+σ12X22σ12σ22χ22

σ22X12+σ12X22σ12σ22χ22=Gamma(1,2σ12σ22)=Exp(12σ12σ22)

लेकिन संदेह यह है कि दो चौकों वाले शून्य माध्य मानदंडों के योग में "कुछ विशेष" या "गहरा" है जो "उन्हें प्रतीक्षा समय के लिए एक अच्छा मॉडल बनाता है" निराधार है: सबसे पहले, घातांक वितरण के बारे में क्या खास है: यह "प्रतीक्षा समय" के लिए एक अच्छा मॉडल है? बेशक स्मृतिहीनता है, लेकिन क्या यहां कुछ "गहरा" है, या बस घातीय वितरण समारोह का सरल कार्यात्मक रूप है, और के गुण हैं ? अद्वितीय गुण गणित के चारों ओर बिखरे हुए हैं, और अधिकांश समय, वे कुछ "गहन अंतर्ज्ञान" या "संरचना" को प्रतिबिंबित नहीं करते हैं - वे बस मौजूद हैं (शुक्र है)।e

दूसरा, एक चर का वर्ग अपने स्तर के साथ बहुत कम संबंध रखता है। बस को मानें, कहें, [ - 2 ,f(x)=x :[2,2]

यहाँ छवि विवरण दर्ज करें

... या ची-स्क्वायर घनत्व के खिलाफ मानक सामान्य घनत्व को ग्राफ करें: वे पूरी तरह से अलग स्टोकेस्टिक व्यवहारों को दर्शाते हैं और प्रतिनिधित्व करते हैं, भले ही वे इतने अंतरंग रूप से संबंधित हों, क्योंकि दूसरा एक चर का घनत्व है जो पहले का वर्ग है। सामान्य गणितीय प्रणाली का एक बहुत महत्वपूर्ण स्तंभ हो सकता है जिसे हमने स्टोकेस्टिक व्यवहार को विकसित करने के लिए विकसित किया है - लेकिन एक बार जब आप इसे वर्ग करते हैं, तो यह पूरी तरह से कुछ और बन जाता है।


मेरे अंतिम पैराग्राफ में विशेष रूप से प्रश्नों को संबोधित करने के लिए धन्यवाद।
टिम्सीज़

2
आपका स्वागत है। मुझे स्वीकार करना होगा कि मुझे खुशी है कि प्रश्न के पोस्ट होने के 26 महीने बाद मेरा जवाब मूल ओपी पर पहुंच गया।
एलेकोस पापाडोपोलोस 21

11

हमें इस प्रश्न का उत्तर दें, यह सब कुछ मेरे लिए रहस्यमय है। क्या सामान्य वितरण गामा वितरण की व्युत्पत्ति के लिए मूलभूत है ...? वास्तव में कोई रहस्य नहीं है, बस इतना है कि सामान्य वितरण और गामा वितरण सदस्य हैं, वितरण के घातीय परिवार के अन्य लोगों के बीच , जो परिवार मापदंडों और / या चर के प्रतिस्थापन द्वारा समान रूपों के बीच परिवर्तित करने की क्षमता से परिभाषित होता है। परिणामस्वरूप, वितरण के बीच प्रतिस्थापन द्वारा कई रूपांतरण होते हैं, जिनमें से कुछ को नीचे दिए गए आंकड़े में संक्षेप में प्रस्तुत किया गया है।

यहाँ छवि विवरण दर्ज करेंलेमिस, लॉरेंस एम।; जैक्विलेन टी। MCQUESTON (फरवरी 2008)। "अविभाजित वितरण संबंध" (पीडीएफ)। अमेरिकी सांख्यिकीविद्। 62 (1): 45–53। doi: 10.1198 / 000313008x270448 उद्धृत

यहां दो सामान्य और गामा वितरण संबंध अधिक विस्तार से हैं (दूसरों की अज्ञात संख्या में, जैसे कि ची-स्क्वेर्ड और बीटा के माध्यम से)।

पहला गामा वितरण (जीडी) और सामान्य वितरण (एनडी) के बीच अधिक शून्य संबंध के साथ एक और सीधा संबंध है। सीधे शब्दों में, जीडी आकार में सामान्य हो जाता है क्योंकि इसके आकार के पैरामीटर को बढ़ाने की अनुमति है। साबित करना कि मामला अधिक कठिन है। जीडी के लिए,

GD(z;a,b)={baza1ezbΓ(a)z>00other.

जीडी आकार के रूप में पैरामीटर , जी.डी. आकार, अधिक सममित और सामान्य हो जाता है हालांकि, वृद्धि के साथ बढ़ जाती है मतलब के रूप में एक है, हम बाईं बदलाव के द्वारा जी.डी. है ( एक - 1 ) aaयह स्थिर पकड़ करने के लिए, और अंत में, अगर हम हमारे स्थानांतरित कर दिया जीडी के लिए एक ही मानक विचलन बनाए रखने के लिए चाहते हैं, हम पैमाने पैरामीटर (कम करने के लिए है) आनुपातिक करने के लिए(a1)1akb1a

kb=1akz=(a1)1ak+x .

GD((a1)1ak+x; a, 1ak)={(ka)aeaxka+1((a1)ka+x)a1Γ(a)x>k(1a)a0other.

axa of the reparameterized GD, we find

lima(ka)aeaxka+1((a1)ka+x)a1Γ(a)=ex22k22πk=ND(x;0,k2)

Graphically for k=2 and a=1,2,4,8,16,32,64 the GD is in blue and the limiting ND(x;0, 22) is in orange, below

enter image description here

Second Let us make the point that due to the similarity of form between these distributions, one can pretty much develop relationships between the gamma and normal distributions by pulling them out of thin air. To wit, we next develop an "unfolded" gamma distribution generalization of a normal distribution.

Note first that it is the semi-infinite support of the gamma distribution that impedes a more direct relationship with the normal distribution. However, that impediment can be removed when considering the half-normal distribution, which also has a semi-infinite support. Thus, one can generalize the normal distribution (ND) by first folding it to be half-normal (HND), relating that to the generalized gamma distribution (GD), then for our tour de force, we "unfold" both (HND and GD) to make a generalized ND (a GND), thusly.

The generalized gamma distribution

GD(x;α,β,γ,μ)={γe(xμβ)γ(xμβ)αγ1βΓ(α)x>μ0other,

Can be reparameterized to be the half-normal distribution,

GD(x;12,πθ,2,0)={2θeθ2x2ππx>00other=HND(x;θ)

Note that θ=πσ2. Thus,

ND(x;0,σ2)=12HND(x;θ)+12HND(x;θ)=12GD(x;12,πθ,2,0)+12GD(x;12,πθ,2,0),

which implies that

GND(x;μ,α,β)=12GD(x;1β,α,β,μ)+12GD(x;1β,α,β,μ)=βe(|xμ|α)β2αΓ(1β),

is a generalization of the normal distribution, where μ is the location, α>0 is the scale, and β>0 is the shape and where β=2 yields a normal distribution. It includes the Laplace distribution when β=1. As β, the density converges pointwise to a uniform density on (μα,μ+α). Below is the generalized normal distribution plotted for α=π2,β=1/2,1,4 in blue with the normal case α=π2,β=2 in orange.

enter image description here

The above can be seen as the generalized normal distribution Version 1 and in different parameterizations is known as the exponential power distribution, and the generalized error distribution, which are in turn one of several other generalized normal distributions.


2

The derivation of the chi-squared distribution from the normal distribution is much analogous to the derivation of the gamma distribution from the exponential distribution.

We should be able to generalize this:

  • If the Xi are independent variables from a generalized normal distribution with power coefficient m then Y=inXim can be related to some scaled Chi-squared distribution (with "degrees of freedom" equal to n/m).

The analogy is as following:

Normal and Chi-squared distributions relate to the sum of squares

  • The joint density distribution of multiple independent standard normal distributed variables depends on xi2
    f(x1,x2,...,xn)=exp(0.5i=1nxi2)(2π)n/2

  • If XiN(0,1)

    then i=1nXi2χ2(ν)

Exponential and gamma distributions relate to the regular sum

  • The joint density distribution of multiple independent exponential distributed variables depends on xi

    f(x1,x2,...,xn)=exp(λi=1nxi)λn

  • If XiExp(λ)

    then i=1nXiGamma(n,λ)


The derivation can be done by a change of variables integrating not over all x1,x2,...xn but instead only over the summed term (this is what Pearson did in 1900). This unfolds very similar in both cases.

For the χ2 distribution:

fχ2(n)(s)ds=es/2(2π)n/2dVdsds=es/2(2π)n/2πn/2Γ(n/2)sn/21ds=12n/2Γ(n/2)sn/21es/2ds

Where V(s)=πn/2Γ(n/2+1)sn/2 is the n-dimensional volume of an n-ball with squared radius s.

For the gamma distribution:

fG(n,λ)(s)ds=eλsλndVdsds=eλsλnnsn1n!ds=λnΓ(n)sn1eλsds

Where V(s)=snn! is the n-dimensional volume of a n-polytope with xi<s.


The gamma distribution can be seen as the waiting time Y for the n-th event in a Poisson process which is the distributed as the sum of n exponentially distributed variables.

As Alecos Papadopoulos already noted there is no deeper connection that makes sums of squared normal variables 'a good model for waiting time'. The gamma distribution is the distribution for a sum of generalized normal distributed variables. That is how the two come together.

But the type of sum and type of variables may be different. While the gamma distribution, when derived from the exponential distribution (p=1), gets the interpretation of the exponential distribution (waiting time), you can not go reverse and go back to a sum of squared Gaussian variables and use that same interpretation.

The density distribution for waiting time which falls of exponentially, and the density distribution for a Gaussian error falls of exponentially (with a square). That is another way to see the two connected.

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.