विचरण के लिए आत्मविश्वास अंतराल बनाते समय ची स्क्वायर का उपयोग क्यों किया जाता है?


15

यह एक बहुत ही बुनियादी सवाल है। हम ची वर्ग वितरण का उपयोग क्यों करते हैं? इस वितरण का अर्थ क्या है? विचलन के लिए एक विश्वास अंतराल बनाने के लिए इसका उपयोग क्यों किया जाता है?

हर जगह मैं एक स्पष्टीकरण के लिए Google बस इस तथ्य को प्रस्तुत करता है, समझाता है कि ची का उपयोग कब करना है, लेकिन यह नहीं समझा रहा है कि ची का उपयोग क्यों करना है, और यह जिस तरह से करता है वह क्यों दिखता है।

किसी के लिए बहुत धन्यवाद जो मुझे सही दिशा की ओर संकेत कर सकता है और वह है - वास्तव में यह समझना कि मैं ची का उपयोग क्यों कर रहा हूं जब मैं विचरण के लिए एक विश्वास अंतराल बना रहा हूं।


4
आप इसका उपयोग करते हैं क्योंकि - जब डेटा सामान्य होता है - Q=(n1)s2σ2χn12 । (यहQएक महत्वपूर्ण मात्राबनाता है)
Glen_b -Reateate Monica

2
आंकड़े भी देखें ।stackexchange.com/questions/15711/… और इसके लिंक।
निक कॉक्स

1
जो लोग में या आगे अनुसंधान के आवेदनों में रुचि रखते हैं χ2 , आप एक के बीच अंतर करने के लिए भुगतान करते हैं ध्यान चाहते हैं χ2 ( "ची-वर्ग") वितरण और एकχ ( "ची") वितरण (यह है वर्गमूल की जड़χ2 , अनिश्चित रूप से)।
whuber

जवाबों:


23

शीघ्र जवाब

कारण यह है कि, यह मानते हुए डेटा आईआईडी और कर रहे हैं XiN(μ,σ2) , और परिभाषित करने

X¯=NXiNS2=N(X¯Xi)2N1
जब विश्वास के अंतराल के गठन, नमूने नमूना प्रसरण (के साथ जुड़े वितरणS2!, याद है, एक यादृच्छिक चर) एक ची वर्ग वितरण (हैS2(N1)/σ2χn12), बस के रूप में नमूना नमूना मतलब के साथ जुड़े वितरण एक मानक सामान्य वितरण है () आप विचरण पता है जब, और एक टी छात्र जब तुम नहीं के साथ (( ˉ एक्स -μ)(X¯μ)n/σZ(0,1) )।(X¯μ)n/STn1

लंबा जवाब

सबसे पहले, हम साबित करेंगे कि के साथ एक ची वर्ग वितरण इस प्रकार एन - 1 स्वतंत्रता की डिग्री। उसके बाद, हम देखेंगे कि विचरण के लिए विश्वास अंतराल प्राप्त करते समय यह प्रमाण कैसे उपयोगी है, और ची-स्क्वायर वितरण कैसे प्रकट होता है (और यह इतना उपयोगी क्यों है!)। चलो शुरू करें।S2(N1)/σ2N1

सबूत

इसके लिए, शायद आपको इस विकिपीडिया लेख में ची-स्क्वायर वितरण के लिए उपयोग करना चाहिए । इस वितरण केवल एक पैरामीटर है: स्वतंत्रता, की डिग्री , और एक पल उत्पन्न फंक्शन (एमजीएफ) द्वारा दिया गया है करने के लिए होता है: मीटर χ 2 ν ( टी ) = ( 1 - 2 टी ) - ν / 2 हम दिखा सकते हैं तो इस बात का वितरण एस 2 ( एन - 1 ) / σ 2 , इस तरह एक पल के सृजन समारोह है, लेकिन साथ ν =ν

mχν2(t)=(12t)ν/2.
S2(N1)/σ2, तो हमने दिखाया है कि S 2 ( N - 1 ) /ν=N1 के साथ एक ची वर्ग वितरण इस प्रकार एन - 1 स्वतंत्रता की डिग्री। इसे दिखाने के लिए, दो तथ्यों पर ध्यान दें:S2(N1)/σ2N1
  1. यदि हम परिभाषित करते हैं, जहांजेडमैं~एन(0,1), यानी, मानक सामान्य यादृच्छिक चर, के क्षण पैदा समारोहवाईद्वारा दिया जाता है मीटर वाई (टी)

    Y=(XiX¯)2σ2=Zi2,
    ZiN(0,1)YZ2का MGF m Z 2 ( t ) द्वारा दिया गया है
    mY(t)=E[etY]=E[etZ12]×E[etZ22]×...E[etZN2]=mZi2(t)×mZ22(t)×...mZN2(t).
    Z2 जहाँ मैं मानक सामान्य, की पीडीएफ का इस्तेमाल किया है(z)=-
    mZ2(t)=f(z)exp(tz2)dz=(12t)1/2,
    और, इसलिए, मीवाई(टी)=(1-2टी) - एन / 2 , जोसंकेत मिलता है किवाईके साथ एक ची वर्ग वितरण इस प्रकारएनस्वतंत्रता की डिग्रीf(z)=ez2/2/2π
    mY(t)=(12t)N/2,
    YN
  2. यदि और Y 2 स्वतंत्र हैं और प्रत्येक ची-स्क्वायर वितरण के रूप में वितरित करता है, लेकिन ν 1 और ν 2 डिग्री स्वतंत्रता के साथ है, तो W = Y 1 + Y 2 , ν 1 + ν 2 डिग्री के साथ ची-स्क्वायर वितरण के साथ वितरित करता है। स्वतंत्रता का (यह डब्ल्यू के एमजीएफ लेने से निम्नानुसार है !)।Y1Y2ν1ν2W=Y1+Y2ν1+ν2W

N1

(N1)S2=n(X¯μ)+(Xiμ)2,
σ2
(N1)S2σ2+(X¯μ)2σ2/N=(Xiμ)2σ2.
Note that the second term in the left-side of this sum distributes as a chi-square distribution with 1 degree of freedom, and the right-hand side sum distributes as a chi-square with N degrees of freedom. Therefore, S2(N1)/σ2 distributes as a chi-square with N1 degrees of freedom.

Calculating the Confidence Interval for the variance.

When looking for a confidence interval for the variance, you want to know the limits L1 and L2 in

P(L1σ2L2)=1α.
Let's play with the inequality inside the parenthesis. First, divide by S2(N1),
L1S2(N1)σ2S2(N1)L2S2(N1).
And then remember two things: (1) the statistic S2(N1)/σ2 has a chi-squared distribution with N1 degrees of freedom and (2) the variances is always greather than zero, which implies that you can invert the inequalities, because
L1S2(N1)σ2S2(N1)S2(N1)σ2S2(N1)L1,σ2S2(N1)L2S2(N1)S2(N1)L2S2(N1)σ2,
hence, the probability we are looking for is:
P(S2(N1)L2S2(N1)σ2S2(N1)L1)=1α.
Note that S2(N1)/σ2χ2(N1). We want then,
S2(N1)L2N1pχ2(x)dx=(1α)/2   ,N1S2(N1)L1pχ2(x)dx=(1α)/2  
(we integrate up to N1 because the expected value of a chi-squared random variable with N1 degrees of freedom is N1) or, equivalently,
0S2(N1)L2pχ2(x)dx=α/2,S2(N1)L1pχ2(x)dx=α/2.
Calling χα/22=S2(N1)L2 and χ1α/22=S2(N1)L1, where the values χα/22 and χ1α/22 can be found in chi-square tables (in computers mainly!) and solving for L1 and L2,
L1=S2(N1)χ1α/22,L2=S2(N1)χα/22.
Hence, your confidence interval for the variance is
C.I.=(S2(N1)χ1α/22,S2(N1)χα/22).

1
Simply because S2 does not follow a centered chi-square distribution, while S2(N1)/σ2 does and, therefore, its easier to work with. Are you asking for a derivation for that? (i.e., you want someone to show you that S2(N1)/σ2 follows a chi-square distribution with N1 degrees of freedom?)
Néstor

4
It would be helpful to modify this answer to include the very strong but unstated assumption that the sample variance follows a chi-squared distribution when the underlying data are independent and follow a normal distribution. Unlike the theory of the distribution of the sample mean, where in practice its sampling distribution will be approximately Normal to reasonable accuracy in many situations, this same asymptotic behavior tends not to happen with the sample variance (until sample sizes become extremely large).
whuber

1
Oops. So, so true! This actually came from a problem solution that I handed out to some students, where I state on the question all these assumptions. I edited the answer now.
Néstor

1
@user34756 The reason we don't use the distribution of S2 directly is that its distribution depends on the value of a parameter. You may find it useful to investigate the use of pivotal quantities in constructing confidence intervals.
Glen_b -Reinstate Monica

1
Isn't f(z)=ez2/2 instead of f(z)=ez2 ?
Benoît Legat
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.