किस स्तर पर एक है


15

पृष्ठभूमि: सुरक्षित रूप से छोड़ें - यह यहाँ संदर्भ के लिए है, और प्रश्न को वैध बनाने के लिए।

इस पत्र का उद्घाटन पढ़ता है:

"कार्ल पियर्सन की प्रसिद्ध ची-वर्ग आकस्मिक परीक्षण एक और आंकड़ा से ली गई है, z आंकड़ा कहा जाता है, सामान्य वितरण पर आधारित। का सबसे सरल संस्करण χ2 गणितीय बराबर z परीक्षण के समान होना दिखाया जा सकता है। परीक्षण एक ही परिणाम का उत्पादन सभी परिस्थितियों में। सभी इरादों और उद्देश्यों के लिए "ची-चुकता" "z-वर्ग" कहा जा सकता। के महत्वपूर्ण मूल्यों χ2 स्वतंत्रता से एक डिग्री के लिए जेड की इसी महत्वपूर्ण मानों के वर्ग हैं। "

यह CV ( यहां , यहां , यहां और अन्य) में कई बार जोर दिया गया है ।

और वास्तव में हम कर सकते हैं साबित है कि के बराबर हैएक्स2के साथएक्स~एन(χ1df2X2 :XN(0,1)

आइए कहते हैं कि और कहा कि वाई = एक्स 2 और के घनत्व को खोजने वाई का उपयोग करके XN(0,1)Y=X2Y विधि:cdf

। समस्या यह है कि हम सामान्य वितरण के घनत्व को करीब से एकीकृत नहीं कर सकते हैं। लेकिन हम इसे व्यक्त कर सकते हैं:p(Yy)=p(X2y)=p(yxy)

व्युत्पन्न लेना:

FX(y)=FX(y)FX(y).

fX(y)=FX(y)12y+FX(y)12y.

चूंकि सामान्य के मान सममित हैं:pdf

। को यह equatingपीडीएफके सामान्य (अबएक्समेंपीडीएफहो जाएगाfX(y)=FX(y)1ypdfxpdf कोe - x 2 में प्लग किया जाना हैyसामान्यpd dfका 2 भाग); और शामिल करने के लिए याद रखना1ex22pdf अंत में:1y

fX(y)=FX(y)1y=12πey21y=12πey2y121

चि वर्ग के पीडीएफ की तुलना करें:

fX(x)=12ν/2Γ(ν2)ex2xν21

चूंकि , के लिए1df, हम वास्तव में ली गई हैपीची वर्ग की।Γ(1/2)=π1pdf

इसके अलावा, अगर हम फ़ंक्शन को कॉल prop.test()आर में हम एक ही लागू कर रहे हैं परीक्षण के रूप में अगर हम पर फैसला ।χ2chisq.test()

प्रश्न:

इसलिए मुझे ये सभी बिंदु मिलते हैं, फिर भी मुझे नहीं पता कि वे इन दो परीक्षणों के वास्तविक कार्यान्वयन के लिए दो कारणों से कैसे लागू होते हैं:

  1. एक z- परीक्षण चुकता नहीं है।

  2. वास्तविक परीक्षण आँकड़े पूरी तरह से अलग हैं:

Of 2 के लिए परीक्षण-आँकड़ाχ2 का मूल्य है:

कहाँχ2=i=1n(OiEi)2Ei=Ni=1npi(Oi/Npipi)2

= पियरसन का संचयी परीक्षण आँकड़ा, जो विषम रूप से distribution 2 वितरण सेसंपर्क करता है। i = प्रकार i के अवलोकनों की संख्या; एन = टिप्पणियों की कुल संख्या; E i = N p i = प्रकार की अपेक्षित (सैद्धांतिक) आवृत्ति i , अशक्त परिकल्पना द्वारा दावा किया गया किजनसंख्या में टाइप I का अंश p i है ; n = तालिका में कोशिकाओं की संख्या।χ2χ2OiiNEiNpiiipin

दूसरी ओर, एक के लिए परीक्षण आंकड़ा -Test है:z

के साथपी=एक्स1Z=x1n1x2n2p(1p)(1/n1+1/n2) , जहांx1औरx2"सफलताओं" की संख्या है, श्रेणीगत चर के प्रत्येक एक में विषयों की संख्या से अधिक है, अर्थातn1औरn2p=x1+x2n1+n2x1x2n1n2

यह सूत्र द्विपद वितरण पर निर्भर करता है।

इन दो परीक्षण आंकड़े स्पष्ट रूप से अलग हैं, और विभिन्न परिणामों की वास्तविक परीक्षा आँकड़ों के लिए, साथ ही साथ के लिए में परिणाम पी -values : 5.8481के लिए और z के परीक्षण के लिए है, जहां 2.4183 2 = ५.८४,८१७ (धन्यवाद, @ mark999 )। पी के लिए -value χ 2 परीक्षा है , जबकि z-परीक्षा है के लिए, । अंतर दो-पूंछ बनाम एक-पूंछ द्वारा समझाया गया: 0.01559 / 2 = 0.007795 (साभार @amoeba)।χ22.41832.41832=5.84817χ20.015590.00770.01559/2=0.007795

तो हम किस स्तर पर कहते हैं कि वे एक हैं और एक ही हैं?


But these are two identical tests. Z squared is the chi-square statistic. Let you have 2x2 frequency table where columns are the two groups and the rows are "success" and "failure". Then the so called expected frequencies of the chi-square test in a given column is the weighted (by the groups' N) average column (group) profile multiplied by that group's N. Thus, it comes that chi-square tests the deviation of each of the two groups profiles from this average group profile, - which is equivalent to testing the groups' profiles difference from each other, the z-test of proportions.
ttnphns

In the example on the last hyperlink the χ2 is almost the square of the z-test statistic, but not quite, and the p-values are different. Also, when you look at the formulas for the rest statistics above, is it truly immediate that they are identical? Or even one the square of the other?
Antoni Parellada

2
In chisq.test(), have you tried using correct=FALSE?
mark999

1
Indeed, Antoni. Both tests exist with or without the Yates. Could it be that you compute one with but the other without it?
ttnphns

1
Thank you! You were (predictably) correct. With the Yates correction off, one is just the square of the other. I edited the question accordingly, although a bit fast. I still would like to prove algebraically that both test statistics are the same (or one the square of the other), and understand why the p-values are different.
Antoni Parellada

जवाबों:


12

Let us have a 2x2 frequency table where columns are two groups of respondents and rows are the two responses "Yes" and "No". And we've turned the frequencies into the proportions within group, i.e. into the vertical profiles:

      Gr1   Gr2  Total
Yes   p1    p2     p
No    q1    q2     q
      --------------
     100%  100%   100%
      n1    n2     N

The usual (not Yates corrected) χ2 of this table, after you substitute proportions instead of frequencies in its formula, looks like this:

n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(p1p)2+n2(p2p)2pq.

Remember that p=n1p1+n2p2n1+n2, the element of the weighted average profile of the two profiles (p1,q1) and (p2,q2), and plug it in the formula, to obtain

...=(p1p2)2(n12n2+n1n22)pqN2

Divide both numerator and denominator by the (n12n2+n1n22) and get

(p1p2)2pq(1/n1+1/n2)=Z2,

the squared z-statistic of the z-test of proportions for "Yes" response.

Thus, the 2x2 homogeneity Chi-square statistic (and test) is equivalent to the z-test of two proportions. The so called expected frequencies computed in the chi-square test in a given column is the weighted (by the group n) average vertical profile (i.e. the profile of the "average group") multiplied by that group's n. Thus, it comes out that chi-square tests the deviation of each of the two groups profiles from this average group profile, - which is equivalent to testing the groups' profiles difference from each other, which is the z-test of proportions.

This is one demonstration of a link between a variables association measure (chi-square) and a group difference measure (z-test statistic). Attribute associations and group differences are (often) the two facets of the same thing.


(Showing the expansion in the first line above, By @Antoni's request):

n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(p1p)2qpq+n1(q1q)2ppq+n2(p2p)2qpq+n2(q2q)2ppq=n1(p1p)2(1p)+n1(1p11+p)2p+n2(p2p)2(1p)+n2(1p21+p)2ppq=n1(p1p)2(1p)+n1(pp1)2p+n2(p2p)2(1p)+n2(pp2)2ppq=[n1(p1p)2][(1p)+p]+[n2(p2p)2][(1p)+p]pq=n1(p1p)2+n2(p2p)2pq.


@ttnphs This is great! Any chance you could clarify the intermediate step in the first equation (χ2) formula - I don't see how the q's go away after the equal sign.
Antoni Parellada

@ttnphs When I expand it I get n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(q(p2+p(2p12q1+p12)+p(q2+q12)pq)+n2(q(p2+p(2p22q2)+p22)+p(q2+q22)pq)
Antoni Parellada

@ttnphs ... Or some reference so it's less work to type the latex... And I'll promptly and happily 'accept' the answer...
Antoni Parellada

@Antoni, expansion inserted.
ttnphns

@ttnphns Awesome!
Antoni Parellada
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.