चि स्क्वेर्ड टेस्ट और समान अनुपात के परीक्षण के बीच क्या संबंध है?


52

मान लीजिए कि मेरे पास चार, पारस्परिक रूप से अनन्य विशेषताओं के साथ तीन आबादी है। मैं प्रत्येक आबादी से यादृच्छिक नमूने लेता हूं और उन विशेषताओं के लिए एक क्रोस्टैब या आवृत्ति तालिका का निर्माण करता हूं जो मैं माप रहा हूं। क्या मैं यह कहने में सही हूं:

  1. अगर मैं परीक्षण करना चाहता था कि क्या आबादी और विशेषताओं के बीच कोई संबंध है (उदाहरण के लिए कि क्या एक आबादी की विशेषताओं में से एक की उच्च आवृत्ति है), मुझे एक ची-स्क्वेर्ड परीक्षण चलाना चाहिए और देखना चाहिए कि परिणाम महत्वपूर्ण है या नहीं।

  2. यदि ची-स्क्वैयर परीक्षण महत्वपूर्ण है, तो यह केवल मुझे दिखाता है कि आबादी और विशेषताओं के बीच कुछ संबंध हैं, लेकिन नहीं कि वे कैसे संबंधित हैं।

  3. इसके अलावा, सभी विशेषताओं को जनसंख्या से संबंधित होने की आवश्यकता नहीं है। उदाहरण के लिए, यदि अलग-अलग आबादी में विशेषताओं ए और बी के काफी भिन्न वितरण हैं, लेकिन सी और डी के नहीं, तो ची-स्क्वेर्ड परीक्षण अभी भी महत्वपूर्ण रूप में वापस आ सकते हैं।

  4. यदि मैं यह मापना चाहता था कि कोई विशिष्ट विशेषता जनसंख्या से प्रभावित है या नहीं, तो मैं समान अनुपात में समान अनुपात के लिए एक परीक्षण चला सकता हूं (मैंने इसे एक z- परीक्षण कहा जाता है, या prop.test()में R)।

दूसरे शब्दों में, क्या prop.test()ची-वर्ग परीक्षण से यह कहना है कि दो-दो श्रेणियों के बीच संबंधों के स्वरूप को और अधिक सटीक रूप से निर्धारित करने के लिए उपयोग करना उचित है, जब कहा जाता है कि महत्वपूर्ण संबंध है?


जवाबों:


23

बहुत छोटा जवाब:

Chi-Squared परीक्षण ( chisq.test()R में) एक आकस्मिक तालिका की प्रत्येक श्रेणी में अपेक्षित आवृत्तियों के साथ देखे गए आवृत्तियों की तुलना करता है (सीमांत आवृत्तियों के उत्पाद के रूप में गणना की जाती है)। यह निर्धारित करने के लिए उपयोग किया जाता है कि क्या मनाया और अपेक्षित गणनाओं के बीच विचलन बहुत बड़ा है कि मौका के लिए जिम्मेदार ठहराया जा सकता है। अवशिष्टों का निरीक्षण करके आज़ादी से प्रस्थान आसानी से जांचा जाता है ( ?mosaicplotया कोशिश करें ?assocplot, लेकिन vcdपैकेज को भी देखें )। fisher.test()एक सटीक परीक्षण (हाइपरजोमेट्रिक वितरण पर निर्भर) के लिए उपयोग करें ।

prop.test()R में फ़ंक्शन यह परीक्षण करने की अनुमति देता है कि क्या अनुपात समूहों के बीच तुलनीय है या सैद्धांतिक संभावनाओं से भिन्न नहीं है। इसे एक -est के रूप में जाना जाता है क्योंकि परीक्षण आँकड़ा इस तरह दिखता है:z

z=(f1f2)p^(1p^)(1n1+1n2)

जहाँ , और सूचकांक आपकी तालिका की पहली और दूसरी पंक्ति को संदर्भित करता है। दो-तरफ़ा आकस्मिक तालिका में जहां , इससे साधारण परीक्षण के लिए तुलनीय परिणाम प्राप्त होने चाहिए :(1,2)एच0:पी^=(पी1+पी2)/(n1+n2)(1,2)χ 2एच0:पी1=पी2χ2

> tab <- matrix(c(100, 80, 20, 10), ncol = 2)
> chisq.test(tab)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476

> prop.test(tab)

    2-sample test for equality of proportions with continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476
alternative hypothesis: two.sided 
95 percent confidence interval:
 -0.15834617  0.04723506 
sample estimates:
   prop 1    prop 2 
0.8333333 0.8888889 

आर के साथ असतत डेटा के विश्लेषण के लिए, मैं लौरा थॉम्पसन से आर (और एस-प्लस) मैनुअल को एकोम्पेनी एगेस्टी के श्रेणीबद्ध डेटा विश्लेषण (2002) के लिए सलाह देता हूं ।


2
क्या परीक्षण का एक सामान्य नाम है जो Prop.test () करता है?
एटिकस २

2
"इसे जेड-टेस्ट के रूप में जाना जाता है"।
रसेलपाइरेसी

@chl मैं थोड़ा उलझन में हूँ - मैंने सोचा prop.testऔर chisq.testदोनों ची-स्क्वायर का उपयोग करते हैं, जो समान पी मानों की व्याख्या करेगा, साथ ही साथ आर-ब्लॉगर्स पर इस पोस्ट में उनके पास अपने स्वयं के तदर्थ फ़ंक्शन क्यों हैं।
एंटनी परेला

@ एटोन्टी हां, यह वही है जो कीथ ने अपने जवाब में समझाया।
chl

3
whats और , , , , ? एन 2 एफ 1 एफ 2 पी 1 पी 2n1n212पी1पी2
तोमका

23

zपी

α

α

अनुपात की समानता के लिए सबसे शक्तिशाली परीक्षण को श्रेष्ठता के लिए बरनार्ड का परीक्षण कहा जाता है ।


@gung मैं थोड़ा उलझन में हूँ - मैंने सोचा prop.testऔर chisq.testदोनों ची-स्क्वायर का उपयोग करते हैं, जो समान पी मानों की व्याख्या करेगा, साथ ही साथ आर-ब्लॉगर्स पर इस पोस्ट में उनके पास अपने स्वयं के तदर्थ फ़ंक्शन क्यों हैं।
एंटोनी परेलाडा

मुझे समझ नहीं आ रहा है कि आप क्या भ्रमित कर रहे हैं, @AntoniParellada यह उत्तर बताता है कि वे "बिल्कुल समान" हैं, जो समझ में आता है कि क्या "दोनों ची-स्क्वायर का उपयोग करते हैं"।
गंग - मोनिका

मूल उत्तर chl में @gung बताता है कि prop.test()... को एक विरोधाभास के रूप में z- परीक्षण के रूप में संदर्भित किया जाता है chisq.test()। बाद में कीथ कहते हैं, "दो अनुपातों की समानता के लिए एक ची-स्क्वायर परीक्षण बिल्कुल जेड-टेस्ट के समान है। (इस कारण @chl को दोनों परीक्षणों के साथ समान पी-मूल्य प्राप्त होता है।"
एंटोनी पारेस्लिग

1
ऐसा लगता है कि यह एक अचूक निशानेबाजी है, @AntoniParellada। वैचारिक रूप से, 2 परीक्षण अलग-अलग हैं, जो कि मैंने अपने अन्य उत्तर में चर्चा की है जो आपने देखा था। लेकिन गणितीय रूप से, वे समकक्ष हैं। वास्तव में, मेरा मानना ​​है कि आर फ़ंक्शन prop.test()वास्तव में कॉल करता है chisq.test()और आउटपुट को अलग तरीके से प्रिंट करता है।
गूँग - मोनिका

@ गुंग मैं आर-ब्लॉगर्स के समान एक समारोह में काम कर रहा था और मैं अपने शुरुआती स्तर पर लोगों के लिए एक पोस्ट बनाने जा रहा था, जो कि आपके द्वारा लिखी गई कुछ प्रमुख अवधारणाओं के बारे में वास्तव में उद्धृत करते हुए, गणित के माध्यम से दोनों के लिए चल रहा है। वर्ग और z- परीक्षण, और फिर आर कोड दे रहा है।
एंटोनी परेला
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.