McNemar का परीक्षण ची-स्क्वायर का उपयोग क्यों करता है और सामान्य वितरण का नहीं?


11

मैंने अभी देखा कि कैसे गैर-सटीक मैकनेमर के परीक्षण में ची स्क्वेयर एसिम्प्टोटिक वितरण का उपयोग किया जाता है। लेकिन चूंकि सटीक परीक्षण (दो मामले तालिका के लिए) द्विपद वितरण पर निर्भर करता है, इसलिए कैसे आना सामान्य है कि द्विपद वितरण के लिए सामान्य सन्निकटन का सुझाव देना आसान नहीं है?

धन्यवाद।

जवाबों:


15

एक सहज ज्ञान युक्त उत्तर:

तालिका को देखते हुए मैकनेमर परीक्षण के सूत्र पर करीब से नज़र डालें

      pos | neg
----|-----|-----
pos |  a  |  b
----|-----|-----
neg |  c  |  d

McNemar आँकड़ा इस प्रकार Mहै:

M=(bc)2b+c

स्वतंत्रता की k डिग्री के साथ a वितरण की परिभाषा यह है कि इसमें k स्वतंत्र मानक सामान्य चर के वर्गों का योग है । यदि 4 संख्याएं पर्याप्त बड़ी हैं, और , और इस प्रकार और एक सामान्य वितरण द्वारा अनुमानित की जा सकती हैं। एम के फार्मूले को देखते हुए, यह आसानी से देखा जाता है कि बड़े पर्याप्त मूल्यों के साथ वास्तव में लगभग 1 डिग्री स्वतंत्रता के साथ वितरण का पालन होगा ।χ 2χ2bcb-cb+cMχ2


संपादित करें: जैसा कि सही संकेत दिया गया है, सामान्य सन्निकटन वास्तव में पूरी तरह से समतुल्य है। इसके बजाय b-cसामान्य वितरण द्वारा सन्निकटन का उपयोग करते हुए तर्क दिया गया है ।

सटीक द्विपद संस्करण भी संकेत परीक्षण के बराबर है कि इस संस्करण में द्विपद बंटन तुलना करने के लिए इस्तेमाल किया जाता है, इस अर्थ में bकरने के लिए । या हम कह सकते हैं कि शून्य परिकल्पना के तहत बी का वितरण द्वारा अनुमानित किया जा सकता है ।N ( 0.5 × ( b + c ) , 0.5 2 × ( b + c )Binom(b+c,0.5)N(0.5×(b+c),0.52×(b+c)

या, समकक्ष:

b(b+c2)b+c2N(0,1)

जो सरल करता है

bcb+cN(0,1)

या, जब दोनों तरफ वर्ग को पर ले जाया जाए ।Mχ12

इसलिए, सामान्य सन्निकटन का उपयोग किया जाता है। यह सन्निकटन के समान है।χ2


3
ये सही है। कनेक्शन शायद Sqrt (M) = (bc) / Sqrt (b + c) पर विचार करके अधिक स्पष्ट रूप से देखा जा सकता है। B के b के रूप में भिन्नता और c के c के रूप में (जैसा कि सामान्य रूप से गिने गए डेटा के साथ सामान्य है) के बारे में, हम देखते हैं कि Sqrt (M) लगभग मानक विचलन (bc) जैसा दिखता है जो इसके मानक विचलन द्वारा विभाजित है: दूसरे शब्दों में, यह मानक सामान्य चर की तरह दिखता है । वास्तव में, हम Sqrt (M) को मानक सामान्य वितरण की तालिका में संदर्भित करके एक समकक्ष परीक्षण कर सकते हैं। इसे प्रभावी ढंग से चुकाने से परीक्षण सममित दो-पूंछ बनाता है। स्पष्ट रूप से यह टूट जाता है यदि बी या सी छोटा है।
whuber

सहज उत्तर जोरीस के लिए धन्यवाद। फिर भी, McNemar के सटीक द्विपद परीक्षण के लिए सामान्य सन्निकटन का उपयोग करने के बजाय इस सन्निकटन का उपयोग करना अधिक सामान्य क्यों है?
ताल गैली

@ ताल: यह वही है। नॉन स्टॉप उत्तर और मेरा संपादन देखें।
जोरिस मेव्स

असल में - आखिरी सवाल। इसलिए यदि दोनों समान हैं (और मुझे लगता है कि आपको ई.पू. फायदा कहां है?
ताल गलिली

1
@ ताल: आप जानते हैं कि आर। Chi2 को एक डिग्री की स्वतंत्रता के साथ प्लॉट करें, आप देखेंगे।
जोरिस मेव्स

8

क्या दोनों दृष्टिकोण एक ही बात पर नहीं आएंगे? प्रासंगिक ची-स्क्वायर वितरण में एक डिग्री की स्वतंत्रता है इसलिए बस मानक सामान्य वितरण के साथ यादृच्छिक चर के वर्ग का वितरण है। मुझे जाँच करने के लिए बीजगणित से गुज़रना होगा, जिसे मुझे अभी करने का समय नहीं मिला है, लेकिन मुझे आश्चर्य होगा कि यदि आप दोनों ही तरीकों से एक ही उत्तर के साथ समाप्त नहीं होते हैं।


आगे विस्तार के लिए मेरा उत्तर देखें
जोरिस मेव्स

हाय onestop - चूंकि दोनों स्पर्शोन्मुख हैं, तो छोटे N के लिए वे कुछ अलग परिणाम दे सकते हैं। ऐसे मामले में, मुझे आश्चर्य है कि अगर ची-स्क्वायर के साथ जाने का विकल्प है क्योंकि यह बेहतर है तो सामान्य सन्निकटन, या ऐतिहासिक कारणों के कारण (या हो सकता है, जैसा कि आपने सुझाव दिया है - वे हमेशा समान परिणाम देते हैं)
ताल गैली

@ ताल: छोटे एन के लिए, दोनों में से कोई भी नहीं। और जैसा कि मेरे संपादन में दिखाया गया है, वे बिलकुल एक जैसे हैं।
जोरिस मेव्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.