जोड़ा गया डेटा पर फिशर सटीक परीक्षण


9

दिया हुआ 40 फेफड़े के कैंसर के मामले और 40मिलान नियंत्रण (फेफड़ों के कैंसर के बिना) (उम्र, लिंग, आदि के आधार पर मिलान)। फेफड़ों के कैंसर पर धूम्रपान के प्रभाव के बीच सबूत खोजने की कोशिश करने के लिए, मैंने आकस्मिक टेबल पर फिशर के सटीक परीक्षण का उपयोग किया। हालांकि यह ध्यान में नहीं आया कि नियंत्रण और मामलों का मिलान किया गया था।

इसलिए मैंने सोचा कि क्या फिशर के सटीक परीक्षण का उपयोग करने का एक तरीका है जो दो समूहों के बीच मिलान को ध्यान में रखता है?

जवाबों:


8

आपको McNemar के परीक्षण ( http://en.wikipedia.org/wiki/McNemar%27s_test , http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3346204 ) की आवश्यकता है। निम्नलिखित एक उदाहरण है:

1300 pts और 1300 मिलान नियंत्रण का अध्ययन किया जाता है। धूम्रपान की स्थिति निम्नानुसार है:

             Normal   
           |no  |yes|
Cancer|No  |1000|40 |
      |Yes |200 |60 |

तालिका की प्रत्येक प्रविष्टि CASE-CONTROL PAIR: 1000 का मतलब 1000 केस-कंट्रोल जोड़े में है, न तो धूम्रपान करने वाला था। 40 केस-कंट्रोल जोड़े की संख्या है जहां नियंत्रण धूम्रपान न करने वाला था और कैंसर का रोगी नहीं था, और इसी तरह। इस तालिका को बनाने और McNemar का परीक्षण करने के लिए R कोड का उपयोग किया जा सकता है।

mat = as.table(rbind(c(1000, 40), c( 200, 60) ))
colnames(mat) <- rownames(mat) <- c("Nonsmoker", "Smoker")
names(dimnames(mat)) = c("Cancer", "Normal")
mat
#                  Normal
#              Nonsmoker Smoker
# Cancer
#  Nonsmoker      1000     40
#  Smoker          200     60


mcnemar.test(mat)

#        McNemar's Chi-squared test with continuity correction
#
#data:  mat
#McNemar's chi-squared = 105.34, df = 1, p-value < 2.2e-16

McNemar के परीक्षण का उपयोग द्विआधारी परिणाम चर पर एक हस्तक्षेप के प्रभाव का आकलन करने के लिए भी किया जाता है। पहले-बाद के परिणाम की जोड़ी को ऊपर की तरह चखा और परखा गया है।

संपादित करें: @gung द्वारा दिया गया उदाहरण, अगर धूम्रपान की स्थिति आपके डेटाफ्रेम mydf में निम्नानुसार सूचीबद्ध है:

pairID  cancer  control
1       1       1
2       1       1
3       1       0
...

McNemars परीक्षण निम्नलिखित आर आदेशों के साथ किया जा सकता है:

> tt = with(mydf, table(cancer, control))
> tt
      control
cancer 0 1
     0 5 1
     1 3 2

> mcnemar.test(tt)

        McNemar`s Chi-squared test with continuity correction

data:  tt
McNemar`s chi-squared = 0.25, df = 1, p-value = 0.6171

आप प्रति मामले में 10 नियंत्रणों के लिए किस परीक्षण का उपयोग करते हैं?
eXpander

यह एक अलग प्रश्न और चर्चा के लायक होगा। मुझे लगता है कि प्रत्येक मामले को इसके नियंत्रण के साथ जोड़ा जा सकता है और फिर मैकनेमर के परीक्षण का उपयोग किया जा सकता है।
rnso

5

आप सही हैं कि फिशर का सटीक परीक्षण आपके डेटा के लिए अनुपयुक्त है। आपको अपनी आकस्मिक तालिका फिर से बनानी होगी। नई तालिका जोड़े के लिए होगी , इस प्रकार यह आधे से अधिक डेटा का प्रतिनिधित्व करती दिखाई देगी (आपके मामले में 80 के बजाय 40)। उदाहरण के लिए, अपने डेटा को इस तरह देखें (जोड़ा गया विषयों का प्रत्येक सेट अपनी पंक्ति में है, और 1धूम्रपान करने वाले को इंगित करता है):

cancer  control
1       1
1       1
1       0
1       0
1       0
0       1
0       0
0       0
0       0
0       0
0       0

तब आपकी पुरानी आकस्मिक तालिका हो सकती है:

       cancer  control
smoker 5       3
non    6       8

आपकी नई आकस्मिक तालिका इस तरह दिखाई देगी:

            control
cancer    smoker  non           
  smoker  2       3
  non     1       5

पहली आकस्मिक तालिका 22 (आपके अध्ययन में कुल विषयों की संख्या) के बराबर है, लेकिन दूसरी आकस्मिक तालिका 11 (मिलान जोड़े की संख्या) के लिए है।

आपके डेटा का इस तरह से प्रतिनिधित्व करने के साथ, जो आप में रुचि रखते हैं यदि सीमांत अनुपात समान हैं। उस के लिए परीक्षण McNemar का परीक्षण है । मैंने यहाँ और यहाँ McNemar का परीक्षण समझाया है


1
ध्यान दें कि dichotomous डेटा के लिए McNemar टेस्ट साइन टेस्ट के बराबर है। तो ओपी साइन टेस्ट का उपयोग कर सकता है (यदि आवश्यक हो तो क्रमपरिवर्तन या मोंटे कार्लो महत्व परीक्षण के साथ)।
ttnphns

1
@ttnphns, मैं चर्चा करता हूं कि लिंक किए गए थ्रेड्स में जहां मैं मैक्नेमर के परीक्षण के बारे में विस्तार से बताता हूं।
गंग - मोनिका

1

यह एक युग्मित परीक्षण का उपयोग करने के लिए आवश्यक नहीं होना चाहिए। आबादी के मेल से पता चलता है कि कोवराइट्स (आयु, ...) का वितरण दो आबादी में समान है इसलिए यह तस्वीर को "विकृत" नहीं करता है।

परीक्षण आबादी के साधनों की तुलना करता है इसलिए व्यक्तियों की जोड़ी आवश्यक नहीं है। यह केवल "दोहराया" माप के लिए आवश्यक है, उदाहरण के लिए, एक ही आबादी के उपचार के पहले और बाद में पुरुषों की तुलना करना।


0

हां और ना:

शायद आपका मामला पीयर्स (2015) मामले के अंतर्गत आता है : लेख में बिंदु यह है कि नियंत्रण को चुनने के लिए आप जिन चरों का उपयोग करते हैं, उन्हें अध्ययन में नियंत्रित किया जाना चाहिए न कि परीक्षण में। N = 80 के कारण यह मुश्किल हो सकता है।

उममीद है कि इससे मदद मिलेगी :)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.