फिशर के सटीक परीक्षण पर: यदि महिला दूध-पहले कप की संख्या नहीं जानती है तो क्या परीक्षण उचित होगा?


18

आरए फिशर द्वारा प्रसिद्ध चाय चखने वाली महिला में, महिला को सूचित किया जाता है कि कितने दूध-पहले / चाय-पहले कप हैं (8 में से प्रत्येक के लिए 4 कप)। यह फिशर के सटीक परीक्षण की निश्चित सीमांत कुल धारणा का सम्मान करता है।

मैं अपने दोस्त के साथ इस परीक्षण को करने की कल्पना कर रहा था, लेकिन विचार ने मुझे मारा। यदि महिला वास्तव में दूध-पहले और चाय-पहले कप के बीच का अंतर बता सकती है, तो उसे दूध-पहले / चाय-पहले कप के सीमांत योग के साथ-साथ कौन से हैं, यह पता लगाने में सक्षम होना चाहिए।

तो यहाँ सवाल यह है कि अगर आरए फिशर ने दूध-पहले और चाय-पहले कप की कुल संख्या की महिला को सूचित नहीं किया था तो क्या परीक्षण किया जा सकता था?


4
कुछ का तर्क है कि भले ही दूसरा मार्जिन डिजाइन द्वारा तय नहीं किया गया है, यह महिला को भेदभाव करने की क्षमता (यानी यह लगभग सहायक है) के बारे में बहुत कम जानकारी देता है और उस पर वातानुकूलित होना चाहिए। सटीक बिना शर्त परीक्षण (पहले बरनार्ड द्वारा मुझे लगता है कि प्रस्तावित) अधिक जटिल है क्योंकि आपको एक उपद्रव पैरामीटर के सभी संभावित मूल्यों पर अधिकतम पी-मान की गणना करनी होगी।
Scortchi - को पुनः स्थापित मोनिका

4
वास्तव में बरनार्ड के परीक्षण में एक विकिपीडिया पृष्ठ है।
Scortchi - को पुनः स्थापित मोनिका

@Sortchi कहने के लिए और क्या है? मैं इसमें कुछ भी नहीं जोड़ूंगा (न ही मैं इसे स्पष्ट रूप से और संक्षिप्त रूप से कहने का प्रबंधन करूंगा)। आपकी दो टिप्पणियों के अलावा मुझे लगता है कि आपके पास वहाँ एक अच्छा जवाब है।
Glen_b -Reinstate मोनिका

1
येट्स में एफ (1984 और पेपर दोनों पर चर्चा करने वाले) के बीच कुछ चर्चा देखने लायक है, एफ। (1984) "टेस्ट ऑफ़ सिग्नेन्स टू 2 × 2 कॉन्टिनेंसी टेबल्स", जर्नल ऑफ़ द रॉयल स्टैटिस्टिकल सोसाइटी। श्रृंखला ए (सामान्य) , वॉल्यूम। 147, नंबर 3, पीपी 426-463।
Glen_b -Reinstate Monica

1
केवल औसतन, दूध के साथ 4 कप से अधिक चाय और 4 बिना, क्या हम कह सकते हैं कि वह सही ढंग से अनुमान लगाने के लिए की संभावना है; & उसके कुल अनुमानों का वितरण 4 से अधिक ध्यान केंद्रित करने की तुलना में अगर यह एक द्विपद वितरण के बाद होता है। लेकिन अगर वह अनुमान लगाती है कि "दूध" संभावना के साथ है, तो वह सही ढंग से संभावना के साथ अनुमान जब चाय में दूध होता है और जब नहीं होता है, और वितरण नहीं होता है उसके सही अनुमानों के कुल एक द्विपद वितरण का अनुसरण करते हैं। तो वहाँ एक बाधा पैरामीटर पर विचार करने, ... है121212
Scortchi - को पुनः स्थापित मोनिका

जवाबों:


16

कुछ का तर्क है कि भले ही दूसरा मार्जिन डिजाइन द्वारा तय नहीं किया गया है, यह महिला को भेदभाव करने की क्षमता (यानी यह लगभग सहायक है) के बारे में बहुत कम जानकारी देता है और उस पर वातानुकूलित होना चाहिए। सटीक बिना शर्त परीक्षण (पहले बार्नार्ड द्वारा प्रस्तावित ) अधिक जटिल है, क्योंकि आपको एक उपद्रव पैरामीटर के सभी संभावित मूल्यों पर अधिकतम पी-मान की गणना करना है, शून्य परिकल्पना के तहत आम बर्नौली संभावना की आवश्यकता है। हाल ही में, उपद्रव पैरामीटर के लिए एक आत्मविश्वास अंतराल पर पी-मूल्य को अधिकतम करना प्रस्तावित किया गया है: बर्जर (1996), "कॉन्फिडेंस इंटरवल पी वैल्यूज़ से अधिक शक्तिशाली टेस्ट", द अमेरिकन स्टेटिस्टिशियन , 50 , 4; इस विचार का उपयोग करके सही आकार वाले सटीक परीक्षणों का निर्माण किया जा सकता है।

फिशर का सटीक परीक्षण भी एक यादृच्छिककरण परीक्षण के रूप में उठता है, एजिंगटन के अर्थ में: प्रायोगिक उपचारों का एक यादृच्छिक असाइनमेंट अशक्त परिकल्पना का परीक्षण करने के लिए इन असाइनमेंट के क्रमबद्धता पर परीक्षण सांख्यिकीय के वितरण की अनुमति देता है। इस दृष्टिकोण में महिला के निर्धारण को निश्चित माना जाता है (और दूध-पहले और चाय-पहले कप के सीमांत योग, क्रमपरिवर्तन द्वारा संरक्षित हैं)।


Barnard::barnardw.test()यहाँ इस्तेमाल किया जा सकता है? व्यवहार में कम्प्यूटेशनल जटिलता में क्या अंतर की उम्मीद की जा सकती है?
krlmlr

मैं उस पैकेज से परिचित नहीं हूं, लेकिन आप जिस हेल्प पेज को संदर्भ के लिए लिंक कर रहे हैं, उसी परीक्षण से मैं बात कर रहा था। यह भी देखें Exact। कम्प्यूटेशनल जटिलता के रूप में, मुझे नहीं पता - यह उपयोग किए गए अधिकतमकरण एल्गोरिथ्म पर निर्भर करने वाला है।
Scortchi - को पुनः स्थापित मोनिका

2

आज, मैंने आरए फिशर द्वारा "द डिज़ाइन ऑफ़ एक्सपेरिमेंट्स" के पहले अध्याय को पढ़ा, और एक पैराग्राफ ने मुझे अपने प्रश्न में मूलभूत दोष का एहसास कराया।

यही है, भले ही महिला वास्तव में दूध-पहले और चाय-पहले कप के बीच अंतर बता सकती है , मैं कभी भी यह साबित नहीं कर सकता कि वह "किसी भी परिमित मात्रा में प्रयोग" है। इस कारण से, एक प्रयोगकर्ता के रूप में, मुझे इस धारणा से शुरू करना चाहिए कि उसके पास एक क्षमता (शून्य परिकल्पना) नहीं है और इसे अस्वीकार करने का प्रयास करें। और मूल प्रयोग डिजाइन (फिशर सटीक परीक्षण) ऐसा करने के लिए एक पर्याप्त, कुशल और न्यायसंगत प्रक्रिया है।

यहाँ आरए फिशर द्वारा "प्रयोगों के डिजाइन" का अंश दिया गया है:

यह तर्क दिया जा सकता है कि यदि एक प्रयोग परिकल्पना को अस्वीकार कर सकता है कि विषय के पास दो अलग-अलग प्रकार की वस्तु के बीच कोई संवेदी भेदभाव नहीं है, तो इसलिए यह विपरीत परिकल्पना को साबित करने में सक्षम होना चाहिए, कि वह कुछ ऐसा भेदभाव कर सकती है। लेकिन यह अंतिम परिकल्पना, हालांकि यह उचित या सत्य हो सकता है, प्रयोग द्वारा परीक्षण की जाने वाली अशक्त परिकल्पना के रूप में अयोग्य है, क्योंकि यह अक्षम्य है। यदि यह दावा किया गया था कि विषय उसके निर्णयों में कभी गलत नहीं होगा, तो हम फिर से एक सटीक परिकल्पना रखते हैं, और यह देखना आसान है कि इस परिकल्पना को एक एकल विफलता द्वारा अस्वीकृत किया जा सकता है, लेकिन प्रयोग की किसी भी अंतिम राशि द्वारा कभी भी साबित नहीं किया जा सकता है।


1

बरनार्ड के परीक्षण का उपयोग तब किया जाता है जब उपद्रव पैरामीटर शून्य परिकल्पना के तहत अज्ञात होता है।

हालांकि महिला चखने के परीक्षण में आप यह तर्क दे सकते हैं कि उपद्रव पैरामीटर को शून्य परिकल्पना के तहत 0.5 पर सेट किया जा सकता है (एक कप को सही ढंग से अनुमान लगाने के लिए असंगत महिला में 50% संभावना है)।

फिर सही अनुमानों की संख्या, शून्य परिकल्पना के तहत, एक द्विपद वितरण बन जाता है: प्रत्येक कप के लिए 50% संभावना के साथ 8 कप का अनुमान।


अन्य अवसरों में आप अशक्त परिकल्पना के लिए इस तुच्छ 50% संभावना नहीं हो सकता है। और निश्चित मार्जिन के बिना आप यह नहीं जान सकते हैं कि संभावना क्या होनी चाहिए। उस मामले में आपको बरनार्ड के परीक्षण की आवश्यकता है।


यहां तक ​​कि अगर आप महिला चखने वाले चाय परीक्षण पर बरनार्ड का परीक्षण करते हैं, तो यह वैसे भी 50% हो जाएगा (यदि परिणाम सभी सही अनुमान हैं) क्योंकि उच्चतम पी-मान के साथ उपद्रव पैरामीटर 0.5 है और परिणामस्वरूप द्विपद परीक्षण में परिणाम होगा ( यह वास्तव में चार दूध पहले कप के लिए एक और चार चाय पहले कप के लिए दो द्विपद परीक्षणों का संयोजन है)।

> library(Barnard)
> barnard.test(4,0,0,4)

Barnard's Unconditional Test

           Treatment I Treatment II
Outcome I            4            0
Outcome II           0            4

Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -2.82843
Nuisance parameter = 0.5 (One sided), 0.5 (Two sided)
P-value = 0.00390625 (One sided), 0.0078125 (Two sided)

> dbinom(8,8,0.5)
[1] 0.00390625

> dbinom(4,4,0.5)^2
[1] 0.00390625

नीचे यह बताया गया है कि यह अधिक जटिल परिणाम के लिए कैसे जाएगा (यदि सभी अनुमान सही नहीं हैं जैसे 2 बनाम 4), तो जो है और जो अति नहीं है उसकी गिनती थोड़ी अधिक कठिन हो जाती है

(ध्यान दें कि बरनार्ड के परीक्षण का उपयोग करता है, 4-2 परिणाम के मामले में एक उपद्रव पैरामीटर p = 0.686 जिसके बारे में आप तर्क दे सकते हैं कि यह सही नहीं है, 'चाय पहले' का जवाब देने की 50% संभावना के लिए पी-मान 0.08203125 होगा। जब आप किसी भिन्न क्षेत्र पर विचार करते हैं तो यह और भी छोटा हो जाता है, बजाय इसके कि वाल्ड की आँकड़ा आधारित है, हालाँकि इस क्षेत्र को परिभाषित करना इतना आसान नहीं है )

out <- rep(0,1000)
for (k in 1:1000) {
  p <- k/1000
  ps <- matrix(rep(0,25),5)   # probability for outcome i,j
  ts <- matrix(rep(0,25),5)   # distance of outcome i,j (using wald statistic)
  for (i in 0:4) {
    for (j in 0:4) {
      ps[i+1,j+1]  <- dbinom(i,4,p)*dbinom(j,4,p)
      pt <- (i+j)/8
      p1 <- i/4
      p2 <- j/4
      ts[i+1,j+1] <- (p2-p1)/sqrt(pt*(1-pt)*(0.25+0.25))
    }
  } 
  cases <- ts < ts[2+1,4+1]
  cases[1,1] = TRUE
  cases[5,5] = TRUE
  ps
  out[k] <- 1-sum(ps[cases])
}

> max(out)
[1] 0.08926748
> barnard.test(4,2,0,2)

Barnard's Unconditional Test

           Treatment I Treatment II
Outcome I            4            2
Outcome II           0            2

Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -1.63299
Nuisance parameter = 0.686 (One sided), 0.314 (Two sided)
P-value = 0.0892675 (One sided), 0.178535 (Two sided)
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.