द्विपद डेटा के लिए शक्ति विश्लेषण जब शून्य परिकल्पना है कि


10

मैं द्विपद डेटा से एकल नमूने के लिए , बनाम , जहां जनसंख्या में सफलताओं का अनुपात है , के साथ एक शक्ति विश्लेषण करना चाहता हूं । यदि , मैं या तो सामान्य सन्निकटन का उपयोग द्विपद, या साथ कर सकता हूं , लेकिन , ये दोनों विफल होते हैं। अगर यह विश्लेषण करने का एक तरीका है तो मुझे यह जानकर अच्छा लगेगा। मैं किसी भी सुझाव, टिप्पणी या संदर्भ की बहुत सराहना करता हूं। बहुत धन्यवाद!एच 1 : पी = 0.001 पी 0 < p < 1 χ 2 पी = 0H0:p=0H1:p=0.001p0<p<1χ2p=0


तो आप सटीक क्लॉपर-पियर्सन परीक्षण का उपयोग क्यों नहीं करते हैं?
स्टीफन लॉरेंट

2
मुझे आशा है कि आपके पास वास्तव में एक बड़ा नमूना है! यह परीक्षण करने के लिए कठिन होने जा रहा है।
पीटर Flom

जवाबों:


13

आपके पास एक तरफा, सटीक वैकल्पिक परिकल्पना जहां और । पी 1 = 0.001 पी 0 = 0p1>p0p1=0.001p0=0

  • पहला कदम सफलताओं की संख्या के लिए थ्रेशोल्ड पहचान करना है, ताकि आकार नमूने में कम से कम सफलताओं को प्राप्त करने की संभावना शून्य परिकल्पना (पारंपरिक रूप से ) के तहत बहुत कम हो । आपके मामले में, , और लिए आपकी विशेष पसंद की परवाह किए बिना ।ccnα=0.05c=1α > 0n1α>0
  • दूसरा कदम वैकल्पिक परिकल्पना के तहत आकार के नमूने में कम से कम सफलताओं को प्राप्त करने की संभावना का पता लगाना है - यह आपकी शक्ति है। यहां, आपको एक निश्चित आवश्यकता है, जैसे कि द्विपद वितरण पूरी तरह से निर्दिष्ट है।cnnB(n,p1)

R में साथ दूसरा चरण :n=500

> n  <- 500                 # sample size
> p1 <- 0.001               # success probability under alternative hypothesis
> cc <- 1                   # threshold
> sum(dbinom(cc:n, n, p1))  # power: probability for cc or more successes given p1
[1] 0.3936211

नमूना आकार के साथ बिजली कैसे बदलती है, इसका अंदाजा लगाने के लिए, आप एक पावर फंक्शन आकर्षित कर सकते हैं: यहां छवि विवरण दर्ज करें

nn   <- 10:2000                 # sample sizes
pow  <- 1-pbinom(cc-1, nn, p1)  # corresponding power
tStr <- expression(paste("Power for ", X>0, " given ", p[1]==0.001))
plot(nn, pow, type="l", xaxs="i", xlab="sample size", ylab="power",
     lwd=2, col="blue", main=tStr, cex.lab=1.4, cex.main=1.4)

यदि आप जानना चाहते हैं कि कम से कम पूर्व-निर्दिष्ट शक्ति प्राप्त करने के लिए आपको किस नमूना आकार की आवश्यकता है, तो आप ऊपर गणना की गई शक्ति मानों का उपयोग कर सकते हैं। कहते हैं कि आप कम से कम की शक्ति चाहते हैं ।0.5

> powMin <- 0.5
> idx    <- which.min(abs(pow-powMin))  # index for value closest to 0.5
> nn[idx]     # sample size for that index
[1] 693

> pow[idx]    # power for that sample size
[1] 0.5000998

तो आपको शक्ति प्राप्त करने के लिए कम से कम एक नमूना आकार की आवश्यकता है ।0.56930.5


के अनुसार pwr.p.test, 0.5 की शक्ति के लिए, आपको कम से कम 677 टिप्पणियों की आवश्यकता होती है। लेकिन शक्ति = 0.5 बहुत कम है!
जेसिका

@caracal क्या आप अपनी शक्ति वक्र प्राप्त करने के लिए एक सामान्य सन्निकटन का उपयोग कर रहे हैं? एक सटीक द्विपद शक्ति समारोह इतना सुचारू नहीं होगा। यह वास्तव में sawtoothed है जिसे आप देख सकते हैं कि नमूना आकार की धुरी को बढ़ाया जाता है। मैं क्रिस्टीन लियू के साथ अमेरिकी सांख्यिकीविद् के 2002 के अपने पत्र में इस पर चर्चा करता हूं। इसके अलावा द्विपद को बहुत कम p पर तिरछा किया जाता है ताकि n सामान्य सन्निकटन के लिए अच्छी तरह से काम करने के लिए बड़ा होना चाहिए।
माइकल आर। चेरिक

2
@MichaelChernick नहीं, यह द्विपद वितरण से है, सामान्य सन्निकटन से नहीं। बेशक आप सही कह रहे हैं कि - सामान्य रूप से एक द्विपद परीक्षण के लिए शक्ति एक आराध्य कार्य है जो कि मोनोटोनिक नहीं है। लेकिन ध्यान दें कि हमारे पास साथ एक विशेष मामला है । इसका मतलब यह है कि वैकल्पिक परिकल्पना के लिए स्वीकृति क्षेत्र हमेशा 1 से शुरू होता है, परवाह किए बिना । एक निरंतर थ्रेशोल्ड , एक निरंतर , शक्ति का एक सख्ती से बढ़ते कार्य है । n c = 1 p 1 = 0.001 np0=0nc=1p1=0.001n
काराकल

@ जेसिका नोट जो pwr.p.test()एक सामान्य सन्निकटन का उपयोग करता है, न कि सटीक द्विपद वितरण का। pwr.p.testस्रोत कोड को देखने के लिए बस टाइप करें। आपको pnorm()यह इंगित करने के लिए कॉल मिलेंगे कि एक सन्निकटन का उपयोग किया जाता है।
काराकल

1
@caracal तो क्या मैं इसे इस तरह देख सकता हूं: अशक्त परिकल्पना के तहत सफलता की संभावना 0 है इसलिए यदि आपको कभी सफलता मिलती है तो आप अशक्त परिकल्पना को अस्वीकार कर सकते हैं। इसीलिए आप कहते हैं कि दहलीज 1 है क्योंकि यदि द्विपद योग कभी 1 हो जाता है तो आप 0 की टाइप 2 त्रुटि के साथ अस्वीकार कर सकते हैं! अब विकल्प के तहत nth परीक्षण पर पहली सफलता की संभावना (1-p) p है। यह संभावना 0 तक जाती है क्योंकि n अनंत तक जाता है। इसलिए जब S = 1 किसी भी p> 0 के लिए पावर 1 होगा तो स्टॉप द्वारा जाने वाला एक अनुक्रमिक नियम । - 1 एनn1n
माइकल आर। चेर्निक

3

आप इस प्रश्न का उत्तर pwrआर में पैकेज के साथ आसानी से दे सकते हैं ।

आपको एक महत्व स्तर, शक्ति और प्रभाव के आकार को परिभाषित करने की आवश्यकता होगी। आमतौर पर, महत्व स्तर 0.05 पर सेट है और शक्ति 0.8 पर सेट है। उच्च शक्ति को अधिक टिप्पणियों की आवश्यकता होगी। निचले महत्व के स्तर में शक्ति में कमी आएगी।

इस पैकेज में प्रयुक्त अनुपातों का प्रभाव आकार कोहेन का है। एक छोटे एच के लिए कटऑफ अक्सर 0.20 लिया जाता है। वास्तविक कटऑफ आवेदन से भिन्न होता है, और आपके मामले में छोटा हो सकता है। छोटे एच का मतलब है कि अधिक टिप्पणियों की आवश्यकता होगी। आपने कहा कि आपका विकल्प । वह बहुत छोटा हैp=0.001

> ES.h(.001, 0)
[1] 0.0632561

लेकिन हम अभी भी आगे बढ़ सकते हैं।

 > pwr.p.test(sig.level=0.05, power=.8, h = ES.h(.001, 0), alt="greater", n = NULL)

 proportion power calculation for binomial distribution (arcsine transformation) 

          h = 0.0632561
          n = 1545.124
  sig.level = 0.05
      power = 0.8
alternative = greater

इन मूल्यों का उपयोग करते हुए, आपको कम से कम 1546 टिप्पणियों की आवश्यकता है।


1

आपके विशिष्ट मामले में एक सरल सटीक समाधान है:

विशेष शून्य परिकल्पना तहत आपको कभी भी सफलता का अवलोकन नहीं करना चाहिए। इसलिए जैसे ही आप एक सफलता का निरीक्षण करते हैं, आप सुनिश्चित कर सकते हैं कि ।पी 0H0:p=0p0

वैकल्पिक तहत कम से कम 1 सफलता का निरीक्षण करने के लिए आवश्यक परीक्षणों की संख्या एक ज्यामितीय वितरण का अनुसरण करती है। तो नमूना प्राप्त करने के लिए न्यूनतम नमूना आकार प्राप्त करने के लिए , आपको सबसे छोटी k को खोजने की आवश्यकता है, जैसे कि,1 - बीटा 1 - बीटा 1 - ( 1 - पी ) ( कश्मीर - 1 )H1:p=0.0011β

1β1(1p)(k1)

तो बिजली प्राप्त करने के लिए साथ आपको कम से कम 1610 नमूनों की आवश्यकता होगी।80p=0.00180


समाधान 1 पर टिप्पणियों को पढ़ने पर, मुझे एहसास हुआ कि यह अनिवार्य रूप से वही समाधान है जो आपको मिलता है यदि आप एक का जवाब देने के लिए चिपके रहते हैं। फिर भी, अंतर्ज्ञान द्वारा वहाँ पहुँचने की आवश्यकता के बिना, यह कुछ बुनियादी संभाव्यता सिद्धांत परिणामों को समझने के लिए परेशान नहीं करता है।
नाव
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.