जैसा कि @whuber ने टिप्पणियों में पूछा, मेरी श्रेणी संख्या के लिए एक मान्यता। संपादित करें: शापिरो परीक्षण के साथ, क्योंकि एक-नमूना केएस परीक्षण वास्तव में गलत तरीके से उपयोग किया जाता है। व्हीबर सही है: कोलमोगोरोव-स्मिर्नोव परीक्षण के सही उपयोग के लिए, आपको वितरण मापदंडों को निर्दिष्ट करना होगा और उन्हें डेटा से नहीं निकालना होगा। यह हालांकि एक-नमूना केएस-परीक्षण के लिए एसपीएसएस जैसे सांख्यिकीय पैकेजों में क्या किया जाता है।
आप वितरण के बारे में कुछ कहने की कोशिश करते हैं, और आप यह जांचना चाहते हैं कि क्या आप एक टी-टेस्ट लागू कर सकते हैं। तो यह परीक्षण इस बात की पुष्टि करने के लिए किया जाता है कि विश्लेषण की अंतर्निहित मान्यताओं को अमान्य बनाने के लिए डेटा सामान्यता से पर्याप्त रूप से विचलित नहीं होता है। इसलिए, आप टाइप I-त्रुटि में रुचि नहीं रखते हैं, लेकिन टाइप II त्रुटि में।
अब किसी को स्वीकार्य शक्ति के लिए न्यूनतम n की गणना करने में सक्षम होने के लिए "काफी भिन्न" को परिभाषित करना होगा (कहना 0.8)। वितरण के साथ, यह परिभाषित करने के लिए सीधा नहीं है। इसलिए, मैंने प्रश्न का उत्तर नहीं दिया, क्योंकि मैं नियम-अंगूठे के अलावा एक समझदार उत्तर नहीं दे सकता हूं जिसका उपयोग करता हूं: n> 15 और n <50. किस पर आधारित है? मूल रूप से महसूस कर रहा हूँ, इसलिए मैं अनुभव से अलग उस विकल्प का बचाव नहीं कर सकता।
लेकिन मुझे पता है कि केवल 6 मूल्यों के साथ आपका टाइप II-एरर लगभग 1 हो सकता है, जिससे आपकी शक्ति 0. के करीब हो जाती है। 6 अवलोकनों के साथ, शापिरो टेस्ट एक सामान्य, पॉइसन, यूनिफॉर्म या यहां तक कि घातीय वितरण के बीच अंतर नहीं कर सकता है। टाइप II-त्रुटि लगभग 1 होने के साथ, आपका परीक्षा परिणाम अर्थहीन है।
आकृति-परीक्षण के साथ सामान्यता परीक्षण की व्याख्या करने के लिए:
shapiro.test(rnorm(6)) # test a the normal distribution
shapiro.test(rpois(6,4)) # test a poisson distribution
shapiro.test(runif(6,1,10)) # test a uniform distribution
shapiro.test(rexp(6,2)) # test a exponential distribution
shapiro.test(rlnorm(6)) # test a log-normal distribution
एकमात्र जहां लगभग आधे मान 0.05 से छोटे हैं, वही अंतिम है। जो सबसे चरम मामला भी है।
यदि आप यह जानना चाहते हैं कि न्यूनतम एन क्या है जो आपको शापिरो टेस्ट के साथ अपनी पसंद की शक्ति प्रदान करता है, तो कोई इस तरह से एक सिमुलेशन कर सकता है:
results <- sapply(5:50,function(i){
p.value <- replicate(100,{
y <- rexp(i,2)
shapiro.test(y)$p.value
})
pow <- sum(p.value < 0.05)/100
c(i,pow)
})
जो आपको इस तरह से एक शक्ति विश्लेषण देता है:
जिससे मैं यह निष्कर्ष निकालता हूं कि 80% मामलों में एक सामान्य वितरण से एक घातीय को अलग करने के लिए आपको न्यूनतम 20 मानों की आवश्यकता होती है।
कोड प्लॉट:
plot(lowess(results[2,]~results[1,],f=1/6),type="l",col="red",
main="Power simulation for exponential distribution",
xlab="n",
ylab="power"
)