यदि हम एक युग्मित टी-टेस्ट आयोजित करना चाहते हैं, तो आवश्यकता है (यदि मैं सही ढंग से समझता हूं) कि माप की मिलान इकाइयों के बीच औसत अंतर सामान्य रूप से वितरित किया जाएगा।
युग्मित टी-टेस्ट में, यह मांग में व्यक्त किया गया है (AFAIK) कि माप की मिलान इकाइयों के बीच का अंतर सामान्य रूप से वितरित किया जाएगा (भले ही दो तुलना समूहों में से प्रत्येक का वितरण सामान्य नहीं हो)।
हालांकि, एक अनपेक्षित टी-टेस्ट में, हम मिलान की गई इकाइयों के बीच अंतर के बारे में बात नहीं कर सकते हैं, इसलिए हमें दो समूहों से टिप्पणियों को सामान्य होने की आवश्यकता है ताकि उनके मतलब का अंतर सामान्य हो जाए। जो मुझे मेरे प्रश्न की ओर ले जाता है:
क्या यह दो गैर-सामान्य वितरणों के लिए संभव है ताकि उनके साधनों का अंतर सामान्य रूप से वितरित हो? (और इस प्रकार, उन पर एक अप्रकाशित टी-परीक्षण करने के लिए हमारी आवश्यक आवश्यकता को पूरा करें - फिर से - जहां तक मैं समझता हूं)।
अपडेट: (उत्तर के लिए आप सभी का धन्यवाद) मैं देखता हूं कि हम जिस सामान्य नियम की तलाश कर रहे हैं, वह वास्तव में यह है कि साधनों का अंतर सामान्य होगा, जो सीएलटी के कारण एक अच्छी धारणा (बड़े एन के तहत) प्रतीत होता है। यह मेरे लिए आश्चर्यजनक है (आश्चर्य की बात नहीं, सिर्फ आश्चर्यजनक है), जैसे कि यह अनपेक्षित टी-टेस्ट के लिए कैसे काम करता है, लेकिन एकल नमूना टी-टेस्ट के लिए भी काम नहीं करेगा। यहाँ कुछ आर कोड वर्णन करने के लिए है:
n1 <- 10
n2 <- 10
mean1 <- 50
mean2 <- 50
R <- 10000
# diffs <- replicate(R, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
# hist(diffs)
P <- numeric(R)
MEAN <- numeric(R)
for(i in seq_len(R))
{
y1 <- rexp(n1, 1/mean1)
y2 <- runif(n2, 0, 2*mean2)
MEAN[i] <- mean(y1) - mean(y2)
P[i] <- t.test(y1,y2)$p.value
}
# diffs <- replicate(R, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
par(mfrow = c(1,2))
hist(P)
qqplot(P, runif(R)); abline(0,1)
sum(P<.05) / R # for n1=n2=10 -> 0.0715 # wrong type I error, but only for small n1 and n2 (for larger ones, this effect disappears)
n1 <- 100
mean1 <- 50
R <- 10000
P_y1 <- numeric(R)
for(i in seq_len(R))
{
y1 <- rexp(n1, 1/mean1)
P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}
par(mfrow = c(1,2))
hist(P_y1)
qqplot(P_y1, runif(R)); abline(0,1)
sum(P_y1<.05) / R # for n1=n2=10 -> 0.057 # "wrong" type I error
धन्यवाद।