आपके पास बहुत सीमित जानकारी निश्चित रूप से एक गंभीर बाधा है! हालाँकि, चीजें पूरी तरह से निराशाजनक नहीं हैं।
समान मान्यताओं के तहत, समान नाम की अच्छाई-की-फिट परीक्षण के परीक्षण आँकड़ा के लिए asymptotic वितरण के लिए, वैकल्पिक परिकल्पना के तहत परीक्षण आँकड़ा asymptotically, एक noncentral वितरण है। यदि हम मानते हैं कि दो उत्तेजनाएं ए) महत्वपूर्ण हैं, और बी) का एक ही प्रभाव है, तो संबंधित परीक्षण के आँकड़ों में समान स्पर्शोन्मुख noncentral वितरण होगा। हम परीक्षण का निर्माण करने के लिए इसका उपयोग कर सकते हैं - मूल रूप से, गैर-प्रतिरूपण पैरामीटर अनुमान लगाकर और यह देखने के लिए कि क्या परीक्षण के आँकड़े noncentral वितरण की पूंछ में हैं । (यह कहना नहीं है कि इस परीक्षण में बहुत शक्ति होगी, हालांकि।)χ 2 χ 2 λ χ 2 ( 18 , λ )χ2χ2χ2λχ2( 18 , λ^)
हम अपने औसत को लेने और स्वतंत्रता की डिग्री (क्षणों के आकलनकर्ता की एक विधि) को घटाकर, या अधिकतम संभावना के आधार पर दो टेस्ट के आँकड़ों को देखते हुए गैर-मानकता पैरामीटर का अनुमान लगा सकते हैं:
x <- c(45, 79)
n <- 18
ll <- function(ncp, n, x) sum(dchisq(x, n, ncp, log=TRUE))
foo <- optimize(ll, c(30,60), n=n, x=x, maximum=TRUE)
> foo$maximum
[1] 43.67619
हमारे दो अनुमानों के बीच अच्छा समझौता, वास्तव में दो डेटा बिंदु और स्वतंत्रता की 18 डिग्री दिए जाने पर आश्चर्य नहीं हुआ। अब एक पी-मान की गणना करने के लिए:
> pchisq(x, n, foo$maximum)
[1] 0.1190264 0.8798421
तो हमारा पी-मान 0.12 है, शून्य परिकल्पना को अस्वीकार करने के लिए पर्याप्त नहीं है कि दो उत्तेजनाएं समान हैं।
क्या यह परीक्षण वास्तव में (लगभग) एक 5% अस्वीकार दर है जब गैर-प्रतिरूपता पैरामीटर समान हैं? क्या इसमें कोई शक्ति है? हम निम्न प्रकार से पावर कर्व बनाकर इन सवालों के जवाब देने का प्रयास करेंगे। सबसे पहले, हम 43.68 के अनुमानित मूल्य पर औसत को ठीक करते हैं । दो परीक्षण आँकड़ों के लिए वैकल्पिक वितरण noncentral हो जाएगा स्वतंत्रता और noncentrality मापदंडों के 18 डिग्री के साथ के लिए । हम प्रत्येक दो लिए इन दो वितरणों से 10000 ड्रॉ का अनुकरण करेंगे और देखेंगे कि 90% और 95% आत्मविश्वास के स्तर पर हमारा परीक्षण कितनी बार अस्वीकार करता है।χ 2 ( λ - δ , λ + δ ) δ = 1 , 2 , ... , 15 δλχ2( λ - δ, λ + δ)δ= 1 , 2 , … , 15δ
nreject05 <- nreject10 <- rep(0,16)
delta <- 0:15
lambda <- foo$maximum
for (d in delta)
{
for (i in 1:10000)
{
x <- rchisq(2, n, ncp=c(lambda+d,lambda-d))
lhat <- optimize(ll, c(5,95), n=n, x=x, maximum=TRUE)$maximum
pval <- pchisq(min(x), n, lhat)
nreject05[d+1] <- nreject05[d+1] + (pval < 0.05)
nreject10[d+1] <- nreject10[d+1] + (pval < 0.10)
}
}
preject05 <- nreject05 / 10000
preject10 <- nreject10 / 10000
plot(preject05~delta, type='l', lty=1, lwd=2,
ylim = c(0, 0.4),
xlab = "1/2 difference between NCPs",
ylab = "Simulated rejection rates",
main = "")
lines(preject10~delta, type='l', lty=2, lwd=2)
legend("topleft",legend=c(expression(paste(alpha, " = 0.05")),
expression(paste(alpha, " = 0.10"))),
lty=c(1,2), lwd=2)
जो निम्नलिखित देता है:
असली अशक्त परिकल्पना बिंदु (एक्स-अक्ष मान = 0) को देखते हुए, हम देखते हैं कि परीक्षण रूढ़िवादी है, इसमें वह उतनी बार अस्वीकार नहीं करता है जितना कि स्तर इंगित करता है, लेकिन बहुत अधिक नहीं। जैसा कि हमने उम्मीद की थी, इसमें बहुत शक्ति नहीं है, लेकिन यह कुछ भी नहीं से बेहतर है। मुझे आश्चर्य है कि अगर आपके पास उपलब्ध जानकारी की बहुत सीमित मात्रा है, तो वहां बेहतर परीक्षण हैं।