तल - रेखा
नमूना सहसंबंध गुणांक की परिकल्पना को खारिज करने के लिए आवश्यक है कि सही (पीयरसन) सहसंबंध गुणांक शून्य है काफी छोटा हो जाता है जैसा कि नमूना आकार बढ़ता है। तो, सामान्य तौर पर, नहीं, आप एक साथ बड़े (परिमाण में) सहसंबंध गुणांक और एक साथ बड़े अंतराल नहीं कर सकते हैंp ।
शीर्ष पंक्ति (विवरण)
फ़ंक्शन में पियर्सन सहसंबंध गुणांक के लिए उपयोग किया जाने वाला परीक्षण नीचे चर्चा की गई विधि का थोड़ा संशोधित संस्करण है।Rcor.test
मान लीजिए सहसंबंध ρ के साथ सामान्य बेतरतीब वैक्टर हैं । हम शून्य परिकल्पना का परीक्षण करना चाहते हैं कि ρ = 0 बनाम ρ n 0 । चलो आर नमूना सहसंबंध गुणांक हो। मानक रैखिक-प्रतिगमन सिद्धांत का उपयोग करना, यह दिखाना मुश्किल नहीं है कि परीक्षण सांख्यिकीय,
टी = आर ression(X1,Y1),(X2,Y2),…,(Xn,Yn)ρρ=0ρ≠0r
एक हैटीएन-2शून्य परिकल्पना के तहत वितरण। बड़ेएन के लिए,टीn-2वितरण मानक सामान्य दृष्टिकोण। इसलिएटी2स्वतंत्रता की एक डिग्री के साथ वितरित लगभग ची-वर्ग है। (मान्यताओं के तहत हमारे द्वारा किए गए,टी2~एफ1,एन-2वास्तविकता में, लेकिनχ21सन्निकटन स्पष्ट करता है क्या, पर जा रहा है मुझे लगता है।)
T=rn−2−−−−−√(1−r2)−−−−−−√
tn−2ntn−2T2T2∼F1,n−2χ21
तो,
जहां क्ष 1 - α है ( 1 - α ) स्वतंत्रता से एक डिग्री के साथ एक ची-वर्ग वितरण के quantile।
P(r21−r2(n−2)≥q1−α)≈α,
q1−α(1−α)
अब, ध्यान दें कि के रूप में बढ़ती जा रही है आर 2 बढ़ जाती है। संभाव्यता कथन में मात्रा का पुनरावर्तन, हम सभी के लिए है
| आर | ≥ १r2/(1−r2)r2
हम स्तरαपर शून्य परिकल्पना की अस्वीकृति प्राप्त करेंगे। स्पष्ट रूप से दाईं ओर का भागn केसाथ घटता है।
|r|≥11+(n−2)/q1−α−−−−−−−−−−−−−√
αn
एक साजिश
यहाँ अस्वीकृति क्षेत्र का एक भूखंड है नमूना आकार के एक समारोह के रूप में। इसलिए, उदाहरण के लिए, जब नमूना आकार 100 से अधिक हो जाता है, तो (निरपेक्ष) सहसंबंध केवल α = 0.05 स्तर पर नल को अस्वीकार करने के लिए लगभग 0.2 होना चाहिए ।|r|α=0.05
एक अनुकरण
हम एक सटीक सहसंबंध गुणांक के साथ शून्य-मीन वैक्टर की एक जोड़ी उत्पन्न करने के लिए एक सरल सिमुलेशन कर सकते हैं । नीचे कोड है। इससे हम आउटपुट पर देख सकते हैं cor.test
।
k <- 100
n <- 4*k
# Correlation that gives an approximate p-value of 0.05
# Change 0.05 to some other desired p-value to get a different curve
pval <- 0.05
qval <- qchisq(pval,1,lower.tail=F)
rho <- 1/sqrt(1+(n-2)/qval)
# Zero-mean orthogonal basis vectors
b1 <- rep(c(1,-1),n/2)
b2 <- rep(c(1,1,-1,-1),n/4)
# Construct x and y vectors with mean zero and an empirical
# correlation of *exactly* rho
x <- b1
y <- rho * b1 + sqrt(1-rho^2) * b2
# Do test
ctst <- cor.test(x,y)
जैसा कि टिप्पणियों में अनुरोध किया गया है, यहां प्लॉट को पुन: पेश करने के लिए कोड है, जिसे ऊपर दिए गए कोड के तुरंत बाद चलाया जा सकता है (और वहां परिभाषित कुछ चर का उपयोग करता है)।
png("cortest.png", height=600, width=600)
m <- 3:1000
yy <- 1/sqrt(1+(m-2)/qval)
plot(m, yy, type="l", lwd=3, ylim=c(0,1),
xlab="sample size", ylab="correlation")
polygon( c(m[1],m,rev(m)[1]), c(1,yy,1), col="lightblue2", border=NA)
lines(m,yy,lwd=2)
text(500, 0.5, "p < 0.05", cex=1.5 )
dev.off()