हम एक सामान्य वितरण से नमूने, प्रत्येक आकार स्वतंत्र रूप से खींचते हैं ।एन ( μ , σ 2 )
से नमूने हम तो 2 नमूने जो उच्चतम (पूर्ण) पियर्सन एक दूसरे के साथ संबंध हो चुनें।
इस सहसंबंध का अपेक्षित मूल्य क्या है?
धन्यवाद [पुनश्च यह होमवर्क नहीं है]
हम एक सामान्य वितरण से नमूने, प्रत्येक आकार स्वतंत्र रूप से खींचते हैं ।एन ( μ , σ 2 )
से नमूने हम तो 2 नमूने जो उच्चतम (पूर्ण) पियर्सन एक दूसरे के साथ संबंध हो चुनें।
इस सहसंबंध का अपेक्षित मूल्य क्या है?
धन्यवाद [पुनश्च यह होमवर्क नहीं है]
जवाबों:
मुझे निम्नलिखित लेख मिला, जो इस समस्या को संबोधित करता है: जियांग, टिफेंग (2004)। नमूना सहसंबंध की सबसे बड़ी प्रविष्टियों के विषम वितरण। लागू होने की संभावना, 14 (2), 865-880
जाहिरा तौर पर यह परिणाम किसी भी वितरण वितरण के लिए पर्याप्त परिमित क्षणों के साथ होता है ( संपादित करें: नीचे @ कार्डिनल की टिप्पणी देखें)। जियांग बताते हैं कि यह एक प्रकार I चरम मूल्य वितरण है। स्थान और पैमाने हैं
टाइप- I EV वितरण का अपेक्षित मान , जहां Gamma Eul's स्थिरांक को दर्शाता है। हालाँकि, जैसा कि टिप्पणियों में कहा गया है, वितरण में अभिसरण स्वयं के वितरण के साधनों के अभिसरण की गारंटी नहीं देता है।
यदि हम इस मामले में ऐसा कोई परिणाम दिखा सकते हैं, तोअपेक्षित मानहोगा
ध्यान दें कि यह सबसे बड़े वर्ग के सहसंबंध के असममित अपेक्षित मूल्य देगा, जबकि सबसे बड़ी पूर्ण सहसंबंध के अपेक्षित मूल्य के लिए पूछा गया प्रश्न। तो वहाँ 100% नहीं, लेकिन करीब।
मैंने कुछ संक्षिप्त सिमुलेशन किए जो मुझे या तो सोचने के लिए प्रेरित करते हैं 1) मेरे सिमुलेशन (संभावना) के साथ एक समस्या है, 2) मेरे ट्रांसक्रिप्शन / बीजगणित (भी संभावना है, या 3) के साथ एक समस्या है कि सन्निकटन के लिए मान्य नहीं है के मूल्यों और मैं का इस्तेमाल किया। शायद इस सन्निकटन का उपयोग करते हुए ओपी कुछ सिमुलेशन परिणामों के साथ वजन कर सकता है?
@Jmtroos द्वारा प्रदान किए गए उत्तर के आगे, नीचे मेरे सिमुलेशन के विवरण हैं, और @ jmtroos की अपेक्षा जियांग (2004) से उम्मीद की व्युत्पत्ति के साथ एक तुलना है:
इस उम्मीद के मूल्यों छोटे के लिए नकली मूल्यों से ऊपर होने लगते हैं और नीचे बड़े के लिए और वे के रूप में थोड़ा भिन्न दिखाई देते हैं बढ़ जाती है। हालाँकि, अंतर बढ़ने से कम हो जाता है, क्योंकि हम उम्मीद करेंगे कि पेपर का दावा है कि वितरण विषम है। मैंने विभिन्न की कोशिश की है । नीचे दिए गए सिमुलेशन में का उपयोग किया गया है । मैं आर के लिए बहुत नया हूं, इसलिए मेरे कोड को बेहतर बनाने के लिए किसी भी संकेत या सुझाव का गर्मजोशी से स्वागत किया जाएगा।
set.seed(1)
ns <- 500
# number of simulations for each N
n <- 200
# length of each vector
mu <- 0
sigma <- 1
# parameters for the distribution we simulate from
par(mfrow=c(5,5))
x<-trunc(seq(from=5,to=n, length=20))
#vector of Ns
y<-vector(mode = "numeric")
#vector to store the mean correlations
k<- 1
#index for y
for (N in x) {
# loop over a range of N
dt <- matrix(nrow=n,ncol=N)
J <- vector(mode = "numeric")
# vector to store the simulated largest absolute
# correlations for each N
for (j in 1:ns) {
# for each N, simulated ns times
for (i in 1:N) {
dt[,i] <- rnorm(n,mu,sigma)
}
# perform the simulation
M<-matrix(cor(dt),nrow=N,ncol=N)
m <- M
diag(m) <- NA
J[j] <- max(abs(m), na.rm=TRUE)
# obtain the largest absolute correlation
# these 3 lines came from stackoverflow
}
hist(J,main=paste("N=",N, " n=",n, " N(0,1)", "\nmean=",round(J[j],4)))
y[k]<-mean(J)
k=k+1
}
lm1 <- lm(y~log(x))
summary(lm1)
logx_sq=log(x)^2
lm2<-lm(y~log(x)+logx_sq)
summary(lm2)
# linear models for these simulations
# Jiang 2004 paper, computation:
gamma = 0.5772
yy <- vector(mode = "numeric")
yy <- sqrt((2*log((x^2)/(sqrt(8*pi)*n^2)) + 2*gamma-(-4*log(n)+log(log(n))))/n)
plot(x,yy)
# plot the simulated correlations
points(x,y,col='red')
# add the points using the expectation