νt distribution अधिकतम संभावना (कुछ साहित्य संदर्भों के साथ: Lange et al।) (1989), "रोबोट सांख्यिकीय मॉडलिंग का उपयोग कर। टी डिस्ट्रीब्यूशन ", जेएएसए , 84 , 408 , और
फर्नांडीज एंड स्टील (1999)," मल्टीवेरिएट स्टूडेंट- टी रिग्रेशन मॉडल: नुकसान और अनुमान ", बायोमेट्रिक , 86 , 1 )।
कारण यह है कि लिए संभावना समारोहνt
set.seed(1234)
n <- 10
x <- rt(n, df=2.5)
make_loglik <- function(x)
Vectorize( function(nu) sum(dt(x, df=nu, log=TRUE)) )
loglik <- make_loglik(x)
plot(loglik, from=1, to=100, main="loglikelihood function for df parameter", xlab="degrees of freedom")
abline(v=2.5, col="red2")
n
आइए हम कुछ सिमुलेशन की कोशिश करें:
t_nu_mle <- function(x) {
loglik <- make_loglik(x)
res <- optimize(loglik, interval=c(0.01, 200), maximum=TRUE)$maximum
res
}
nus <- replicate(1000, {x <- rt(10, df=2.5)
t_nu_mle(x) }, simplify=TRUE)
> mean(nus)
[1] 45.20767
> sd(nus)
[1] 78.77813
अनुमान दिखाना बहुत अस्थिर है (हिस्टोग्राम को देखते हुए, अनुमानित मूल्यों का एक बड़ा हिस्सा 200 के अनुकूलन के लिए दी गई ऊपरी सीमा पर है)।
बड़े नमूने के आकार के साथ दोहराना:
nus <- replicate(1000, {x <- rt(50, df=2.5)
t_nu_mle(x) }, simplify=TRUE)
> mean(nus)
[1] 4.342724
> sd(nus)
[1] 14.40137
जो बहुत बेहतर है, लेकिन माध्य अभी भी 2.5 के वास्तविक मूल्य से ऊपर है।
फिर याद रखें कि यह वास्तविक समस्या का एक सरलीकृत संस्करण है जहां स्थान और पैमाने के मापदंडों का भी अनुमान लगाया जाना है।
टीν डेटा से मजबूती को नष्ट कर सकता है।