रैखिक मॉडल के लिए BLUE (OLS समाधान) की तुलना में अन्य निष्पक्ष अनुमानक


15

एक रेखीय मॉडल के लिए ओएलएस समाधान मापदंडों के लिए सबसे अच्छा रैखिक निष्पक्ष अनुमानक प्रदान करता है।

बेशक हम निम्न विचरण के लिए पूर्वाग्रह में व्यापार कर सकते हैं, जैसे रिज प्रतिगमन। लेकिन मेरा सवाल पक्षपात न करने से संबंधित है। क्या कोई अन्य अनुमानक हैं जो आमतौर पर कुछ हद तक उपयोग किए जाते हैं, जो निष्पक्ष हैं, लेकिन ओएलएस अनुमानित मापदंडों की तुलना में अधिक भिन्नता है?

अगर मेरे पास एक बड़ा डेटा सेट होता है, तो मैं निश्चित रूप से इसका उप-नमूना कर सकता हूं और कम डेटा वाले मापदंडों का अनुमान लगा सकता हूं, और विचरण बढ़ा सकता हूं। मुझे लगता है कि यह काल्पनिक रूप से उपयोगी हो सकता है।

यह एक आलंकारिक प्रश्न अधिक है, क्योंकि जब मैंने BLUE अनुमानकों के बारे में पढ़ा है, तो एक बुरा विकल्प प्रदान नहीं किया जाता है। मुझे लगता है कि बदतर विकल्प प्रदान करने से लोगों को BLUE अनुमानकों की शक्ति को बेहतर ढंग से समझने में मदद मिल सकती है।


अधिकतम संभावना अनुमानक के बारे में क्या? उदाहरण के लिए, यदि आपको लगता है कि आपका डेटा एक डिस्ट्रीब्यूशन से अपेक्षाकृत कम डिग्रियों के साथ आज़ादी के पैरामीटर ( t ( 3 ) या t ( 4 ) के लिए वित्तीय रिटर्न की विशेषता हो सकती है) से लिया गया है, तो अधिकतम संभावना अनुमानक OLS के साथ मेल नहीं खाता, लेकिन मुझे लगता है यह अभी भी निष्पक्ष होगा। tt(3)t(4)
रिचर्ड हार्डी

2
प्रासंगिक: andrewgelman.com/2015/05/11/…
kjetil b halvorsen

1
@ रीचर्डहार्डी, मैंने MLE का भी प्रयास किया, जिसके परिणामों का आपने अनुमान लगाया था।
क्रिस्टोफ हांक

जवाबों:


19

एक उदाहरण जो दिमाग में आता है, वह है कुछ GLS आकलनकर्ता जो अलग-अलग तरीके से वज़न उठाता है, हालांकि यह आवश्यक नहीं है कि जब गॉस-मार्कोव की मान्यताएं पूरी हो जाएं (जो कि सांख्यिकीविद् को मामला नहीं पता होगा और इसलिए अभी भी लागू करें GLS)।

की एक प्रतिगमन के मामले पर विचार yi , i=1,,n चित्रण के लिए एक निरंतर पर (आसानी से सामान्य GLS आकलनकर्ता को सामान्यीकृत)। इधर, {yi} मतलब के साथ एक जनसंख्या से नमूने के तौर पर माना जाता है μ और विचरण σ2

फिर, हम जानते हैं कि OLS बस है β = ˉ y , नमूना मतलब। बिंदु पर जोर देना है कि प्रत्येक अवलोकन वजन के साथ दिया जाता है 1 / n , के रूप में यह लिख β = n Σ मैं = 1 1β^=y¯1/n

β^=i=1n1nyi.
यह अच्छी तरह से ज्ञात है किVar(β^)=σ2/n

अब, एक और आकलनकर्ता जो के रूप में लिखा जा सकता है पर विचार

β~=i=1nwiyi,
जहां वजन इस तरह के हैं कि iwi=1 । यह सुनिश्चित करता है कि आकलनकर्ता निष्पक्ष, के रूप में है
E(i=1nwiyi)=i=1nwiE(yi)=i=1nwiμ=μ.
wi=1/ni

L=V(β~)λ(iwi1)=iwi2σ2λ(iwi1),
wi2σ2wiλ=0iL/λ=0iwi1=0λwi=wjwi=1/n

यहाँ थोड़ा अनुकरण से चित्रमय चित्रण किया गया है, जो नीचे दिए गए कोड के साथ बनाया गया है:

EDIT: @ kjetilbhalvorsen's और @ रिचर्डहार्डी के सुझावों के जवाब में मैं भी शामिल हूं yमैं, (4) वितरण पर स्थान पैरामीटर pf का MLE (मुझे चेतावनी मिलती है In log(s) : NaNs producedकि मैंने आगे की जाँच नहीं की) और भूखंड में ह्यूबर के अनुमानक।

enter image description here

हम मानते हैं कि सभी अनुमानक निष्पक्ष प्रतीत होते हैं। हालांकि, आकलनकर्ता जो वजन का उपयोग करता हैwमैं=(1±ε)/nनमूना के आधे के लिए वजन के रूप में अधिक चर है, के रूप में मंझला, टी-वितरण के MLE और ह्यूबर के अनुमानक (केवल थोड़ा बाद में, यहां भी देखें ) हैं।

यह कि बाद के तीन ओएलएस घोल से गलत तरीके से निकले हैं, जिन्हें तुरंत BLUE प्रॉपर्टी (कम से कम मेरे पास नहीं) द्वारा निहित किया गया है, क्योंकि यह स्पष्ट नहीं है कि वे रैखिक अनुमानक हैं (न ही मुझे पता है कि MLE और ह्यूबर निष्पक्ष हैं)।

library(MASS)
n <- 100      
reps <- 1e6

epsilon <- 0.5
w <- c(rep((1+epsilon)/n,n/2),rep((1-epsilon)/n,n/2))

ols <- weightedestimator <- lad <- mle.t4 <- huberest <- rep(NA,reps)

for (i in 1:reps)
{
  y <- rnorm(n)
  ols[i] <- mean(y)
  weightedestimator[i] <- crossprod(w,y)  
  lad[i] <- median(y)   
  mle.t4[i] <- fitdistr(y, "t", df=4)$estimate[1]
  huberest[i] <- huber(y)$mu
}

plot(density(ols), col="purple", lwd=3, main="Kernel-estimate of density of OLS and other estimators",xlab="")
lines(density(weightedestimator), col="lightblue2", lwd=3)     
lines(density(lad), col="salmon", lwd=3)     
lines(density(mle.t4), col="green", lwd=3)
lines(density(huberest), col="#949413", lwd=3)
abline(v=0,lty=2)
legend('topright', c("OLS","weighted","median", "MLE t, 4 df", "Huber"), col=c("purple","lightblue","salmon","green", "#949413"), lwd=3)

2
साफ! मुझे लगता है कि यह एक बहुत ही सरल उदाहरण है, जो मेरे साथ आया था उससे थोड़ा अधिक सामान्य है। जब लोग लगातार सेटिंग में अनुमानकों के बारे में सीख रहे होते हैं तो मुझे लगता है कि इस तरह के उदाहरण अक्सर गायब होते हैं, वे वास्तव में आपको अवधारणा का एक बेहतर समझ पाने में मदद करते हैं।
ग्यूमो

4
एक और संभावना होगी (मजबूत) एक मानदंड को कम करने के आधार पर अनुमानक (जैसे) डब्ल्यू=Σमैं=1nw(मैं) कहाँ पे मैं ith अवशिष्ट है और w कुछ सममित कार्य, उत्तल या गैर-उत्तल है, जिसमें (वैश्विक) न्यूनतम 0 है, w(0)=0। ह्यूबर अनुमानक एक उदाहरण होगा।
kjetil b halvorsen

1
@kjetilbhalvorsen, अब मैं भी ह्यूबर अनुमानक को शामिल करता हूं, जो वास्तव में अच्छी तरह से करता है।
क्रिस्टोफ़ हैनक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.