एक रैखिक मिश्रित मॉडल के लिए मैन्युअल रूप से यादृच्छिक प्रभाव भविष्यवाणियों की गणना करें


10

मैं हाथ से एक रैखिक मिश्रित मॉडल से यादृच्छिक प्रभाव भविष्यवाणियों की गणना करने की कोशिश कर रहा हूं, और सामान्यीकृत योज्य मॉडल में लकड़ी द्वारा प्रदान की गई संकेतन का उपयोग कर रहा हूं : आर (पीजी 294 / पीडी 307 पीडीएफ के साथ) के साथ एक परिचय , मैं उन मापदंडों पर भ्रमित हो रहा हूं का प्रतिनिधित्व करता है।

नीचे लकड़ी से एक सारांश है।

एक रैखिक मिश्रित मॉडल को परिभाषित करें

Y=Xβ+Zb+ϵ

जहाँ b N (0, ), और N (0, )Ψ ε ~ σ 2ψϵσ2

यदि संयुक्त सामान्य वितरण के साथ बी और वाई यादृच्छिक चर हैं

[by]N[[0Xβ],[ψΣbyΣybΣθσ2]]

आरई भविष्यवाणियों की गणना द्वारा की जाती है

E[by]=ΣbyΣyy1(yxβ)=ΣbyΣθ1(yxβ)/σ2=ψzTΣθ1(yxβ)/σ2

जहाँ Σθ=ZψZT/σ2+In

lme4आर पैकेज से एक यादृच्छिक अवरोधन मॉडल उदाहरण का उपयोग करके मुझे आउटपुट मिलता है

library(lme4)
m = lmer(angle ~ temp + (1 | replicate), data=cake)
summary(m)

% Linear mixed model fit by REML ['lmerMod']
% Formula: angle ~ temp + (1 | replicate)
%    Data: cake
% 
% REML criterion at convergence: 1671.7
% 
% Scaled residuals: 
%      Min       1Q   Median       3Q      Max 
% -2.83605 -0.56741 -0.02306  0.54519  2.95841 
% 
% Random effects:
%  Groups    Name        Variance Std.Dev.
%  replicate (Intercept) 39.19    6.260   
%  Residual              23.51    4.849   
% Number of obs: 270, groups:  replicate, 15
% 
% Fixed effects:
%             Estimate Std. Error t value
% (Intercept)  0.51587    3.82650   0.135
% temp         0.15803    0.01728   9.146
% 
% Correlation of Fixed Effects:
%      (Intr)
% temp -0.903

तो इससे मुझे लगता है कि = 23.51, का अनुमान जनसंख्या स्तर के अवशेषों के वर्ग से और लगाया जा सकता है ।( y - एक्स β )ψ(yXβ)cake$angle - predict(m, re.form=NA)sigma

th = 23.51
zt = getME(m, "Zt") 
res = cake$angle - predict(m, re.form=NA)
sig = sum(res^2) / (length(res)-1)

इनको एक साथ गुणा करने से लाभ मिलता है

th * zt %*% res / sig
         [,1]
1  103.524878
2   94.532914
3   33.934892
4    8.131864
---

जिसकी तुलना में सही नहीं है

> ranef(m)
$replicate
   (Intercept)
1   14.2365633
2   13.0000038
3    4.6666680
4    1.1182799
---

क्यों?

जवाबों:


9

दो समस्याएं (मुझे स्वीकार है कि मुझे दूसरे स्थान पर आने में 40 मिनट लग गए):

  1. आपको अवशिष्टों के वर्ग के साथ गणना नहीं करनी चाहिए , यह REML द्वारा अनुमानित है , और इस बात की कोई गारंटी नहीं है कि BLUP का एक ही रूप होगा।σ223.51

    sig <- 23.51

    और यह नहीं है ! जिसका अनुमान हैψ39.19

    psi <- 39.19
  2. अवशिष्टों के साथ प्राप्त नहीं किया cake$angle - predict(m, re.form=NA)जाता है residuals(m)

इसे एक साथ रखना:

> psi/sig * zt %*% residuals(m)
15 x 1 Matrix of class "dgeMatrix"
         [,1]
1  14.2388572
2  13.0020985
3   4.6674200
4   1.1184601
5   0.2581062
6  -3.2908537
7  -4.6351567
8  -4.5813846
9  -4.6351567
10 -3.1833095
11 -2.1616392
12 -1.1399689
13 -0.2258429
14 -4.0974355
15 -5.3341942

जो के समान है ranef(m)

मैं वास्तव में क्या predictगणना नहीं मिलता है ।


पुनश्च। अपने पिछले टिप्पणी का जवाब करने के लिए, मुद्दा यह है कि हम "बच" का उपयोग है वेक्टर प्राप्त करने के लिए एक मार्ग के रूप जहां । इस मैट्रिक्स की गणना REML एल्गोरिथ्म के दौरान की जाती है। यह यादृच्छिक शब्दों के BLUPs से संबंधित है और पीवाईपी=वी-1-वी-1एक्स(एक्स'वी - 1 एक्स)-1एक्स'वी-1 ε =σ2पीवाई =ψजेडटीपीवाईϵ^PYP=V1V1X(XV1X)1XV1

ϵ^=σ2PY
b^=ψZtPY.

इस प्रकार ।^=ψ/σ2जेडटीε^


1
धन्यवाद एल्विस। मैं उन मूल्यों को संरेखित करने के लिए एक मूतू संघर्ष कर रहा हूं, जिनका आपने ऊपर समीकरणों में उपयोग किया है, हालांकि, ऐसा लगता है कि एक बिल्ली को त्वचा देने के कई तरीके हैं। अवशिष्ट मुझे थोड़ा आश्चर्यचकित करता है क्योंकि मुझे लगा कि इसका मतलब , (निश्चित प्रभाव) जबकि अवशिष्ट की गणना यादृच्छिक प्रभावों के उपयोग से की जाती है। (अंतर देखें )। y-एक्सβplot(residuals(m), cake$angle-predict(m, re.form=NULL)) ; plot(residuals(m), cake$angle-predict(m, re.form=NA))
user2957945

1
निश्चित प्रभाव का उपयोग करने का एक तरीका, और ऊपर E [b | y] का तीसरा संस्करण z = getME(m, "Z") ; big_sig = solve(((z * psi) %*% zt ) / sig + diag(270)) ; psi/sig * zt %*% big_sig %*% (cake$angle-predict(m, re.form=NA)):। सही वस्तुओं को इंगित करने के लिए धन्यवाद।
user2957945

ΣyΣyy

Σyψजेड

एल्विस, मेरे पास इस पर एक और मूत था (मुझे पता है कि मैं धीमा हूं)। मुझे लगता है कि इस तरह से अवशिष्टों का उपयोग करना वास्तव में समझदार नहीं है क्योंकि यह गणना के आरई स्तर पर अनुमानित मूल्यों (और इसलिए अवशिष्ट) का उपयोग करता है, इसलिए हम इसे आपके समीकरण के दोनों किनारों पर उपयोग कर रहे हैं। (इसलिए यह RE भविष्यवाणियों का उपयोग करता है (E [b | y]) अवशिष्टों की भविष्यवाणियों को बनाने के लिए भले ही ये ऐसे शब्द हों जिनकी हम भविष्यवाणी करने की कोशिश कर रहे हैं)
user2957945
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.