इन दो प्रतिगमन मॉडल के बीच मूलभूत अंतर क्या है?


10

मान लीजिए कि मेरे पास महत्वपूर्ण सहसंबंध के साथ एक द्विघात प्रतिक्रियाएं हैं। मैं इन परिणामों को मॉडल करने के लिए दो तरीकों की तुलना करने की कोशिश कर रहा हूं। एक तरह से दो परिणामों के बीच अंतर मॉडल करने के लिए है: एक और तरीका है उपयोग करने के लिए है या उन्हें मॉडल करने के लिए: ( y मैं j = β 0 + समय + एक्स ' β )

(yi2yi1=β0+Xβ)
glsgee
(yij=β0+time+Xβ)

यहाँ एक फू उदाहरण है:

#create foo data frame

require(mvtnorm)
require(reshape)
set.seed(123456)
sigma <- matrix(c(4,2,2,3), ncol=2)
y <- rmvnorm(n=500, mean=c(1,2), sigma=sigma)
cor(y)
x1<-rnorm(500)
x2<-rbinom(500,1,0.4)
df.wide<-data.frame(id=seq(1,500,1),y1=y[,1],y2=y[,2],x1,x2)
df.long<-reshape(df.wide,idvar="id",varying=list(2:3),v.names="y",direction="long")
df.long<-df.long[order(df.long$id),]
    df.wide$diff_y<-df.wide$y2-df.wide$y1


#regressions
fit1<-lm(diff_y~x1+x2,data=df.wide)
fit2<-lm(y~time+x1+x2,data=df.long)
fit3<-gls(y~time+x1+x2,data=df.long, correlation = corAR1(form = ~ 1 | time))

fit1fit2fit2fit3p


7
फिट 1 और फिट 3 के बीच अंतर को कभी-कभी भगवान के विरोधाभास के रूप में जाना जाता है। कुछ चर्चा के लिए यहां देखें (एक मॉडल के बीच अनुमान क्यों नहीं बदलते हैं) और पॉल एलीसन लेख के संदर्भ में, आंकड़े ।stackexchange.com / a / 15759 / 1036 । एक अन्य संदर्भ हैHolland, Paul & Donald Rubin. 1983. On Lord’s Paradox. In Principles of modern psychological measurement: A festchrift for Frederic M. Lord edited by Wainer, Howard & Samuel Messick pgs:3-25. Lawrence Erlbaum Associates. Hillsdale, NJ.
एंडी डब्ल्यू

जवाबों:


1

सबसे पहले, मैं अपने जवाब में चर्चा के लिए एक चौथा मॉडल पेश करूंगा:

fit1.5 <- lm (y_2 ~ x_1 + x_2 + y_1)

भाग 0
fit1 और fit1.5 के बीच का अंतर एक संक्षेप अंतर बनाम एक इष्टतम अंतर के बीच अंतर के रूप में सबसे अच्छा संक्षेप है।

y2=b0+b1·x+b2·y1
b2
y2b2·y1=b0+b1·x
y

b2=1

y2y1=b0+b1·x

xy1y2t


y=b0+b1·x+b2·t
t=0y1t=1y2
y1=b0+b1·xy2=b0+b1·x+b2
y2y1=b2b2b2y

भाग 2
तो क्या मॉडल fit2 और fit3 के बीच अंतर है ... वास्तव में, बहुत कम। फिट 3 मॉडल त्रुटि शब्दों में सहसंबंध के लिए खाता है, लेकिन यह केवल अनुमान प्रक्रिया को बदलता है, और इस प्रकार दो मॉडल आउटपुट के बीच अंतर न्यूनतम होगा (इस तथ्य से परे कि फिट 3 ऑटोर्रिजिव कारक का अनुमान लगाता है)।

भाग 2.5
और मैं इस चर्चा में अभी तक एक और मॉडल शामिल करेंगे

fit4 <- lmer (y ~ time + X1 + x2 + (1 | id), डेटा = df.long)

y

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.