अनुदैर्ध्य अध्ययन में औसत उपचार प्रभाव का अनुमान लगाने का सबसे अच्छा तरीका क्या है?


9

एक अनुदैर्ध्य अध्ययन में, परिणाम इकाइयों की बार-बार समय बिंदुओं पर measuret रहे हैं के कुल के साथ तय माप अवसरों (इकाइयों पर तय = माप एक ही समय में रखा जाता है)।Yमैंटीमैंटी

इकाइयां यादृच्छिक रूप से या तो एक उपचार, , या एक नियंत्रण समूह, को सौंपी जाती हैं । मैं उपचार के औसत प्रभाव का अनुमान और परीक्षण करना चाहता हूं, अर्थात जहां समय और व्यक्तियों से अपेक्षाएं की जाती हैं। मैं इस उद्देश्य के लिए एक निश्चित-अवसर बहुस्तरीय (मिश्रित-प्रभाव) मॉडल का उपयोग करने पर विचार करता हूं:जी=1जी=0

ATE=E(Y|G=1)E(Y|G=0),

Yit=α+βGi+u0i+eit

साथ अवरोधन, , इकाइयों में एक यादृच्छिक अवरोध पैदा करते हैं और अवशिष्ट।αβATEue

अब मैं वैकल्पिक मॉडल पर विचार कर रहा हूं

Yit=β~Gi+j=1mκjdij+j=1mγjdijGi+u~0i+e~it

जिसमें प्रत्येक अवसर के लिए निश्चित प्रभाव κj शामिल t जहां d = d =t 1dt=1 अगर j=t और 0 है। इसके अलावा इस मॉडल में पैरामीटर \ गामा के साथ उपचार और समय के बीच बातचीत शामिल है γ। तो यह मॉडल इस बात को ध्यान में रखता है कि जी का प्रभाव Gसमय के साथ भिन्न हो सकता है। यह अपने आप में सूचनात्मक है, लेकिन मेरा मानना ​​है कि इसे मापदंडों के आकलन की सटीकता भी बढ़ानी चाहिए, क्योंकि वाई में विषमता Yको ध्यान में रखा जाता है।

हालाँकि, इस मॉडल में the गुणांक बराबर नहीं लगता है । इसके बजाय यह पहले मौके पर एटीई ( ) का प्रतिनिधित्व करता है । के अनुमान तो तुलना में अधिक कुशल हो सकता है लेकिन यह प्रतिनिधित्व नहीं करता है अब और।β~ATEt=1β~βATE

मेरे प्रश्न हैं :

  • इस अनुदैर्ध्य अध्ययन डिजाइन में उपचार के प्रभाव का अनुमान लगाने का सबसे अच्छा तरीका क्या है?
  • क्या मुझे मॉडल 1 का उपयोग करना है या क्या उपयोग करने का एक तरीका है (शायद अधिक कुशल) मॉडल 2?
  • वहाँ एक तरीका है है और की व्याख्या विशिष्ट विचलन (जैसे प्रभाव कोडिंग का उपयोग करके)?β~ATEγ

मॉडल 2 में, ATE बराबर नहीं है और साथ ही का औसत भी है ? β~γj
जूजा

यदि आपका उद्देश्य विशेष रूप से एटीई का अनुमान लगा रहा है, तो मॉडल 1 पर्याप्त होगा, क्योंकि यह निष्पक्ष होगा। मॉडल में अवधि या इंटरैक्शन जोड़ने से आपके अनुमान का विचरण कम हो जाएगा जो मुझे विश्वास है। और मुझे लगता है कि आप विचलन कोडिंग (औसत से विचलन) के रूप में कोड को करने की कोशिश कर सकते हैं ? γ
जूजा

@ संजू मॉडल 2 के लिए प्राथमिक कारण विचरण में कमी है, हाँ। लेकिन मुझे आश्चर्य है कि मॉडल से एटीई कैसे प्राप्त करें 2. आपकी पहली टिप्पणी एक सूचक लगती है। क्या आप इसे दिखा सकते हैं या विस्तृत कर सकते हैं? तब यह मेरे प्रश्न के उत्तर के करीब होगा!
12

जब आप मॉडल 2 फिट करते हैं, β~पीरियड में ATE की व्याख्या है। 1. पहचान शब्द की पहचान के लिए अंतःक्रियात्मक शब्द के गुणांकों को संदर्भ स्तर के रूप में 1 अवधि में ATE के साथ कोडित किया जाएगा। इसलियेγj वास्तव में अवधि में उपचार के बीच अंतर है jऔर सॉफ्टवेयर उत्पादन से 1 की अवधि में उपचार। इसलिए प्रत्येक अवधि मेंj, ATE है β~+γj और जब पीरियड-स्पेसिफिक ATE का औसत होता है, तो यह ग्रैंड माध्य ATE को ले जाएगा, जो है βअपने मॉडल में 1.
jujae

जवाबों:


2

अपने प्रश्न को संबोधित करते हुए "मुझे आश्चर्य है कि टिप्पणियों में मॉडल 2 से एटीई कैसे प्राप्त करें":

सबसे पहले, अपने मॉडल 2 में, सभी नहीं γjपहचान योग्य है जो डिजाइन मैट्रिक्स में रैंक की कमी की समस्या की ओर जाता है। उदाहरण के लिए, एक स्तर को गिराना आवश्यक हैγj=0 के लिये j=1। यही है, कंट्रास्ट कोडिंग का उपयोग करते हुए और 1 पर उपचार प्रभाव को ग्रहण करते हैं। 0. आर में, यह संदर्भ अवधि के रूप में 1 अवधि में उपचार प्रभाव के साथ इंटरैक्शन शब्द को कोड करेगा, और यही कारण है किβ~ पीरियड में उपचार प्रभाव की व्याख्या है। एसएएस में, यह अवधि में उपचार प्रभाव को कोड करेगा m संदर्भ स्तर के रूप में, फिर β~ अवधि में उपचार प्रभाव की व्याख्या है m, अवधि 1 अब और नहीं।

इसके विपरीत आर तरीके से बनाया गया है, तो प्रत्येक बातचीत अवधि के लिए गुणांक का अनुमान लगाया गया है (मैं अभी भी इसके द्वारा निरूपित करूंगा) γj, हालांकि यह ठीक नहीं है कि आपने अपने मॉडल में क्या परिभाषित किया है) समय अवधि के बीच उपचार प्रभाव अंतर की व्याख्या है j और समय अवधि 1. प्रत्येक अवधि में ATE को अस्वीकार करें ATEj, फिर γj=ATEjATE1 के लिये j=2,,m। इसलिए के लिए एक अनुमानकATEj है β~+γj। (सत्य पैरामीटर और अनुमानक के बीच संकेतन अंतर को अनदेखा करना क्योंकि आलस्य) और स्वाभाविक रूप से आपकेATE=β=1mj=1mATEj=β~+(β~+γ2)++(β~+γm)m=β~+1m(γ2++γm)

मैंने इसे सत्यापित करने के लिए R में एक साधारण सिमुलेशन किया:

set.seed(1234)
time <- 4
n <-2000
trt.period <- c(2,3,4,5) #ATE=3.5
kj <- c(1,2,3,4)
intercept <- rep(rnorm(n, 1, 1), each=time)
eij <- rnorm(n*time, 0, 1.5)
trt <- rep(c(rep(0,n/2),rep(1,n/2)), each=time)
y <- intercept + trt*(rep(trt.period, n))+rep(kj,n)+eij
sim.data <- data.frame(id=rep(1:n, each=time), period=factor(rep(1:time, n)), y=y, trt=factor(trt))

library(lme4)
fit.model1 <- lmer(y~trt+(1|id), data=sim.data)
beta <- getME(fit.model1, "fixef")["trt1"]

fit.model2 <- lmer(y~trt*period + (1|id), data=sim.data)
beta_t <- getME(fit.model2, "fixef")["trt1"]
gamma_j <- getME(fit.model2, "fixef")[c("trt1:period2","trt1:period3","trt1:period4")]

results <-c(beta, beta_t+sum(gamma_j)/time)
names(results)<-c("ATE.m1", "ATE.m2")
print(results)

और परिणाम इसकी पुष्टि करते हैं:

  ATE.m1   ATE.m2 
3.549213 3.549213  

मुझे नहीं पता कि ऊपर मॉडल 2 में कॉन्ट्रास्ट कोडिंग को सीधे कैसे बदलना है, इसलिए यह स्पष्ट करने के लिए कि कोई व्यक्ति सीधे बातचीत की शर्तों के रैखिक फ़ंक्शन का उपयोग कैसे कर सकता है, साथ ही साथ मानक त्रुटि कैसे प्राप्त करें, मैंने मल्टीपैक पैकेज का उपयोग किया:

sim.data$tp <- interaction(sim.data$trt, sim.data$period)
fit.model3 <- lmer(y~tp+ (1|id), data=sim.data)
library(multcomp)
# w= tp.1.1 + (tp.2.1-tp.2.0)+(tp.3.1-tp.3.0)+(tp.4.1-tp.4.0)
# tp.x.y=interaction effect of period x and treatment y
w <- matrix(c(0, 1,-1,1,-1,1,-1,1)/time,nrow=1)
names(w)<- names(getME(fit.model3,"fixef"))
xx <- glht(fit.model3, linfct=w)
summary(xx)

और यहाँ उत्पादन है:

 Simultaneous Tests for General Linear Hypotheses
Fit: lmer(formula = y ~ tp + (1 | id), data = sim.data)
Linear Hypotheses:
       Estimate Std. Error z value Pr(>|z|)    
1 == 0  3.54921    0.05589   63.51   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Adjusted p values reported -- single-step method)

मुझे लगता है कि मानक त्रुटि द्वारा प्राप्त की जाती है wV^wT साथ में w उपरोक्त रैखिक संयोजन रूप और V मॉडल 3 से गुणांक के अनुमानित विचरण-सहसंयोजक मैट्रिक्स।

विचलन कोडन

दूसरा तरीका β~ की सीधे व्याख्या कर रहा है ATEविचलन कोडिंग का उपयोग करना है , ताकि बाद में सहसंयोजक प्रतिनिधित्व करेंATEjATE तुलना:

sim.data$p2vsmean <- 0
sim.data$p3vsmean <- 0
sim.data$p4vsmean <- 0
sim.data$p2vsmean[sim.data$period==2 & sim.data$trt==1] <- 1
sim.data$p3vsmean[sim.data$period==3 & sim.data$trt==1] <- 1
sim.data$p4vsmean[sim.data$period==4 & sim.data$trt==1] <- 1
sim.data$p2vsmean[sim.data$period==1 & sim.data$trt==1] <- -1
sim.data$p3vsmean[sim.data$period==1 & sim.data$trt==1] <- -1
sim.data$p4vsmean[sim.data$period==1 & sim.data$trt==1] <- -1


fit.model4 <- lmer(y~trt+p2vsmean+p3vsmean+p4vsmean+ (1|id), data=sim.data)

आउटपुट:

Fixed effects:
            Estimate Std. Error t value
(Intercept)  3.48308    0.03952   88.14
trt1         3.54921    0.05589   63.51
p2vsmean    -1.14774    0.04720  -24.32
p3vsmean     1.11729    0.04720   23.67
p4vsmean     3.01025    0.04720   63.77

अच्छा - लेकिन मानक त्रुटि अनुमान कैसे प्राप्त करें? और यह एक तरह से बातचीत / अवधि प्रभाव की कोडिंग का उपयोग करने के लिए संभव नहीं होना चाहिएβ~(आपका beta_t) सीधे एटीई है (फिर एसई अनुमान के साथ)?
टॉमका

@tomka, यह संभव है, मुझे नहीं पता कि मॉडल 2 में इंटरेक्शन शब्द के विपरीत मैट्रिक्स को कैसे निर्देशित किया जाए, बाद में कुछ शोध और वापसी करेंगे।
jujae

आपके उत्तर के बारे में सोचते हुए, मैंने यह पाया। मुझे लगता है कि विचलन कोडिंग वही करता है जो मैं चाहता हूं। आप इसका परीक्षण कर सकते हैं और इसे अपने उत्तर में शामिल कर सकते हैं। ats.ucla.edu/stat/sas/webbooks/reg/chapter5/…
tomka

@tomka: यह वास्तव में मेरे दिमाग में है, अपने प्रश्न के लिए मेरी मूल टिप्पणी देखें जहां मैंने विचलन कोडिंग का उल्लेख किया है :), मैं इसे लागू करने और बाद में उत्तर को अपडेट करने का प्रयास करूंगा। (R में इसे बिना किसी परेशानी के मैन्युअल रूप से कोडिंग के लिए डमी वैरिएबल बनाने से परेशानी होती है, लेकिन ऐसा लगता है कि ऐसा करने का एकमात्र तरीका है)।
jujae

@tomka: देरी के लिए खेद है, विचलन कोड भाग को अपडेट किया
jujae

0

पहले प्रश्न के लिए, मेरी समझ यह है कि "फैंसी" तरीकों की आवश्यकता केवल तब होती है जब यह तुरंत स्पष्ट नहीं होता है कि उपचार संभावित परिणामों से स्वतंत्र है। इन मामलों में, आपको यह तर्क देने की आवश्यकता है कि डेटा के कुछ पहलू उपचार के लिए यादृच्छिक असाइनमेंट के एक अनुमान के लिए अनुमति देते हैं, जो हमें इंस्ट्रूमेंटल वेरिएबल्स, रिग्रेशन डिसकंटीनिटी, और इसके आगे मिलता है।

आपके मामले में, इकाइयों को बेतरतीब ढंग से उपचार के लिए सौंपा गया है, इसलिए यह विश्वसनीय लगता है कि उपचार संभावित परिणामों से स्वतंत्र है। तब हम केवल चीजों को सरल रख सकते हैं: मॉडल 1 को सामान्य से कम वर्गों के साथ अनुमान लगाएं, और आपके पास एटीई का एक सुसंगत अनुमान है। चूंकि यूनिटों को बेतरतीब ढंग से उपचार के लिए सौंपा गया है, यह उन कुछ मामलों में से एक है जहां एक यादृच्छिक-प्रभाव धारणा विश्वसनीय है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.