यदि आप एक "पारिवारिक प्रभाव" और एक "आइटम प्रभाव" प्राप्त करना चाहते हैं, तो हम इन दोनों के लिए यादृच्छिक अवरोधक होने के बारे में सोच सकते हैं और फिर इसे 'lme4' पैकेज के साथ मॉडल कर सकते हैं।
लेकिन, पहले हमें प्रत्येक भाई-बहनों को परिवार के भीतर एक अनोखी आईडी के बजाय एक अनोखी आईडी देनी होगी ।
फिर " विभिन्न वस्तुओं के लिए एक ही परिवार के भीतर भाई-बहनों पर किए गए माप के बीच संबंध" के लिए , हम कुछ इस तरह निर्दिष्ट कर सकते हैं:
mod<-lmer(value ~ (1|family)+(1|item), data=family)
यह हमें सभी भाई-बहनों के लिए एक निश्चित प्रभाव अवरोधन देगा, और फिर परिवार और आइटम के लिए दो यादृच्छिक प्रभाव (विचरण के साथ) स्वीकार करता है।
फिर, "एक ही आइटम के लिए एक ही परिवार के भीतर भाई-बहन पर किए गए माप के बीच संबंध" के लिए , हम एक ही काम कर सकते हैं लेकिन हमारे डेटा को कम कर सकते हैं, इसलिए हमारे पास कुछ ऐसा है:
mod2<-lmer(value ~ (1|family), data=subset(family,item=="1"))
मुझे लगता है कि यह आपके प्रश्न का आसान तरीका हो सकता है। लेकिन, यदि आप केवल आइटम या परिवार के लिए ICC चाहते हैं, तो 'साइक' पैकेज में ICC () फ़ंक्शन है - बस इस बात से सावधान रहें कि आपके उदाहरण डेटा में आइटम और मूल्य कैसे पिघले हैं।
अपडेट करें
नीचे कुछ मेरे लिए नया है, लेकिन मुझे इसे पूरा करने में मज़ा आया। मैं वास्तव में नकारात्मक इंट्राक्लास सहसंबंध के विचार से परिचित नहीं हूं। हालाँकि मैं विकिपीडिया पर देखता हूँ कि "आरंभिक आईसीसी बचावों" ने युग्मित डेटा के साथ नकारात्मक सहसंबंध के लिए अनुमति दी थी। लेकिन जैसा कि अब इसका सबसे अधिक उपयोग किया जाता है, ICC को कुल विचरण के अनुपात के रूप में समझा जाता है जो कि समूह-विचरण के बीच है। और यह मान हमेशा सकारात्मक होता है। हालांकि विकिपीडिया सबसे अधिक आधिकारिक संदर्भ नहीं हो सकता है, यह सारांश इस बात से मेल खाता है कि मैंने हमेशा ICC का उपयोग कैसे देखा है:
इस एनोवा संरचना का एक फायदा यह है कि विभिन्न समूहों में विभिन्न डेटा मान हो सकते हैं, जो पहले के आईसीसी आंकड़ों का उपयोग कर संभालना मुश्किल है। यह भी ध्यान दें कि यह ICC हमेशा गैर-नकारात्मक होता है, इसकी व्याख्या कुल विचरण के अनुपात के रूप में की जाती है, जो "समूहों के बीच" होता है। इस आईसीसी को कोवरिएट प्रभावों की अनुमति देने के लिए सामान्यीकृत किया जा सकता है, जिस स्थिति में आईसीसी को कोवेरिएट-एडजस्टेड डेटा मानों के भीतर-वर्ग समानता को कैप्चर करने के रूप में व्याख्या की जाती है।
उन्होंने कहा कि आपके द्वारा दिए गए डेटा की तरह, आइटम 1, 2 और 3 के बीच का अंतर-वर्ग सहसंबंध बहुत अच्छी तरह से नकारात्मक हो सकता है। और हम इसे मॉडल कर सकते हैं, लेकिन समूहों के बीच समझाया गया विचरण का अनुपात अभी भी सकारात्मक होगा।
# load our data and lme4
library(lme4)
## Loading required package: Matrix
dat<-read.table("http://www.wvbauer.com/fam_sib_item.dat", header=TRUE)
तो परिवारों के बीच कितने प्रतिशत विचरण होता है , आइटम-समूहों के बीच समूह विचरण के लिए भी नियंत्रित करना? हम आपके द्वारा सुझाए गए जैसे एक यादृच्छिक अंतर मॉडल का उपयोग कर सकते हैं:
mod<-lmer(yijk ~ (1|family)+(1|item), data=dat)
summary(mod)
## Linear mixed model fit by REML ['lmerMod']
## Formula: yijk ~ (1 | family) + (1 | item)
## Data: dat
##
## REML criterion at convergence: 4392.3
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -3.6832 -0.6316 0.0015 0.6038 3.9801
##
## Random effects:
## Groups Name Variance Std.Dev.
## family (Intercept) 0.3415 0.5843
## item (Intercept) 0.8767 0.9363
## Residual 4.2730 2.0671
## Number of obs: 1008, groups: family, 100; item, 3
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) 2.927 0.548 5.342
हम दो यादृच्छिक प्रभावों के अंतर और अवशिष्टों से विचरण प्राप्त करके ICC की गणना करते हैं। हम तब सभी प्रकार के वर्गों के योग पर परिवार के विचरण के वर्ग की गणना करते हैं।
temp<-as.data.frame(VarCorr(mod))$vcov
temp.family<-(temp[1]^2)/(temp[1]^2+temp[2]^2+temp[3]^2)
temp.family
## [1] 0.006090281
फिर हम अन्य दो भिन्न अनुमानों के लिए भी ऐसा कर सकते हैं:
# variance between item-groups
temp.items<-(temp[2]^2)/(temp[1]^2+temp[2]^2+temp[3]^2)
temp.items
## [1] 0.04015039
# variance unexplained by groups
temp.resid<-(temp[3]^2)/(temp[1]^2+temp[2]^2+temp[3]^2)
temp.resid
## [1] 0.9537593
# clearly then, these will sum to 1
temp.family+temp.items+temp.resid
## [1] 1
ये परिणाम बताते हैं कि कुल विचलन में से बहुत कम परिवारों के बीच या आइटम-समूहों के बीच विचरण द्वारा समझाया गया है। लेकिन, जैसा कि ऊपर उल्लेख किया गया है, वस्तुओं के बीच अंतर-श्रेणी का संबंध अभी भी नकारात्मक हो सकता है। पहले अपना डेटा एक व्यापक प्रारूप में प्राप्त करें:
# not elegant but does the trick
dat2<-cbind(subset(dat,item==1),subset(dat,item==2)[,1],subset(dat,item==3)[,1])
names(dat2)<-c("item1","family","sibling","item","item2","item3")
अब हम सह-संबंध को मॉडल कर सकते हैं, उदाहरण के लिए, आइटम 1 और आइटम 3 पहले की तरह परिवार के लिए एक यादृच्छिक अवरोधन के साथ। लेकिन पहले, शायद यह याद रखने योग्य है कि एक साधारण रेखीय प्रतिगमन के लिए, मॉडल 1 के आर-स्क्वैयर का वर्गमूल आइटम 1 और आइटम 2 के लिए इंटर-क्लास सहसंबंध गुणांक (पीयरसन की आर) के समान है।
# a simple linear regression
mod2<-lm(item1~item3,data=dat2)
# extract pearson's r
sqrt(summary(mod2)$r.squared)
## [1] 0.6819125
# check this
cor(dat2$item1,dat2$item3)
## [1] 0.6819125
# yep, equal
# now, add random intercept to the model
mod3<-lmer(item1 ~ item3 + (1|family), data=dat2)
summary(mod3)
## Linear mixed model fit by REML ['lmerMod']
## Formula: item1 ~ item3 + (1 | family)
## Data: dat2
##
## REML criterion at convergence: 1188.8
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -2.3148 -0.5348 -0.0136 0.5724 3.2589
##
## Random effects:
## Groups Name Variance Std.Dev.
## family (Intercept) 0.686 0.8283
## Residual 1.519 1.2323
## Number of obs: 336, groups: family, 100
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) -0.07777 0.15277 -0.509
## item3 0.52337 0.02775 18.863
##
## Correlation of Fixed Effects:
## (Intr)
## item3 -0.699
आइटम 1 और आइटम 3 के बीच संबंध सकारात्मक है। लेकिन, सिर्फ यह जांचने के लिए कि हम यहां नकारात्मक सहसंबंध प्राप्त कर सकते हैं, आइए अपने डेटा में हेरफेर करें:
# just going to multiply one column by -1
# to force this cor to be negative
dat2$neg.item3<-dat2$item3*-1
cor(dat2$item1, dat2$neg.item3)
## [1] -0.6819125
# now we have a negative relationship
# replace item3 with this manipulated value
mod4<-lmer(item1 ~ neg.item3 + (1|family), data=dat2)
summary(mod4)
## Linear mixed model fit by REML ['lmerMod']
## Formula: item1 ~ neg.item3 + (1 | family)
## Data: dat2
##
## REML criterion at convergence: 1188.8
##
## Scaled residuals:
## Min 1Q Median 3Q Max
## -2.3148 -0.5348 -0.0136 0.5724 3.2589
##
## Random effects:
## Groups Name Variance Std.Dev.
## family (Intercept) 0.686 0.8283
## Residual 1.519 1.2323
## Number of obs: 336, groups: family, 100
##
## Fixed effects:
## Estimate Std. Error t value
## (Intercept) -0.07777 0.15277 -0.509
## neg.item3 -0.52337 0.02775 -18.863
##
## Correlation of Fixed Effects:
## (Intr)
## neg.item3 0.699
तो हाँ, आइटम के बीच का संबंध नकारात्मक हो सकता है। लेकिन अगर हम इस संबंध में परिवारों के बीच के विचरण के अनुपात को देखें, यानी आईसीसी (परिवार), तो वह संख्या अभी भी सकारात्मक होगी। पहले जैसा:
temp2<-as.data.frame(VarCorr(mod4))$vcov
(temp2[1]^2)/(temp2[1]^2+temp2[2]^2)
## [1] 0.1694989
तो आइटम 1 और आइटम 3 के बीच संबंध के लिए, इस विचरण का लगभग 17% परिवारों के बीच विचरण के कारण है। और, हमने अभी भी आइटम के बीच नकारात्मक सहसंबंध होने की अनुमति दी है।