रैखिक मिश्रित मॉडल के लिए एक चित्र क्या होगा?


17

कहें कि आप अपने आँकड़ों के विभाग के पुस्तकालय में हैं, और यह कि आप सामने वाले पृष्ठ पर निम्नलिखित चित्र के साथ एक पुस्तक भर में आएँगे।

यहाँ छवि विवरण दर्ज करें

आप शायद सोचेंगे कि यह रैखिक प्रतिगमन चीजों के बारे में एक किताब है।

वह चित्र क्या होगा जो आपको रैखिक मिश्रित मॉडल के बारे में सोचने पर मजबूर करेगा?

जवाबों:


12

एक बात के लिए, मैंने निम्नलिखित चित्र का उपयोग किया है जो sleepstudyकि lme4 पैकेज से डेटासेट पर आधारित है । यह विचार यादृच्छिक-प्रभाव मॉडल से विषय-विशिष्ट डेटा (ग्रे) बनाम भविष्यवाणियों से स्वतंत्र प्रतिगमन फिट के अंतर को स्पष्ट करने के लिए था , विशेष रूप से यह कि (1) यादृच्छिक-प्रभाव मॉडल से अनुमानित मान सिकुड़न अनुमानक हैं और यह (2) व्यक्ति प्रक्षेपवक्र साझा कर सकते हैं एक यादृच्छिक-अवरोधक केवल मॉडल (नारंगी) के साथ एक सामान्य ढलान। विषय अंतर के वितरण को y- अक्ष ( R कोड ) पर कर्नेल घनत्व अनुमान के रूप में दिखाया गया है ।

यहाँ छवि विवरण दर्ज करें
(घनत्व घटता मनाया मूल्यों की सीमा से परे है क्योंकि अपेक्षाकृत कम अवलोकन हैं।)

एक अधिक 'पारंपरिक' ग्राफिक अगला हो सकता है, जो डग बेट्स से है (जो कि lme4 के लिए आर-फोर्ज साइट पर उपलब्ध है , जैसे 4Longitudinal.R ), जहां हम प्रत्येक पैनल में अलग-अलग डेटा जोड़ सकते हैं।

यहाँ छवि विवरण दर्ज करें


+1। अच्छा था! मुझे लगता है कि वैचारिक स्तर पर आपका पहला कथानक महान है। मेरी एकमात्र टिप्पणी यह ​​होगी कि इसे एक मानक "भोली" साजिश की तुलना में काफी अधिक स्पष्टीकरण की आवश्यकता है और अगर दर्शक एलएमई मॉडल और अनुदैर्ध्य डेटा की अवधारणाओं के साथ गति करने के लिए तैयार नहीं हैं, तो यह भूखंड के बिंदु को याद कर सकता है। मैं निश्चित रूप से इसे एक ठोस "आंकड़े बात" के लिए याद करूंगा। (मैं पहले से ही एक बार "lme4 पुस्तक" में दूसरे प्लॉट को देख चुका हूं। मैं तब बहुत प्रभावित नहीं हुआ था और अब मैं बहुत प्रभावित भी नहीं हूं।)
usεr11852

@chl: धन्यवाद! मैं प्रस्तावों के बीच चयन करूंगा। इस बीच,
ओश्राम

@ user11852 आरआई मॉडल के बारे में मेरी समझ यह है कि ओएलएस का अनुमान सही है, लेकिन उनकी मानक त्रुटियां (स्वतंत्रता की कमी के कारण) नहीं हैं, इसलिए व्यक्तिगत पूर्वानुमान गलत भी होंगे। आमतौर पर, मैं स्वतंत्र टिप्पणियों को मानते हुए समग्र प्रतिगमन लाइन दिखाऊंगा। फिर, सिद्धांत हमें बताता है कि यादृच्छिक प्रभावों के सशर्त मोड और निश्चित प्रभावों के अनुमानों के संयोजन के भीतर-भीतर गुणांक के सशर्त मोड की पैदावार होती है, और सांख्यिकीय इकाइयों के अलग-अलग होने पर, या जब माप सही होते हैं, या तो बहुत कम नुकसान होता है। बड़े नमूने।
chl

y|γ~एन(एक्सβ+जेडγ,σ2मैं)y~एन(एक्सβ,जेडडीजेडटी+σ2मैं)

चित्र बनाने के लिए R कोड का लिंक टूटा हुआ है। मुझे इस बात में दिलचस्पी होगी कि आंकड़े में लंबवत वितरण कैसे आकर्षित किया जाए।
नील्स हैमलेर्स

8

तो कुछ "अत्यंत सुरुचिपूर्ण" नहीं है, लेकिन यादृच्छिक इंटरसेप्ट और ढलान को भी आर के साथ दिखा रहा है (मुझे लगता है कि अगर यह वास्तविक समीकरणों को भी दिखाया जाए तो यह और भी अच्छा होगा) यहाँ छवि विवरण दर्ज करें

N =100; set.seed(123);


x1 = runif(N)*3; readings1 <- 2*x1 + 1.0 + rnorm(N)*.99;
x2 = runif(N)*3; readings2 <- 3*x2 + 1.5 + rnorm(N)*.99;
x3 = runif(N)*3; readings3 <- 4*x3 + 2.0 + rnorm(N)*.99;
x4 = runif(N)*3; readings4 <- 5*x4 + 2.5 + rnorm(N)*.99;
x5 = runif(N)*3; readings5 <- 6*x5 + 3.0 + rnorm(N)*.99;

X = c(x1,x2,x3,x4,x5);
Y = c(readings1,readings2,readings3,readings4,readings5)
Grouping  = c(rep(1,N),rep(2,N),rep(3,N),rep(4,N),rep(5,N))

library(lme4);
LMERFIT <- lmer(Y ~ 1+ X+ (X|Grouping))

RIaS <-unlist( ranef(LMERFIT)) #Random Intercepts and Slopes
FixedEff <- fixef(LMERFIT)    # Fixed Intercept and Slope

png('SampleLMERFIT_withRandomSlopes_and_Intercepts.png', width=800,height=450,units="px" )
par(mfrow=c(1,2))
plot(X,Y,xlab="x",ylab="readings")
plot(x1,readings1, xlim=c(0,3), ylim=c(min(Y)-1,max(Y)+1), pch=16,xlab="x",ylab="readings" )
points(x2,readings2, col='red', pch=16)
points(x3,readings3, col='green', pch=16)
points(x4,readings4, col='blue', pch=16)
points(x5,readings5, col='orange', pch=16)
abline(v=(seq(-1,4 ,1)), col="lightgray", lty="dotted");        
abline(h=(seq( -1,25 ,1)), col="lightgray", lty="dotted")   

lines(x1,FixedEff[1]+ (RIaS[6] + FixedEff[2])* x1+ RIaS[1], col='black')
lines(x2,FixedEff[1]+ (RIaS[7] + FixedEff[2])* x2+ RIaS[2], col='red')
lines(x3,FixedEff[1]+ (RIaS[8] + FixedEff[2])* x3+ RIaS[3], col='green')
lines(x4,FixedEff[1]+ (RIaS[9] + FixedEff[2])* x4+ RIaS[4], col='blue')
lines(x5,FixedEff[1]+ (RIaS[10]+ FixedEff[2])* x5+ RIaS[5], col='orange') 
legend(0, 24, c("Group1","Group2","Group3","Group4","Group5" ), lty=c(1,1), col=c('black','red', 'green','blue','orange'))
dev.off()

धन्यवाद! मैं संभावित नए उत्तरों के लिए थोड़ा और इंतजार करता हूं ... लेकिन मैं इस पर निर्माण कर सकता हूं।
ओकराम

मैं आपके आंकड़े से थोड़ा भ्रमित हूं, क्योंकि सही सबप्लॉट मुझे ऐसा लगता है जैसे कि अलग-अलग प्रतिगमन रेखा प्रत्येक समूह के लिए फिट थीं। क्या यह संपूर्ण बिंदु नहीं है कि मिश्रित मॉडल फिट स्वतंत्र समूह प्रति फिट से भिन्न होना चाहिए? शायद वे हैं, लेकिन इस उदाहरण में यह नोटिस करना वास्तव में कठिन है, या क्या मुझे कुछ याद आ रहा है?
अमीबा का कहना है कि मोनिका

2
हां, गुणांक अलग हैं । नहीं; प्रत्येक समूह के लिए एक अलग प्रतिगमन फिट नहीं था। सशर्त फिट दिखाए गए हैं। एक पूरी तरह से संतुलित, समरूप डिजाइन में यह अंतर वास्तव में नोटिस करना कठिन होगा, उदाहरण के लिए समूह 5 का सशर्त अवरोधन 2.96 है जबकि स्वतंत्र प्रति समूह अवरोधन 3.00 है। यह त्रुटि सहसंयोजक संरचना है जिसे आप बदल रहे हैं। ची के जवाब की भी जाँच करें, इसमें और भी समूह हैं लेकिन यहाँ तक कि बहुत कम मामलों में फिट "नेत्रहीन" बहुत अलग है।
us --r11852

6

मेरे काम का नहीं

लक्समफिट के मैटलैब डॉक्यूमेंटेशन से लिया गया यह ग्राफ मुझे बहुत स्पष्ट रूप से रैंडम इंटरसेप्ट्स और स्लोप्स के कॉन्सेप्ट का उदाहरण देता है। संभवतः एक OLS भूखंड के अवशेषों में विषमलैंगिकता के समूहों को दिखाते हुए कुछ मानक भी होंगे, लेकिन मैं "समाधान" नहीं दूंगा।


तुम्हारे सुझाव के लिए धन्यवाद। यद्यपि यह मिश्रित लॉजिस्टिक रिग्रेशन चीजों की तरह दिखता है, मुझे लगता है कि मैं इसे आसानी से अनुकूलित कर सकता हूं। मुझे और सुझावों की प्रतीक्षा है। इस बीच, +1। एक बार फिर धन्यवाद।
ओकराम

यह मिश्रित लॉजिस्टिक रिग्रेशन को अधिक पसंद करता है क्योंकि यह एक है ... :) यह पहला प्लॉट था जो वास्तव में मेरे दिमाग में आया था! मैं दूसरे उत्तर में विशुद्ध रूप से R-ish कुछ देता हूँ।
us --r11852
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.