मेरे पास विश्लेषण करने के लिए असंतुलित दोहराए गए डेटा सेट हैं, और मैंने पढ़ा है कि जिस तरह से अधिकांश सांख्यिकीय पैकेज एनोवा (यानी III प्रकार के वर्ग) के साथ इसे संभालते हैं, वह गलत है। इसलिए, मैं इन आंकड़ों का विश्लेषण करने के लिए एक मिश्रित प्रभाव मॉडल का उपयोग करना चाहूंगा। मैंने मिश्रित मॉडलों के बारे में बहुत कुछ पढ़ा है R
, लेकिन मैं अभी भी बहुत नए R
और मिश्रित प्रभाव वाले मॉडल हूं और बहुत आश्वस्त नहीं हूं कि मैं चीजों को सही कर रहा हूं। ध्यान दें कि मैं अभी तक पूरी तरह से "पारंपरिक" तरीकों से खुद को तलाक नहीं दे सकता हूं, और अभी भी टेस्ट और पोस्ट टेस्ट की आवश्यकता है।
मैं जानना चाहूंगा कि क्या निम्नलिखित दृष्टिकोण समझ में आता है, या यदि मैं कुछ गलत कर रहा हूं। यहाँ मेरा कोड है:
# load packages
library(lme4)
library(languageR)
library(LMERConvenienceFunctions)
library(coda)
library(pbkrtest)
# import data
my.data <- read.csv("data.csv")
# create separate data frames for each DV & remove NAs
region.data <- na.omit(data.frame(time=my.data$time, subject=my.data$subject, dv=my.data$dv1))
# output summary of data
data.summary <- summary(region.data)
# fit model
# "time" is a factor with three levels ("t1", "t2", "t3")
region.lmer <- lmer(dv ~ time + (1|subject), data=region.data)
# check model assumptions
mcp.fnc(region.lmer)
# remove outliers (over 2.5 standard deviations)
rm.outliers <- romr.fnc(region.lmer, region.data, trim=2.5)
region.data <- rm.outliers$data
region.lmer <- update(region.lmer)
# re-check model assumptions
mcp.fnc(region.lmer)
# compare model to null model
region.lmer.null <- lmer(dv ~ 1 + (1|subject), data=region.data)
region.krtest <- KRmodcomp(region.lmer, region.lmer.null)
# output lmer summary
region.lmer.summary <- summary(region.lmer)
# run post hoc tests
t1.pvals <- pvals.fnc(region.lmer, ndigits=10, withMCMC=TRUE)
region.lmer <- lmer(dv ~ relevel(time,ref="t2") + (1|subject), data=region.data)
t2.pvals <- pvals.fnc(region.lmer, ndigits=10, withMCMC=TRUE)
region.lmer <- lmer(dv ~ relevel(time,ref="t3") + (1|subject), data=region.data)
t3.pvals <- pvals.fnc(region.lmer, ndigits=10, withMCMC=TRUE)
# Get mcmc mean and 50/95% HPD confidence intervals for graphs
# repeated three times and stored in a matrix (not shown here for brevity)
as.numeric(t1.pvals$fixed$MCMCmean)
as.numeric(t1.pvals$fixed$HPD95lower)
as.numeric(t1.pvals$fixed$HPD95upper)
HPDinterval(as.mcmc(t1.pvals$mcmc),prob=0.5)
HPDinterval(as.mcmc(t1.pvals$mcmc),prob=0.5)
कुछ विशिष्ट प्रश्न मेरे पास हैं:
- क्या यह मिश्रित प्रभाव मॉडल के विश्लेषण का एक वैध तरीका है? यदि नहीं, तो इसके बजाय मुझे क्या करना चाहिए।
- मॉडल मान्यताओं की पुष्टि करने के लिए mcp.fnc द्वारा आलोचना प्लॉट आउटपुट काफी अच्छे हैं, या मुझे अतिरिक्त कदम उठाने चाहिए।
- मुझे लगता है कि मिश्रित मॉडल वैध होने के लिए, डेटा को सामान्यता और समरूपता की सम्मान मान्यताओं की आवश्यकता है। मैं कैसे आंक सकता हूं कि "लगभग सामान्य" क्या है और mcp.fnc द्वारा उत्पन्न आलोचना के भूखंडों को देखकर क्या नहीं है? क्या मुझे बस इसके लिए एक अनुभव प्राप्त करने की आवश्यकता है, या क्या उनका काम करने का एक निर्धारित तरीका है? इन मान्यताओं के संबंध में मिश्रित मॉडल कितने मजबूत हैं?
- मुझे अपने नमूने में विषयों की ~ 20 विशेषताओं (बायोमार्कर) के लिए तीन समय बिंदुओं के बीच अंतर का आकलन करने की आवश्यकता है। क्या प्रत्येक स्वीकार्य के लिए फिटिंग और अलग-अलग मॉडल का परीक्षण करना, जब तक कि मैं सभी किए गए परीक्षणों (महत्वपूर्ण या नहीं) की रिपोर्ट करता हूं, या क्या मुझे कई तुलनाओं के लिए किसी भी प्रकार के सुधार की आवश्यकता है।
प्रयोग के संबंध में थोड़ा और सटीक होने के लिए, यहां कुछ और विवरण दिए गए हैं। जब तक वे किसी उपचार से गुजरते हैं, हमने अनुदैर्ध्य रूप से कई प्रतिभागियों का अनुसरण किया। हमने उपचार शुरू होने से पहले और बाद में दो समय बिंदुओं पर कई बायोमार्कर को मापा। मैं देखना चाहूंगा कि क्या तीन समय बिंदुओं के बीच इन बायोमार्करों में अंतर है।
मैं इस ट्यूटोरियल में यहां जो कुछ भी कर रहा हूं, उसमें से अधिकांश को आधार बना रहा हूं , लेकिन मैंने अपनी जरूरतों और मेरे द्वारा पढ़ी गई चीजों के आधार पर कुछ बदलाव किए हैं। मेरे द्वारा किए गए परिवर्तन हैं:
- t1-t2, t2-t3, और t1-t3 तुलना को pvals.fnc (languageR पैकेज से) से प्राप्त करने के लिए "समय" कारक को फिर से देखें।
- मेरे मिक्स्ड मॉडल की तुलना केनवर्ड-रोजर के दृष्टिकोण (pbkrtest पैकेज का उपयोग करते हुए) के बजाय अनुमानित अनुपात परीक्षण के आधार पर अनुमानित एफ-टेस्ट का उपयोग करके अशक्त मॉडल से करें (क्योंकि मैं पढ़ता हूं, कि केनवर्ड-रोजर को अभी बेहतर माना जाता है)
- मान्यताओं की जांच करने और आउटलेर्स को हटाने के लिए LMERConvenienceFunctions पैकेज का उपयोग करें (क्योंकि मैंने पढ़ा कि मिश्रित मॉडल आउटकम के लिए बहुत संवेदनशील हैं)