रैखिक मिश्रित मॉडल में यादृच्छिक और निश्चित-प्रभाव संरचना कैसे चुनें?


19

विषयों के डिजाइन के भीतर दो तरह से निम्नलिखित डेटा पर विचार करें:

df <- "http://personality-project.org/r/datasets/R.appendix4.data"
df <- read.table(df,header=T)
head(df)

Observation Subject Task Valence Recall
1           1     Jim Free     Neg      8
2           2     Jim Free     Neu      9
3           3     Jim Free     Pos      5
4           4     Jim Cued     Neg      7
5           5     Jim Cued     Neu      9
6           6     Jim Cued     Pos     10

मैं मिश्रित-रैखिक मॉडल का उपयोग करके इसका विश्लेषण करना चाहूंगा। सभी संभावित - और यादृच्छिक-प्रभावों को ध्यान में रखते हुए कई संभावित मॉडल हैं:

# different fixed effects with random-intercept
a0 <- lmer(Recall~1 + (1|Subject), REML=F,df)
a1 <- lmer(Recall~Task + (1|Subject), REML=F,df)
a2 <- lmer(Recall~Valence + (1|Subject), REML=F,df)
a3 <- lmer(Recall~Task+Valence + (1|Subject), REML=F,df)
a4 <- lmer(Recall~Task*Valence + (1|Subject), REML=F,df)

# different fixed effects with random-intercept-random-slope
b0 <- lmer(Recall~1 + (1|Subject) + (0+Task|Subject) + (0+Valence|Subject), REML=F,df)
b1 <- lmer(Recall~Task + (1|Subject) + (0+Task|Subject) + (0+Valence|Subject), REML=F,df)
b2 <- lmer(Recall~Valence + (1|Subject) + (0+Task|Subject) + (0+Valence|Subject), REML=F,df)
b3 <- lmer(Recall~Task+Valence + (1|Subject) + (0+Task|Subject) + (0+Valence|Subject), REML=F,df)
b4 <- lmer(Recall~Task*Valence + (1|Subject) + (0+Task|Subject) + (0+Valence|Subject), REML=F,df)

# different fixed effects with random-intercept-random-slope including variance-covariance matrix
c0 <- lmer(Recall~1 + (1 + Valence + Task|Subject), REML=F,df)
c1 <- lmer(Recall~Task + (1 + Valence + Task|Subject), REML=F,df)
c2 <- lmer(Recall~Valence + (1 + Valence + Task|Subject), REML=F,df)
c3 <- lmer(Recall~Task+Valence + (1 + Valence + Task|Subject), REML=F,df)
c4 <- lmer(Recall~Task*Valence + (1 + Valence + Task|Subject), REML=F,df)
  1. इस संदर्भ में सर्वश्रेष्ठ फिटिंग मॉडल का चयन करने का अनुशंसित तरीका क्या है? लॉग-लाइबिलिटी अनुपात परीक्षण का उपयोग करते समय अनुशंसित प्रक्रिया क्या है? मॉडल को ऊपर की ओर उत्पन्न करना (अशक्त मॉडल से सबसे जटिल मॉडल तक) या नीचे की ओर (सबसे जटिल मॉडल से अशक्त मॉडल के लिए)? चरणबद्ध समावेशन या बहिष्करण? या क्या सभी मॉडलों को एक लॉग-लाइबिलिटी अनुपात परीक्षण में रखने और सबसे कम पी-मूल्य वाले मॉडल का चयन करने की सिफारिश की गई है? ऐसे मॉडल की तुलना कैसे करें जो नेस्टेड नहीं हैं?

  2. क्या पहले उपयुक्त निश्चित-प्रभाव संरचना और फिर उपयुक्त यादृच्छिक-प्रभाव संरचना या दूसरे तरीके के दौर (मुझे दोनों विकल्पों के संदर्भ मिल गए हैं ...) खोजने की सिफारिश की गई है?

  3. परिणामों की रिपोर्ट करने का अनुशंसित तरीका क्या है? लॉग-संभावना अनुपात परीक्षण से पी-मान की रिपोर्टिंग पूर्ण मिश्रित मॉडल (प्रश्न में प्रभाव के साथ) की तुलना में कम मॉडल (प्रश्न में प्रभाव के बिना)। या सर्वश्रेष्ठ फिटिंग मॉडल को खोजने के लिए लॉग-लाइबिलिटी अनुपात परीक्षण का उपयोग करना बेहतर है और फिर सर्वश्रेष्ठ फिटिंग मॉडल में प्रभाव से पी-मूल्यों की रिपोर्ट करने के लिए लैमरटेस्ट का उपयोग करें?

जवाबों:


18

मुझे यकीन नहीं है कि वास्तव में इसके लिए एक विहित जवाब है, लेकिन मैं इसे एक शॉट दूंगा।

इस संदर्भ में सर्वश्रेष्ठ फिटिंग मॉडल का चयन करने का अनुशंसित तरीका क्या है? लॉग-लाइबिलिटी अनुपात परीक्षण का उपयोग करते समय अनुशंसित प्रक्रिया क्या है? मॉडल को ऊपर की ओर उत्पन्न करना (अशक्त मॉडल से सबसे जटिल मॉडल तक) या नीचे की ओर (सबसे जटिल मॉडल से अशक्त मॉडल के लिए)? चरणबद्ध समावेशन या बहिष्करण? या क्या सभी मॉडलों को एक लॉग-लाइबिलिटी अनुपात परीक्षण में रखने और सबसे कम पी-मूल्य वाले मॉडल का चयन करने की सिफारिश की गई है? ऐसे मॉडल की तुलना कैसे करें जो नेस्टेड नहीं हैं?

यह निर्भर करता है कि आपके लक्ष्य क्या हैं।

  • सामान्य तौर पर आप होना चाहिए बहुत , बहुत मॉडल चयन के बारे में सावधान (जैसे देखने के इस जवाब , या इस पोस्ट , या बस गूगल "Harrell चरणबद्ध" ...)।
  • यदि आप अपने पी-वैल्यू को सार्थक होने में रुचि रखते हैं (यानी आप कंफर्मेटरी परिकल्पना परीक्षण कर रहे हैं), तो आपको मॉडल का चयन नहीं करना चाहिए । हालाँकि : यह मेरे लिए इतना स्पष्ट नहीं है कि क्या मॉडल चयन प्रक्रियाएं बहुत खराब हैं यदि आप मॉडल के गैर-फोकल भागों पर मॉडल चयन कर रहे हैं , जैसे कि यादृच्छिक प्रभाव पर मॉडल चयन करना यदि आपकी प्राथमिक रुचि निश्चित प्रभावों पर निष्कर्ष है।
  • "सभी मॉडलों को एक ही अनुपात अनुपात परीक्षण में रखना" जैसी कोई बात नहीं है - संभावना अनुपात परीक्षण एक जोड़ी प्रक्रिया है। यदि आप यादृच्छिक प्रभावों पर मॉडल चयन (जैसे) करना चाहते हैं, तो मैं शायद इस उदाहरण में सूचना मानदंड का उपयोग करते हुए "सभी को एक बार" दृष्टिकोण की सिफारिश करूंगा - जो कि कम से कम कुछ से बचता है स्टेपवाइज दृष्टिकोण की समस्याओं (लेकिन नहीं मॉडल चयन अधिक आम तौर पर)।
  • बर्र एट अल। 2013 "इसे अधिकतम रखें" स्मृति और भाषा का जर्नल (doi: 10.1016 / j.jml.2012.11.11.001) अधिकतम मॉडल (केवल) का उपयोग करने की सिफारिश करेगा।
  • श्रवण वशिष्ठ असहमत , यह तर्क देते हैं कि ऐसे मॉडल कमतर होने वाले हैं और इसलिए समस्याग्रस्त है जब तक कि डेटा सेट बहुत बड़ा नहीं है (और सिग्नल-टू-शोर अनुपात अधिक है)
  • एक और उचित रूप से रक्षात्मक दृष्टिकोण एक बड़े लेकिन उचित मॉडल को फिट करना है और फिर, यदि फिट एकवचन है, तो शर्तों को हटा दें जब तक कि यह अधिक न हो
  • कुछ कैविएट ( GLMM FAQ में संलग्न ) के साथ, आप गैर-नेस्टेड मॉडल की तुलना करने के लिए सूचना मानदंड का उपयोग अलग-अलग यादृच्छिक प्रभावों के साथ कर सकते हैं (हालांकि ब्रायन रिप्ले असहमत हैं: पी 6 के नीचे देखें )।

क्या पहले उपयुक्त निश्चित-प्रभाव संरचना और फिर उपयुक्त यादृच्छिक-प्रभाव संरचना या दूसरे तरीके के दौर (मुझे दोनों विकल्पों के संदर्भ मिल गए हैं ...) खोजने की सिफारिश की गई है?

मुझे नहीं लगता कि कोई भी जानता है। मॉडल चयन के बारे में अधिक सामान्य रूप से पिछला उत्तर देखें। यदि आप अपने लक्ष्यों को पर्याप्त रूप से स्पष्ट रूप से परिभाषित कर सकते हैं (जो कुछ लोग करते हैं), तो सवाल जवाब योग्य हो सकता है। यदि आपके पास दोनों विकल्पों के लिए संदर्भ हैं, तो उन्हें शामिल करने के लिए आपके प्रश्न को संपादित करना उपयोगी होगा ... (इसके लायक क्या है, यह उदाहरण (पहले से ही ऊपर उद्धृत किया गया है) यादृच्छिक प्रभावों वाले भाग का चयन करने के लिए सूचना मानदंड का उपयोग करता है, फिर चयन पर एशेज करता है। मॉडल का निश्चित प्रभाव वाला हिस्सा।

परिणामों की रिपोर्ट करने का अनुशंसित तरीका क्या है? लॉग-संभावना अनुपात परीक्षण से पी-मान की रिपोर्टिंग पूर्ण मिश्रित मॉडल (प्रश्न में प्रभाव के साथ) की तुलना में कम मॉडल (प्रश्न में प्रभाव के बिना)। या सर्वश्रेष्ठ फिटिंग मॉडल को खोजने के लिए लॉग-लाइबिलिटी अनुपात परीक्षण का उपयोग करना बेहतर है और फिर सर्वश्रेष्ठ फिटिंग मॉडल में प्रभाव से पी-मूल्यों की रिपोर्ट करने के लिए लैमरटेस्ट का उपयोग करें?

यह (अफसोस) एक और मुश्किल सवाल है। आप रिपोर्ट यदि सीमांत प्रभाव के रूप में द्वारा की सूचना दी lmerTest, तो आप marginality के बारे में चिंता करने की ज़रूरत है (जैसे, चाहे के मुख्य प्रभाव के अनुमान Aऔर Bसार्थक हैं जब वहाँ एक है A-by- Bमॉडल में बातचीत); यह कीड़े का एक विशाल कैन है, लेकिन अगर आप इसकी सलाह देते हैं तो इसे कुछ हद तक कम कर दिया contrasts="sum"जाता है afex::mixed()। बैलेंस्ड डिजाइन भी थोड़ी मदद करते हैं। यदि आप वास्तव में इन सभी दरारों पर पेपर करना चाहते हैं, तो मुझे लगता है कि मैं सिफारिश करूंगा afex::mixed, जो आपको समान उत्पादन देता है lmerTest, लेकिन इन मुद्दों से निपटने की कोशिश करता है।


12

मई 2017 को अपडेट करें : जैसा कि यह पता चला है, मैंने यहां जो कुछ भी लिखा है वह एक प्रकार का गलत है । कुछ अपडेट पूरे पोस्ट में किए जाते हैं।


मैं बेन बोल्कर द्वारा पहले ही कही गई बातों से बहुत सहमत हूं (शुक्रिया के लिए धन्यवाद afex::mixed()) लेकिन मुझे इस मुद्दे पर कुछ और सामान्य और विशिष्ट विचार जोड़ने दें।

स्थिर बनाम यादृच्छिक प्रभावों पर ध्यान केंद्रित करें और परिणामों की रिपोर्ट कैसे करें

जोनाथन बैरन द्वारा निर्धारित उदाहरण डेटा में दर्शाए गए प्रायोगिक अनुसंधान के प्रकार के लिए आप महत्वपूर्ण प्रश्न का उपयोग करते हैं, आमतौर पर एक हेरफेर है या नहीं कारक का समग्र प्रभाव होता है । उदाहरण के लिए, क्या हम एक समग्र मुख्य प्रभाव या बातचीत पाते हैं Task? एक महत्वपूर्ण बिंदु यह है कि उन डेटा सेटों में आमतौर पर सभी कारक पूर्ण प्रयोगात्मक नियंत्रण में होते हैं और बेतरतीब ढंग से असाइन किए जाते हैं। नतीजतन, ब्याज का ध्यान आमतौर पर निश्चित प्रभावों पर होता है।
इसके विपरीत, यादृच्छिक प्रभाव घटकों को "उपद्रव" मापदंडों के रूप में देखा जा सकता है जो व्यवस्थित विचरण को पकड़ते हैं (अर्थात, प्रभाव के आकार में अंतर-व्यक्तिगत अंतर) जो मुख्य प्रश्न के लिए जरूरी नहीं हैं। इस दृष्टिकोण से बर्र एट अल द्वारा वकालत के रूप में अधिकतम यादृच्छिक प्रभाव संरचना का उपयोग करने का सुझाव। कुछ हद तक स्वाभाविक रूप से। यह कल्पना करना आसान है कि एक प्रयोगात्मक हेरफेर सभी व्यक्तियों को सटीक रूप से प्रभावित नहीं करता है और हम इसके लिए नियंत्रण करना चाहते हैं। दूसरी ओर, कारकों या स्तरों की संख्या आमतौर पर बहुत बड़ी नहीं होती है ताकि ओवरफिटिंग का खतरा तुलनात्मक रूप से छोटा हो।

नतीजतन, मैं बर्र एट अल के सुझाव का पालन करूंगा। और मेरे मुख्य परिणामों के रूप में एक अधिकतम यादृच्छिक प्रभाव संरचना और निश्चित प्रभावों के परीक्षण परीक्षणों को निर्दिष्ट करें। निश्चित प्रभावों का परीक्षण करने के लिए मैं afex::mixed()इसका उपयोग करने का सुझाव दूंगा क्योंकि यह प्रभावों या कारकों (मापदंडों के परीक्षण के बजाय) के परीक्षणों की रिपोर्ट करता है और उन परीक्षणों की गणना कुछ हद तक समझदार तरीके से करता है (उदाहरण के लिए, सभी मॉडलों के लिए एक ही यादृच्छिक प्रभाव संरचना का उपयोग करता है जिसमें ए एकल प्रभाव को हटा दिया जाता है, योग-से-शून्य-विरोधाभासों का उपयोग करता है, p -values ​​की गणना करने के लिए विभिन्न तरीकों की पेशकश करता है , ...)।

उदाहरण डेटा के बारे में क्या

आपके द्वारा दिए गए उदाहरण डेटा के साथ समस्या यह है कि इस डेटासेट के लिए अधिकतम रैंडम प्रभाव संरचना संरचना की ओर अग्रसर होती है क्योंकि डिज़ाइन की प्रति कोशिका केवल एक डेटा बिंदु है:

> with(df, table(Valence, Subject, Task))
, , Task = Cued

       Subject
Valence Faye Jason Jim Ron Victor
    Neg    1     1   1   1      1
    Neu    1     1   1   1      1
    Pos    1     1   1   1      1

, , Task = Free

       Subject
Valence Faye Jason Jim Ron Victor
    Neg    1     1   1   1      1
    Neu    1     1   1   1      1
    Pos    1     1   1   1      1

नतीजतन, lmerअधिकतम यादृच्छिक प्रभाव संरचना पर चुटकुले:

> lmer(Recall~Task*Valence + (Valence*Task|Subject), df)
Error: number of observations (=30) <= number of random effects (=30) for term
(Valence * Task | Subject); the random-effects parameters and the residual variance
(or scale parameter) are probably unidentifiable

दुर्भाग्य से, इस समस्या से निपटने के लिए मेरे ज्ञान पर कोई सहमति नहीं है। लेकिन मुझे स्केच और कुछ पर चर्चा करने दो:

  1. एक पहला समाधान उच्चतम यादृच्छिक ढलान को हटाने और इस मॉडल के प्रभावों का परीक्षण करने के लिए हो सकता है:

    require(afex)
    mixed(Recall~Task*Valence + (Valence+Task|Subject), df)
            Effect    F ndf  ddf F.scaling p.value
    1         Task 6.56   1 4.00      1.00     .06
    2      Valence 0.80   2 3.00      0.75     .53
    3 Task:Valence 0.42   2 8.00      1.00     .67

    हालांकि, यह समाधान थोड़ा तदर्थ है और अत्यधिक प्रेरित नहीं है।

    अपडेट मई 2017: यह वह दृष्टिकोण है जो मैं वर्तमान में समर्थन कर रहा हूं। देखें इस ब्लॉग पोस्ट और अध्याय का मसौदा मैं सह-लेखन कर रहा हूँ , "डिजाइन पारंपरिक एनोवा के लिए रैंडम प्रभाव संरचनाएं" खंड।

  2. एक वैकल्पिक समाधान (और जिसे बर्र एट अल की चर्चा द्वारा वकालत के रूप में देखा जा सकता है) हमेशा सबसे छोटे प्रभाव के लिए यादृच्छिक ढलानों को हटाने के लिए हो सकता है। हालांकि इसकी दो समस्याएं हैं: (1) सबसे छोटे प्रभाव का क्या पता लगाने के लिए हम किस यादृच्छिक प्रभाव संरचना का उपयोग करते हैं और (2) R एक निम्न-क्रम प्रभाव को हटाने के लिए अनिच्छुक है जैसे कि मुख्य प्रभाव जैसे कि उच्च क्रम प्रभाव इस आशय की बातचीत मौजूद है ( यहां देखें )। एक परिणाम के रूप में किसी को इस यादृच्छिक प्रभाव संरचना को हाथ से स्थापित करने और लिमर कॉल के लिए तथाकथित मॉडल मैट्रिक्स को पारित करने की आवश्यकता होगी।

  3. एक तीसरा समाधान यादृच्छिक प्रभाव वाले भाग के वैकल्पिक पैरामीरिजेशन का उपयोग किया जा सकता है, अर्थात् जो इस डेटा के लिए RM-ANOVA मॉडल से मेल खाता है। दुर्भाग्य से (?), lmer"नकारात्मक संस्करण " की अनुमति नहीं देता है , इसलिए यह मानदंड सभी डेटा सेटों के लिए RM-ANOVA के अनुरूप नहीं है , यहां और अन्य जगहों पर चर्चा करें (जैसे यहां और यहां )। इन आंकड़ों के लिए "lmer-ANOVA" होगा:

    > mixed(Recall~Task*Valence + (1|Subject) + (1|Task:Subject) + (1|Valence:Subject), df)
            Effect    F ndf  ddf F.scaling p.value
    1         Task 7.35   1 4.00      1.00     .05
    2      Valence 1.46   2 8.00      1.00     .29
    3 Task:Valence 0.29   2 8.00      1.00     .76

इस सभी समस्याओं को देखते हुए मैं केवल lmerफिटिंग डेटा सेट के लिए उपयोग नहीं करूंगा , जिसके लिए डिज़ाइन के प्रति सेल केवल एक डेटा बिंदु है जब तक कि अधिकतम यादृच्छिक प्रभाव संरचना की समस्या के समाधान पर अधिक सहमति नहीं मिलती है।

  1. इसके बजाय, मैं एक भी शास्त्रीय एनोवा का उपयोग कर सकता था। परिणामों car::Anova()में afexएक रैपर का उपयोग करना होगा:

    > aov4(Recall~Task*Valence + (Valence*Task|Subject), df)
            Effect         df  MSE      F  ges   p
    1      Valence 1.44, 5.75 4.67   1.46  .02 .29
    2         Task       1, 4 4.08 7.35 +  .07 .05
    3 Valence:Task 1.63, 6.52 2.96   0.29 .003 .71

    ध्यान दें कि afexअब उस मॉडल को वापस करने की अनुमति देता है aovजिसके साथ lsmeansपोस्ट-हॉक टेस्ट के लिए पास किया जा सकता है (लेकिन उन प्रभावों के परीक्षण के लिए जिनके द्वारा रिपोर्ट की गई रिपोर्ट car::Anovaअभी भी अधिक उचित हैं):

    > require(lsmeans)
    > m <- aov4(Recall~Task*Valence + (Valence*Task|Subject), df, return = "aov")
    > lsmeans(m, ~Task+Valence)
     Task Valence lsmean       SE   df lower.CL upper.CL
     Cued Neg       11.8 1.852026 5.52  7.17157 16.42843
     Free Neg       10.2 1.852026 5.52  5.57157 14.82843
     Cued Neu       13.0 1.852026 5.52  8.37157 17.62843
     Free Neu       11.2 1.852026 5.52  6.57157 15.82843
     Cued Pos       13.6 1.852026 5.52  8.97157 18.22843
     Free Pos       11.0 1.852026 5.52  6.37157 15.62843
    
    Confidence level used: 0.95 

(+1) "दुर्भाग्य से, ऋणदाता नकारात्मक सहसंबंधों की अनुमति नहीं देता है" - क्या यह "नकारात्मक भिन्नताओं की अनुमति नहीं देता है"? इसके अलावा, फिर से अपडेट करें: क्या आप इस बारे में अधिक स्पष्ट हो सकते हैं कि इस उत्तर में "गलत-ईश" क्या है?
अमीबा का कहना है कि मोनिका

(मैं लिंक की गई पोस्ट को पढ़ता हूं और ऐसा लगता है कि मुख्य संदेश यह है कि # 1 के रूप में यहां सूचीबद्ध दृष्टिकोण जितना आप सोचते थे, उससे कहीं अधिक कोषेर है। सही है। यह अभी भी स्पष्ट नहीं है कि अगर आपको लगता है कि यह # 3 या # 4 के लिए बेहतर है। )।
अमीबा का कहना है कि मोनिका

@amoeba हाँ आप सही हैं। मैं यहाँ के अनुसार अपने जवाब को अपडेट करने के लिए बहुत आलसी था।
हेनरिक

@amoeba और आप भी सही पुनः सहसंबंध हैं। lmerनकारात्मक भिन्नताओं की अनुमति नहीं देता है लेकिन स्पष्ट रूप से नकारात्मक घटकों के बीच नकारात्मक संबंध है।
हेनरिक

1
मैंने कुछ संपादन किए, आप यह सुनिश्चित करना चाहेंगे कि मैंने आपका गलत प्रतिनिधित्व नहीं किया।
अमीबा का कहना है कि
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.