क्या यह एक निश्चित प्रभाव के लिए एक यादृच्छिक एक के भीतर नेस्टेड होने के लिए समझ में आता है, या आर (एनोव और लमेर) में दोहराया उपायों को कैसे कोडित किया जाए?


23

मैं lcon / lmer R फॉर्मूले के इस अवलोकन को @conjugateprior द्वारा देख रहा हूं और निम्नलिखित प्रविष्टि द्वारा भ्रमित हो गया हूं :

अब मान लें कि A यादृच्छिक है, लेकिन B निश्चित है और B, A के भीतर स्थित है।

aov(Y ~ B + Error(A/B), data=d)

नीचे मिश्रित मिश्रित मॉडल सूत्र lmer(Y ~ B + (1 | A:B), data=d) एक ही मामले के लिए प्रदान किया गया है।

मुझे यह समझ में नहीं आया कि इसका क्या मतलब है। एक प्रयोग में जहां विषयों को कई समूहों में विभाजित किया जाता है, हमारे पास एक यादृच्छिक कारक (विषय) एक निश्चित कारक (समूहों) में निहित होता है। लेकिन एक यादृच्छिक कारक के भीतर एक निश्चित कारक कैसे निहित हो सकता है? कुछ यादृच्छिक विषयों के भीतर निहित है? क्या यह भी संभव है? यदि यह संभव नहीं है, तो क्या ये आर फॉर्मूले समझ में आते हैं?


इस अवलोकन का उल्लेख आंशिक रूप से व्यक्तित्व-प्रोजेक्ट के पृष्ठों पर R में ANOVA के आधार पर R में बार-बार किए गए उपायों के आधार पर किया जाता है । वहाँ दोहराया उपायों एनोवा के लिए निम्न उदाहरण दिया गया है:

aov(Recall ~ Valence + Error(Subject/Valence), data.ex3)

यहां विषयों को अलग-अलग वैलेंस (तीन स्तरों के साथ कारक) के शब्दों के साथ प्रस्तुत किया जाता है और उनके रिकॉल समय को मापा जाता है। प्रत्येक विषय को सभी तीन वैलेंस स्तरों के शब्दों के साथ प्रस्तुत किया जाता है। मुझे इस डिज़ाइन में कुछ भी नेस्टेड नहीं दिखाई देता (यह यहाँ दिए गए शानदार जवाब के अनुसार है ), और इसलिए मैं भोलेपन से सोचता हूँ कि Error(Subject)या (1 | Subject)इस मामले में उपयुक्त यादृच्छिक शब्द होना चाहिए। Subject/Valence"घोंसले" (?) को भ्रमित कर रहा है।

ध्यान दें कि मैं समझता हूं कि Valenceयह एक भीतर का विषय है। लेकिन मुझे लगता है कि यह विषयों के भीतर एक "नेस्टेड" कारक नहीं है (क्योंकि सभी विषय तीनों स्तरों का अनुभव करते हैं Valence)।


अद्यतन करें। मैं CV में दोहराया उपायों ANOVA के बारे में R में प्रश्न तलाश रहा हूं।

  • यहाँ निम्नलिखित विषय के भीतर / दोहराया उपायों के लिए इस्तेमाल किया जाता है ए और यादृच्छिक subject:

    summary(aov(Y ~ A + Error(subject/A), data = d))
    anova(lme(Y ~ A, random = ~1|subject, data = d))
  • यहाँ दो निश्चित विषय के भीतर / दोहराया-उपायों के प्रभाव ए और बी:

    summary(aov(Y ~ A*B + Error(subject/(A*B)), data=d))
    lmer(Y ~ A*B + (1|subject) + (1|A:subject) + (1|B:subject), data=d) 
  • यहाँ तीन विषयों के लिए ए, बी और सी:

    summary(aov(Y ~ A*B*C + Error(subject/(A*B*C)), data=d))
    lmer(Y ~ A*B*C + (1|subject) + (0+A|subject) + (0+B|subject) + (0+C|subject) + (0+A:B|subject) + (0+A:C|subject) + (0+B:C|subject), data = d)

मेरे सवाल:

  1. क्यों Error(subject/A)और क्या नहीं Error(subject)?
  2. यह (1|subject)या (1|subject)+(1|A:subject)बस (1|A:subject)?
  3. यह (1|subject) + (1|A:subject)या (1|subject) + (0+A|subject), और बस क्यों नहीं है (A|subject)?

अब तक मैंने कुछ सूत्र देखे हैं जो दावा करते हैं कि इनमें से कुछ चीजें समतुल्य हैं (उदाहरण के लिए, पहला: एक दावा कि वे एक ही हैं, लेकिन एसओ पर एक विपरीत दावा है ; तीसरा: इस तरह का दावा है कि वे समान हैं )। क्या वो?


2
बस एक त्वरित टिप्पणी यह ​​कहने के लिए कि, कड़ाई से वैचारिक रूप से बोलते हुए , मेरी राय में यह एक यादृच्छिक कारक में निहित निश्चित कारक होने के लिए वास्तव में कभी भी समझ में नहीं आता है। मैंने कम से कम एक पाठ्यपुस्तक के लेखक को उतना ही पढ़ा है जितना कि (इस समय संदर्भ याद नहीं किया जा सकता)। उस ने कहा, यह संभव है कि आपके द्वारा ऊपर लिखे गए कुछ मॉडल विनिर्देशन सांख्यिकीय रूप से उन मॉडलों के समतुल्य हों जो अधिक समझ में आएं ... मुझे इसके बारे में अधिक सोचना होगा और इसके साथ थोड़ा खेलना होगा।
जेक वेस्टफॉल

4
वास्तव में मुझे लगता है कि यह समझ में आता है अगर आप जिस तरह से आर / बी सिंटैक्स की व्याख्या करते हैं उसके बारे में सोचते हैं: यह बस ए + ए: बी तक फैलता है। इसलिए यदि हम एक यादृच्छिक शब्द पर विचार करते हैं subject/condition, तो यह वैचारिक रूप से संदिग्ध है क्योंकि ऐसा लगता है कि विषयों में स्थितियां निहित हैं, जब स्पष्ट रूप से यह विपरीत है, लेकिन वास्तव में फिट होने वाला मॉडल है subject + subject:condition, जो यादृच्छिक विषय प्रभावों के साथ एक पूरी तरह से मान्य मॉडल है और यादृच्छिक विषय एक्स ढलान।
जेक वेस्टफॉल

@JakeWestfall धन्यवाद, यह उन पंक्तियों के साथ है जिनके बारे में मैं अब तक खुद इसके बारे में सोचता हूं, लेकिन मैं किसी को इसे ठीक से समझाना चाहूंगा। वास्तव में मुझे आश्चर्य है कि यह एक गैर-तुच्छ प्रश्न है; मुझे उम्मीद है कि आप उन लोगों में से एक होंगे जो जवाब देंगे सीधे हैं। लेकिन यह राहत की बात है, जैसा कि मैंने सोचा था कि मेरा भ्रम गूंगा होना चाहिए। वैसे, क्या कुछ मानक संदर्भ हैं lmऔर aovसूत्र? यदि मैं एक आधिकारिक स्रोत रखना चाहता हूं, तो aovयह वास्तव में क्या है lm? (इसके लिए एक आवरण है ?) और Error()नियम कैसे काम करते हैं, मुझे कहां देखना चाहिए?
अमीबा का कहना है कि

1
@amoeba हाँ, इस अर्थ के aovलिए एक आवरण है जिसका उपयोग कम से कम वर्गों में फिट होने के लिए किया जाता है, लेकिन कुछ अतिरिक्त काम करता है (विशेष रूप से, शब्द का अनुवाद करना )। आधिकारिक स्रोत स्रोत कोड या संभवतः इसमें दिया गया संदर्भ है : चेम्बर्स एट अल (1992)। लेकिन मेरे पास उस संदर्भ तक पहुंच नहीं है, इसलिए मैं स्रोत कोड देखूंगा। lmlmaovErrorlmhelp("aov")
रोलैंड

खुद के लिए ध्यान दें: यहाँ एक अच्छा धोखा पत्र है unik.de/psychologie/rexrepos/posts/anovaMixed.html । एक और एक: rpsychologist.com/r-guide-longitudinal-lme-lmer । इसके अलावा, बेट्स: stat.wisc.edu/~bates/UseR2008/WorkshopD.pdf और stat.ethz.ch/pipermail/r-sig-mixed-models/20091/001736.html
कहती है मोनिका

जवाबों:


12

मिश्रित मॉडलों में या तो निश्चित या यादृच्छिक के रूप में कारकों का उपचार, विशेष रूप से इस बात के साथ कि क्या उन्हें पार किया जाता है, आंशिक रूप से पार या नेस्टेड होने से बहुत भ्रम हो सकता है। इसके अलावा, इनोवा / डिज़ाइन किए गए प्रयोगों की दुनिया और मिश्रित / बहुस्तरीय मॉडल दुनिया में घोंसले के शिकार के बीच शब्दावली में अंतर प्रतीत होता है।

मैं सभी उत्तरों को जानने के लिए उत्सुक नहीं हूं, और मेरा उत्तर पूर्ण नहीं होगा (और आगे के प्रश्न भी उत्पन्न कर सकते हैं) लेकिन मैं यहां कुछ मुद्दों को हल करने का प्रयास करूंगा:

क्या यह एक निश्चित प्रभाव के लिए एक यादृच्छिक एक के भीतर नेस्टेड होने के लिए समझ में आता है, या आर (एनोव और लमेर) में दोहराया उपायों को कैसे कोडित किया जाए?

(प्रश्न शीर्षक)

नहीं, मेरा मानना ​​है कि यह समझ में नहीं आता है। जब हम बार-बार उपायों से निपट रहे हैं, तो आमतौर पर जो भी चीज दोहराई जाती है वह उपाय यादृच्छिक होंगे, चलो बस इसे कॉल करें Subject, और lme4हम यादृच्छिक भाग में Subjectएक या अधिक के दाईं ओर शामिल करना चाहेंगे |। सूत्र। यदि हमारे पास अन्य यादृच्छिक प्रभाव हैं, तो ये या तो पार हो गए हैं, आंशिक रूप से पार किए गए हैं या नेस्टेड हैं - और इस प्रश्न का उत्तर मेरे पते पर है।

इन एनोवा-प्रकार के प्रयोगों के साथ मुद्दा यह प्रतीत होता है कि उन कारकों से कैसे निपटना है जो सामान्य रूप से तय किए गए उपायों की स्थिति में सोचा जाएगा, और ओपी के शरीर में प्रश्न इस पर बोलते हैं:

त्रुटि (विषय / ए) और त्रुटि (विषय) क्यों नहीं?

मैं आमतौर पर उपयोग aov()नहीं करता हूं इसलिए मुझे कुछ याद आ रहा है लेकिन, मेरे Error(subject/A)लिए लिंक किए गए सवाल के मामले में बहुत भ्रामक है । Error(subject)वास्तव में एक ही परिणाम की ओर जाता है।

क्या यह (1 | विषय) या (1 | विषय) + (1 | ए: विषय) या बस (1 | ए: विषय) है?

यह इस प्रश्न से संबंधित है । इस स्थिति में, सभी निम्न यादृच्छिक प्रभाव योगों के परिणामस्वरूप समान परिणाम प्राप्त होते हैं:

(1|subject)
(1|A:subject)
(1|subject) + (1|A:subject)
(1|subject) + (1|A:subject) + (1|B:subject)

हालाँकि, इसका कारण यह है कि प्रश्न में सिम्युलेटेड डेटासेट में किसी भी चीज के भीतर कोई भिन्नता नहीं है, यह बस के साथ बनाया गया है Y = rnorm(48)। अगर हम वास्तविक डेटासेट जैसे कि cakeडेटासेट में lme4लेते हैं, तो हम पाते हैं कि यह आमतौर पर ऐसा नहीं होगा। प्रलेखन से, यहाँ प्रयोगात्मक सेटअप है:

तीन अलग-अलग व्यंजनों से बने चॉकलेट केक के टूटने के कोण पर डेटा और छह अलग-अलग तापमानों पर बेक किया गया। यह एक विभाजन-प्लॉट डिज़ाइन है जिसमें व्यंजनों को पूरी-इकाइयाँ और उप-इकाइयों (प्रतिकृतियों के भीतर) पर अलग-अलग तापमान पर लागू किया जा रहा है। प्रयोगात्मक नोट बताते हैं कि प्रतिकृति क्रम अस्थायी आदेश का प्रतिनिधित्व करता है।

निम्नलिखित 5 चर पर 270 टिप्पणियों के साथ एक डेटा फ्रेम।

replicate 1 से 15 के स्तर के साथ एक कारक

recipe स्तर ए, बी और सी के साथ एक कारक

temperature 175 <185 <195 <205 <215 <225 के स्तर के साथ एक आदेश दिया गया कारक

temp बेकिंग तापमान (डिग्री एफ) का संख्यात्मक मान।

angle एक संख्यात्मक वेक्टर, जिस पर केक टूट गया था।

इसलिए, हमारे पास बार-बार उपाय हैं replicate, और हम निश्चित कारकों में भी रुचि रखते हैं recipeऔर temperature(हम इसे अनदेखा कर सकते हैं tempक्योंकि यह सिर्फ एक अलग कोडिंग है temperature), और हम स्थिति का उपयोग करके कल्पना कर सकते हैं xtabs:

> xtabs(~recipe+replicate,data=cake)

     replicate
recipe 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
     A 6 6 6 6 6 6 6 6 6  6  6  6  6  6  6
     B 6 6 6 6 6 6 6 6 6  6  6  6  6  6  6
     C 6 6 6 6 6 6 6 6 6  6  6  6  6  6  6

यदि recipeएक यादृच्छिक प्रभाव था, तो हम कहेंगे कि ये यादृच्छिक प्रभाव हैं। किसी भी तरह recipe Aसे replicate 1या किसी भी अन्य प्रतिकृति से संबंधित नहीं है ।

> xtabs(~temp+replicate,data=cake)

     replicate
temp  1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
  175 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  185 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  195 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  205 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  215 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3
  225 3 3 3 3 3 3 3 3 3  3  3  3  3  3  3

इसी तरह के लिए temp

तो पहला मॉडल जो हम फिट कर सकते हैं वह है:

> lmm1 <-  lmer(angle ~ recipe * temperature + (1|replicate), cake, REML= FALSE)

यह प्रत्येक replicateको यादृच्छिक भिन्नता के एकमात्र स्रोत के रूप में व्यवहार करेगा (पाठ्यक्रम के अवशिष्ट के अलावा)। लेकिन व्यंजनों के बीच यादृच्छिक अंतर हो सकता है। इसलिए हमें recipeएक और (पार किए गए) यादृच्छिक प्रभाव के रूप में शामिल करने के लिए लुभाया जा सकता है, लेकिन यह अशुभ होगा, क्योंकि हमारे पास केवल 3 स्तर हैं recipeइसलिए हम मॉडल को अच्छी तरह से विचरण घटकों का अनुमान लगाने की उम्मीद नहीं कर सकते हैं। इसलिए इसके बजाय हम replicate:recipeसमूहीकरण चर के रूप में उपयोग कर सकते हैं जो हमें एक अलग समूहन कारक के रूप में प्रतिकृति और नुस्खा के प्रत्येक संयोजन का इलाज करने में सक्षम करेगा । इसलिए, जबकि उपरोक्त मॉडल के साथ हम replicateअलग-अलग संयोजनों में से प्रत्येक के लिए अब 45 यादृच्छिक इंटरसेप्ट होंगे , हमारे स्तर के लिए 15 यादृच्छिक इंटरसेप्ट होंगे:

lmm3 <-  lmer(angle ~ recipe * temperature + (1|replicate:recipe) , cake, REML= FALSE)

ध्यान दें कि अब हमारे पास (बहुत कम) अलग-अलग परिणाम हैं जो यह दर्शाता है कि नुस्खा के कारण कुछ यादृच्छिक परिवर्तनशीलता है, लेकिन एक महान सौदा नहीं है।

हम इसी तरह के साथ काम कर सकते हैं temperature

अब, अपने प्रश्न पर वापस जा रहे हैं, आप भी पूछें

क्यों (1|subject) + (1|A:subject)और क्या नहीं (1|subject) + (0+A|subject)भी (A|subject)?

मुझे पूरा यकीन नहीं है कि यह (यादृच्छिक ढलान का उपयोग करके) कहां से आता है - यह 2 जुड़े हुए प्रश्नों में उत्पन्न नहीं होता है - लेकिन मेरी समस्या (1|subject) + (1|A:subject)यह है कि यह ठीक उसी तरह है (1|subject/A)जिसका अर्थ है कि Aभीतर निहित है subject, जिसमें बारी का मतलब (मेरे लिए) है कि प्रत्येक स्तर A1 में होता है और केवल 1 स्तर subjectजिसमें स्पष्ट रूप से यहां मामला नहीं है।

मैं शायद इस बारे में कुछ और सोचने के बाद इस उत्तर को जोड़ूंगा और / या संपादित करूंगा, लेकिन मैं अपने शुरुआती विचारों को प्राप्त करना चाहता था।


बहुत बहुत धन्यवाद (+1)। मुझे यकीन नहीं है कि मैं cakeडेटासेट को समझता हूं । ऐसा लगता है कि प्रतिकृति नुस्खा में निहित है; कारण xtabsयह नहीं दिखाता है कि आप अपने नेस्टेड-बनाम-क्रॉस उत्तर में वर्णन करने का सही कारण है: प्रतिकृति भ्रमित रूप से 1-15 के रूप में कोडित है और 1-45 के रूप में नहीं। प्रत्येक नुस्खा के लिए, 6 केक के साथ 15 "प्रतिकृति" बनाई गई थीं; प्रत्येक केक को अलग-अलग तापमान पर पकाया जाता था। तो रेसिपी एक इन-सब्जेक्ट फैक्टर है और तापमान एक इन-सब्जेक्ट फैक्टर है। तो आपके उस जवाब के अनुसार, यह होना चाहिए (1|recipe/replicate)। नहीं? (1|replicate:recipe)शायद बराबर है।
अमीबा का कहना है कि मोनिका

मैंने अपने प्रश्न को केवल विषय-संबंधी कारकों पर केंद्रित किया, इसलिए यह cakeकेवल एक ही नुस्खा तक सीमित रहने जैसा होगा । तीसरे बिंदु के बारे में जो आप कहते हैं कि आप निश्चित नहीं हैं कि यह कहां से आता है, कृपया मेरे क्यू में बहुत अंतिम लिंक देखें, जिसमें तीन-विषय कारकों के उदाहरण हैं। इस क्यू के तहत जेक की अपवित्र टिप्पणी भी देखें, जिसमें उन्होंने यादृच्छिक ढलानों का उल्लेख किया है।
अमीबा का कहना है कि मोनिका

और के बारे में aovआप सही हैं ऐसा लगता है कि है कि Error(subject/A)और Error(subject)उपज ही परिणाम अगर कोई अन्य कारण हैं, लेकिन दो कारकों के साथ जुड़े हुए धागे से एक उदाहरण लेते हैं, और वहाँ Error(subject/(A*B))औरError(subject) समान नहीं हैं। मेरी वर्तमान समझ यह है कि यह इसलिए है क्योंकि पूर्व में यादृच्छिक ढलान शामिल हैं।
अमीबा का कहना है कि मोनिका

@amoeba cakeडेटासेट एक अच्छा काम करने का उदाहरण नहीं था। मैं क्षमाप्रार्थी हूं। मैं इसमें थोड़ा गहराई से देखूंगा और शायद चित्रण के लिए बेहतर खोज करने की कोशिश करूंगा।
राबर्ट लॉन्ग

धन्यवाद। किसी भी अपडेट के लिए, और साथ ही उस अपडेट के लिए जो प्लासीडिया तैयार कर रहा है। इस बीच, मुझे लगता है कि मैं यहां एक इनाम दूंगा।
अमीबा का कहना है कि मोनिका

3

Ooooops। चेतावनी टिप्पणी करने वालों ने देखा कि मेरी पोस्ट बकवास से भरी थी। मैं नेस्टेड डिजाइन और बार-बार डिजाइन को भ्रमित कर रहा था।

यह साइट नेस्टेड और दोहराया उपायों के डिजाइनों के बीच अंतर का एक उपयोगी टूटने देता है। मजे की बात यह है कि लेखक निश्चित, निश्चित के भीतर, यादृच्छिक के भीतर और यादृच्छिक के भीतर यादृच्छिक के लिए अपेक्षित औसत वर्गों को दिखाता है - लेकिन यादृच्छिक के भीतर तय नहीं किया गया है। यह कल्पना करना मुश्किल है कि इसका क्या मतलब होगा - यदि स्तर ए में कारकों को यादृच्छिक पर चुना जाता है, तो यादृच्छिकता अब स्तर बी के कारकों के चयन को नियंत्रित करती है। यदि 5 स्कूलों को स्कूल बोर्ड से यादृच्छिक पर चुना जाता है, और फिर 3 शिक्षक हैं प्रत्येक स्कूल से चुने गए (शिक्षकों को स्कूलों में नेस्टेड), "शिक्षक" कारक का स्तर अब स्कूलों के यादृच्छिक चयन के आधार पर स्कूल बोर्ड से शिक्षकों का एक यादृच्छिक चयन है। मैं उन शिक्षकों को "ठीक" नहीं कर सकता जो मेरे पास होंगे।


2
+1, बहुत बहुत धन्यवाद। आपके जवाब में सब कुछ मेरे लिए मायने रखता है। हालांकि, मुझे लगता है कि हमें इस बात से सहमत होना चाहिए कि "नेस्टेड" शब्द दो अलग-अलग इंद्रियों में इस्तेमाल किया जा रहा है और यह भ्रम का कारण बनता है। @RobertLong का कहना है कि A का नाम B से है जब B का प्रत्येक स्तर अलग-अलग स्तर के AEG कक्षाओं के साथ मिलकर होता है, जिन्हें स्कूलों के भीतर नेस्टेड किया जाता है, जिन्हें कस्बों आदि के भीतर घोंसला बनाया जाता है। आपके उदाहरण में, विषयों को उपचार / नियंत्रण कारक के भीतर नेस्ट किया जाता है। आप कहते हैं कि समय विषयों के भीतर निहित है, लेकिन सभी स्तरों पर सभी विषयों के साथ समय होता है इसलिए रॉबर्ट कहेंगे कि वे पार हो गए हैं! यह एक अलग "नेस्टेड" है। सही?
अमीबा का कहना है कि मोनिका

1
आपके उदाहरण में यह स्पष्ट है कि समय और उपचार निश्चित प्रभाव हैं, लेकिन यह स्पष्ट है कि समय रोगियों के भीतर निहित है। क्या आप "नेस्टेड" की परिभाषा प्रदान कर सकते हैं?
जो किंग

मेरी गलती। मैं घोंसले के शिकार और दोहराया उपायों को भ्रमित कर रहा था। मैंने अपना उत्तर बदल दिया है - फिर से!।
प्लेसिडिया

वास्तव में मुझे आज से पहले के सुधार / परिवर्धन के साथ आपका मूल उत्तर पसंद आया। मेरे प्रश्न के लिए बहुत सारी उपयोगी जानकारी थी क्योंकि जैसा कि आप देख रहे हैं कि मैं वास्तव में "दोहराया उपायों" में दिलचस्पी रखता हूं (और "नेस्टिंग" के बारे में सवाल सिर्फ एक शब्दावली था)। मैं आपको सुझाव दूंगा कि आप पिछला संशोधन रखें!
अमीबा का कहना है कि

2
जैसा कि मैं इसे लिख रहा था, मैंने महसूस किया कि दोहराया उपायों में यादृच्छिक प्रभाव निहित हैं, और मैं यह परीक्षण करना चाहता हूं कि गणित कैसे काम करता है और स्वतंत्रता की डिग्री। जब मुझे यकीन हो जाएगा कि मैं यह नाउम्मीद कर चुका हूं, तो मैं अपना जवाब दूंगा!
प्लैसिडिया
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.