आर के लैमर चीट शीट


160

विभिन्न पदानुक्रमित मॉडल का उपयोग करने के उचित तरीके के बारे में इस मंच पर बहुत चर्चा चल रही है lmer

मुझे लगा कि एक ही जगह सारी जानकारी रखना बहुत अच्छा होगा। सवालों की एक जोड़ी शुरू करने के लिए:

  1. कई स्तरों को कैसे निर्दिष्ट किया जाए, जहां एक समूह दूसरे के भीतर निहित है: यह है (1|group1:group2)या (1+group1|group2)?
  2. बीच क्या अंतर है (~1 + ....)और (1 | ...)और (0 | ...)आदि?
  3. समूह-स्तरीय इंटरैक्शन कैसे निर्दिष्ट करें?

11
मैनुअल के लिए और तीन विगनेट्स lme4पैकेज जा सकती है, क्रैन पर पाया
हेनरी

4
CRAN सामग्री के अलावा, एक पुस्तक डौग के व्याख्यान स्लाइड्स प्लस ड्राफ्ट चैप्टर पर (G) LMMs और R लिख रहे हैं और lme4 के साथ r-forge
गेविन सिम्पसन

बेट्स एट अल द्वारा जेएसएस पेपर के arXiv संस्करण के लिए सीधा लिंक।: लाईम 4 का उपयोग करके रैखिक मिश्रित-प्रभाव मॉडल फिटिंग (विशेष रूप से धारा 2.2 "मिश्रित-मॉडल फ़ार्मुलों को समझना")। बेन बोलकर के अक्सर पूछे जाने वाले प्रश्न के प्रासंगिक अनुभाग भी देखें ।
अमीबा

5
तर्क है कि, जिस भाषा का उपयोग किया जाता lmerहै वह सामान्य सांख्यिकीय हित की होती है और इस प्रकार यह केवल प्रोग्रामिंग का विषय नहीं है। इसलिए मैं इस धागे को खुला रखने के लिए मतदान कर रहा हूं।
whuber

2
@whuber +1 पूरी तरह से सहमत है।
अमीबा

जवाबों:


180

क्या अंतर है (~ 1 + ....) और (1 | ...) और (0 | ...) आदि।

मान लें कि आपके पास वेरिएबल वेरिएबल V2 द्वारा पूर्वानुमानित V1 है, जिसे एक यादृच्छिक प्रभाव के रूप में माना जाता है, और निरंतर चर V3, जिसे एक रैखिक निश्चित प्रभाव के रूप में माना जाता है। Lmer सिंटैक्स, सरलतम मॉडल (M1) का उपयोग करना है:

V1 ~ (1|V2) + V3

यह मॉडल अनुमान लगाएगा:

P1: एक वैश्विक अवरोधन

P2: रैंडम प्रभाव वी 2 के लिए इंटरसेप्ट करता है (अर्थात वी 2 के प्रत्येक स्तर के लिए, ग्लोबल इंटरसेप्ट से उस स्तर के इंटरसेप्ट का विचलन)

P3: V3 के प्रभाव (ढलान) के लिए एक एकल वैश्विक अनुमान

अगला सबसे जटिल मॉडल (एम 2) है:

V1 ~ (1|V2) + V3 + (0+V3|V2)

यह मॉडल M1 से सभी मापदंडों का अनुमान लगाता है, लेकिन इसके अतिरिक्त अनुमान लगाएगा:

पी 4: वी 3 के प्रत्येक स्तर के भीतर वी 3 का प्रभाव (अधिक विशेष रूप से, जिस हद तक वी 3 का प्रभाव किसी दिए गए स्तर के भीतर वी 3 के वैश्विक प्रभाव से भटकता है), जबकि अवरोधन विचलन और वी 3 प्रभाव विचलन के बीच स्तरों पर एक शून्य सहसंबंध को लागू करना। वी 2 की

यह अंतिम प्रतिबंध एक अंतिम सबसे जटिल मॉडल (M3) में आराम से है:

V1 ~ (1+V3|V2) + V3

जिसमें V2 के स्तरों के भीतर अवरोधन विचलन और V3 प्रभाव विचलन के बीच सहसंबंध की अनुमति देते समय M2 से सभी मापदंडों का अनुमान लगाया गया है। इस प्रकार, M3 में, एक अतिरिक्त पैरामीटर अनुमानित है:

पी 5: वी 2 के स्तरों के बीच अवरोधन विचलन और वी 3 विचलन के बीच संबंध

आमतौर पर एम 2 और एम 3 जैसे मॉडल जोड़े की गणना की जाती है, फिर निश्चित प्रभावों (वैश्विक अवरोधन सहित) के बीच सहसंबंध के लिए साक्ष्य का मूल्यांकन किया जाता है।

अब एक और निश्चित प्रभाव पूर्वसूचक जोड़ने पर विचार करें, V4। आदर्श:

V1 ~ (1+V3*V4|V2) + V3*V4

अनुमान होगा:

P1: एक वैश्विक अवरोधन

P2: V3 के प्रभाव के लिए एक एकल वैश्विक अनुमान

P3: V4 के प्रभाव के लिए एक एकल वैश्विक अनुमान

पी 4: वी 3 और वी 4 के बीच बातचीत के लिए एक एकल वैश्विक अनुमान

P5: V2 के प्रत्येक स्तर में P1 से अवरोधन का विचलन

पी 6: से वी 3 प्रभाव का विचलन P2 V2 के प्रत्येक स्तर में

P7: V2 के प्रत्येक स्तर में P3 से V4 प्रभाव का विचलन

P8: V2 के प्रत्येक स्तर में P4 से V3-by-V4 इंटरैक्शन के विचलन

पी 9 के बीच सहसंबंध पी 5 और पी 6 V2 के स्तर के पार

P10 के बीच सहसंबंध पी 5 और P7 V2 के स्तर के पार

P11 के बीच सहसंबंध पी 5 और P8 V2 के स्तर के पार

V2 के स्तरों के बीच P6 और P7 के बीच P12 सहसंबंध

P13 के बीच सहसंबंध पी 6 और P8 V2 के स्तर के पार

P14 के बीच सहसंबंध P7 और P8 V2 के स्तर के पार

काहे , यह बहुत सारे पैरामीटर हैं! और मैंने मॉडल द्वारा अनुमानित भिन्नता मापदंडों को सूचीबद्ध करने की भी जहमत नहीं उठाई। क्या अधिक है, यदि आपके पास 2 से अधिक स्तरों के साथ एक श्रेणीबद्ध चर है जिसे आप एक निश्चित प्रभाव के रूप में मॉडल करना चाहते हैं, तो उस चर के लिए एक एकल प्रभाव के बजाय आप हमेशा के -1 प्रभाव का अनुमान लगा रहे होंगे (जहां k स्तरों की संख्या है) , जिससे मॉडल द्वारा अनुमान किए जाने वाले मापदंडों की संख्या में और भी अधिक विस्फोट हो रहा है।


1
@ माइक लॉरेंस जवाब के लिए धन्यवाद! 3 स्तर के मॉडल का अनुमान कैसे लगाया जाता है? जहां एक समूह कारक दूसरे के भीतर निहित है?

DBR, मुझे नहीं लगता कि आपको पता है कि स्तर क्या हैं। आप इस बारे में हमेशा के लिए पूछ रहे हैं। एक प्रश्न को तैयार करें जो वास्तव में आपके प्रयोग के डिजाइन का विवरण देता है और "स्तर" की आपकी व्याख्या को प्रदर्शित करता है।
जॉन

3
मुझे लगता है कि डीबीआर पदानुक्रम में स्तरों का जिक्र है। मैंने जो वर्णन किया है वह एक 2-स्तरीय श्रेणीबद्ध मॉडल है, जिसमें विषयों में निहित टिप्पणियों के साथ, और डीबीआर 3-स्तरीय पदानुक्रमों के बारे में पूछ रहा है, जिसका एक उदाहरण स्कूलों के भीतर छात्रों के लिए आइटम का परीक्षण करना हो सकता है, जहां आप छात्रों और स्कूलों दोनों को यादृच्छिक रूप से मॉडल करना चाहते हैं। प्रभाव, स्कूलों के भीतर छात्रों के साथ। ऐसे मामलों में, मैं मानता हूं कि स्कूल स्तर के विचलन की गणना पहले की जाती है, फिर स्कूल से स्कूल के विचलन की।
माइक लॉरेंस

2
सबसे अच्छा जवाब मैंने मॉडल सेटअप प्राप्त करने के लिए देखा है। मुझे अपने बॉस के लिए एक आसान ढाँचा प्रदान करने में मदद मिली कि मैं यह समझ सकूँ कि मैं lmer के साथ R में क्या कर रहा हूँ।
bfoste01

Yij=γ00+γ10Xij+γ01Zj+γ11XijZj+u1jXij+u0j+eij
iijjlmerY~X+Z+(1|group)+(0+X|Z)group

50

सामान्य चाल है, जैसा कि एक अन्य उत्तर में बताया गया है, सूत्र फार्म का अनुसरण करता है dependent ~ independent | groupinggroupingआम तौर पर एक यादृच्छिक कारक आप किसी भी समूह के बिना तय कारकों में शामिल हैं सकता है और किसी भी निश्चित कारक (एक अवरोधन-केवल मॉडल) के बिना अतिरिक्त यादृच्छिक कारकों हो सकता है। एक +कारकों के बीच कोई बातचीत को इंगित करता है, एक *बातचीत इंगित करता है।

यादृच्छिक कारकों के लिए, आपके पास तीन मूल संस्करण हैं:

  1. केवल यादृच्छिक कारक द्वारा साक्षात्कार: (1 | random.factor)
  2. केवल यादृच्छिक कारक द्वारा ढलान: (0 + fixed.factor | random.factor)
  3. यादृच्छिक कारक द्वारा साक्षात्कार और ढलान: (1 + fixed.factor | random.factor)

ध्यान दें कि वेरिएंट 3 में एक ही समूह में ढलान और अवरोधन की गणना की गई है, अर्थात एक ही समय में। यदि हम चाहते हैं कि ढलान और अवरोधन की गणना स्वतंत्र रूप से की जाए, अर्थात दोनों के बीच किसी भी तरह का कोई संबंध नहीं है, तो हमें चौथे संस्करण की आवश्यकता है:

  • अवरोधक और ढलान, अलग से, यादृच्छिक कारक द्वारा (1 | random.factor) + (0 + fixed.factor | random.factor):। इसे लिखने का एक वैकल्पिक तरीका डबल-बार संकेतन का उपयोग कर रहा है fixed.factor + (fixed.factor || random.factor)

इस प्रश्न के उत्तर में एक अच्छा सारांश भी है जिसे आपको देखना चाहिए।

यदि आप गणित में थोड़ा खुदाई करने के लिए तैयार हैं, बर्र एट अल। (2013) lmerउनके तालिका 1 में वाक्यविन्यास को काफी अच्छी तरह से संक्षेप में प्रस्तुत करते हैं , जो तालिका रहित मार्कडाउन की बाधाओं को पूरा करने के लिए यहां अनुकूलित है। वह कागज मनोचिकित्सात्मक डेटा से निपटता है, इसलिए दो यादृच्छिक प्रभाव हैं Subjectऔर Item

मॉडल और समकक्ष lme4सूत्र वाक्य रचना:

    • Ysi=β0+β1Xi+esi
    • एन / ए (मिश्रित-प्रभाव मॉडल नहीं)
    • Ysi=β0+S0s+β1Xi+esi
    • Y ∼ X+(1∣Subject)
    • Ysi=β0+S0s+(β1+S1s)Xi+esi
    • Y ∼ X+(1 + X∣Subject)
    • Ysi=β0+S0s+I0i+(β1+S1s)Xi+esi
    • Y ∼ X+(1 + X∣Subject)+(1∣Item)
    • Ysi=β0+S0s+I0i+β1Xi+esi
    • Y ∼ X+(1∣Subject)+(1∣Item)
    • जैसे (4), लेकिन , स्वतंत्र S0sS1s
    • Y ∼ X+(1∣Subject)+(0 + X∣ Subject)+(1∣Item)
    • Ysi=β0+I0i+(β1+S1s)Xi+esi
    • Y ∼ X+(0 + X∣Subject)+(1∣Item)

संदर्भ:

बर्र, डेल जे, आर। लेवी, सी। शेपर्स und एचजे टिली (2013)। पुष्टित्मक परिकल्पना परीक्षण के लिए यादृच्छिक प्रभाव संरचना: इसे अधिकतम रखें । जर्नल ऑफ़ मेमोरी एंड लैंग्वेज, 68: 255– 278।


4
अच्छा लगा। यह नेस्टेड '/' कारकों और डबल-बार संकेतन 'के बारे में बेहतर wtith जानकारी हो सकती है ||
स्केन

1
के बारे में क्या: प्रतीक?
पूर्वअफ्री

1
@eastafri इसका मतलब है कि आर (सूत्रों) में हर जगह एक ही चीज होती है - दो चर के बीच की बातचीत।
लिवियस

(6) में, मेरी समझ यह है कि और का आपस में कोई संबंध नहीं है। दूसरे शब्दों में, यादृच्छिक चर के रूप में, उनका सहसंयोजक । यह कहना कि और स्वतंत्र हैं एक मजबूत कथन है और इसलिए, जरूरी नहीं कि यह सच हो। क्या मैं गलत हूं? एस 1 एस 0 एस 0 एस एस 1 रोंS0sS1s0S0sS1s
मुनो

4

|प्रतीक मिश्रित तरीकों में एक समूहीकरण कारक इंगित करता है।

पिनेहिरो और बेट्स के अनुसार:

... सूत्र भी एक प्रतिक्रिया नामित करता है और, जब उपलब्ध हो, एक प्राथमिक कोवरिएट । यह के रूप में दिया जाता है

response ~ primary | grouping

जहां responseप्रतिक्रिया के primaryलिए एक अभिव्यक्ति है, प्राथमिक कोवरिएट के groupingलिए एक अभिव्यक्ति है , और समूह कारक के लिए एक अभिव्यक्ति है।

मिश्रित पद्धति विश्लेषण करने के लिए आप किस विधि का उपयोग करते हैं इसके आधार पर R, आपको विश्लेषण में groupedDataसमूहीकरण का उपयोग करने में सक्षम होने के लिए एक वस्तु बनाने की आवश्यकता हो सकती है ( nlmeविवरण के लिए पैकेज देखें, इसकी lme4आवश्यकता नहीं लगती है)। मैं उस तरह से नहीं बोल सकता जिस तरह से आपने अपने lmerमॉडल स्टेटमेंट को निर्दिष्ट किया है क्योंकि मुझे आपका डेटा नहीं पता है। हालाँकि, (1|foo)मैंने जो देखा है उससे मॉडल लाइन में कई होना असामान्य है। क्या आप मॉडल की कोशिश कर रहे हैं?

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.