"मिश्रित मॉडल" के तीन रूपों की व्याख्या करना


19

वहाँ एक अंतर है जो मुझे मिश्रित मॉडल के साथ जोड़ रहा है, और मैं सोच रहा हूं कि क्या मुझे इस पर कुछ स्पष्टता मिल सकती है। मान लेते हैं कि आपको गणना डेटा का एक मिश्रित मॉडल मिला है। एक चर है जिसे आप जानते हैं कि आप एक निश्चित प्रभाव (ए) के रूप में चाहते हैं और समय (टी) के लिए एक और चर, "साइट" चर कहकर समूहीकृत किया गया है।

जैसा मुझे समझ में आया:

glmer(counts ~ A + T, data=data, family="Poisson") एक निश्चित प्रभाव मॉडल है।

glmer(counts ~ (A + T | Site), data=data, family="Poisson") एक यादृच्छिक प्रभाव मॉडल है।

मेरा सवाल है जब आपके पास कुछ ऐसा हो:

glmer(counts ~ A + T + (T | Site), data=data, family="Poisson")टी क्या है? क्या यह एक यादृच्छिक प्रभाव है? एक निश्चित प्रभाव? वास्तव में दोनों स्थानों पर टी लगाने से क्या पूरा हो रहा है?

जब कुछ केवल मॉडल सूत्र के यादृच्छिक प्रभाव अनुभाग में दिखाई देना चाहिए ?

जवाबों:


22

यह इन तीन मॉडलों में से प्रत्येक के लिए मॉडल फॉर्मूला लिखकर स्पष्ट हो सकता है। चलो व्यक्ति के लिए अवलोकन होना मैं साइट में जे प्रत्येक मॉडल में और परिभाषित एक मैं j , टी मैं jYijijAij,Tij तुलनात्मक रूप से अपने मॉडल में चर का उल्लेख करने के।

glmer(counts ~ A + T, data=data, family="Poisson") मॉडल है

log(E(Yij))=β0+β1Aij+β2Tij

जो कि सिर्फ एक साधारण पॉसियन रिग्रेशन मॉडल है।

glmer(counts ~ (A + T|Site), data=data, family="Poisson") मॉडल है

log(E(Yij))=α0+ηj0+ηj1Aij+ηj2Tij

जहां यादृच्छिक प्रभाव है कि साइट में लोगों द्वारा किए गए प्रत्येक अवलोकन द्वारा साझा किया जाता है जे । ये यादृच्छिक प्रभाव स्वतंत्र रूप से जोड़ा जा करने की अनुमति है (यानी कोई प्रतिबंध पर किया जाता है Σ मॉडल आपके द्वारा निर्दिष्ट में)। स्वतंत्रता को लागू करने के लिए, आपको उन्हें अलग-अलग कोष्ठकों के अंदर रखना होगा , जैसे कि यह करना होगा। यह मॉडल मानता है कि लॉग ( E ( Y i j)ηj=(ηj0,ηj1,ηj2)N(0,Σ)jΣ(A-1|Site) + (T-1|Site) + (1|Site)। हैα0सभी साइटों के लिए, लेकिन प्रत्येक साइट एक यादृच्छिक ऑफसेट (हैη जे 0 ) और दोनों के साथ एक यादृच्छिक रैखिक संबंध हैएक मैं j ,टी मैं jlog(E(Yij))α0ηj0Aij,Tij

glmer(counts ~ A + T + (T|Site), data=data, family="Poisson") मॉडल है

log(E(Yij))=(θ0+γj0)+θ1Aij+(θ2+γj1)Tij

तो अब के साथ कुछ "औसत" संबंध नहीं है एक मैं j , टी मैं j , फिक्स्ड प्रभाव द्वारा दिए गए θ 0 , θ 1 , θ 2 लेकिन उस रिश्ते को प्रत्येक साइट और उन मतभेदों के लिए अलग है यादृच्छिक प्रभाव, द्वारा कब्जा कर लिया जाता है γ जे 0 , γ जे 1 , γ जे 2log(E(Yij))Aij,Tijθ0,θ1,θ2γj0,γj1,γj2। यही है, बेसलाइन को यादृच्छिक रूप से स्थानांतरित कर दिया गया है और दो चर के ढलान को बेतरतीब ढंग से स्थानांतरित कर दिया गया है और एक ही साइट से सभी एक ही यादृच्छिक बदलाव साझा करते हैं।

टी क्या है? क्या यह एक यादृच्छिक प्रभाव है? एक निश्चित प्रभाव? वास्तव में दोनों स्थानों पर टी लगाने से क्या पूरा हो रहा है?

TSiteTSiteγj1Tlog(E(Yij))

मॉडल फॉर्मूले के रैंडम इफेक्ट सेक्शन में कब कुछ दिखाई देना चाहिए?

यह एक ऐसा मामला है जो आवेदन के संदर्भ में समझ में आता है।

γj0 , इस मुख्य रूप से एक ही साइट पर बनाया टिप्पणियों के बीच संबंध प्रेरित करने के लिए कार्य करता है। यदि इस तरह के सहसंबंध के अस्तित्व के लिए कोई मतलब नहीं है, तो यादृच्छिक प्रभाव को बाहर रखा जाना चाहिए।

log(E(Yij))TSite समय के साथ यादृच्छिक दिशा में बढ़ रहा है, जो समझ में आ सके। फिर से, यह आवेदन पर निर्भर करता है।

ध्यान दें कि आप मॉडल को बिना और यादृच्छिक प्रभावों के साथ देख सकते हैं कि क्या यह हो रहा है - आपको निर्धारित मॉडल में कोई प्रभाव नहीं दिखना चाहिए, लेकिन बाद के मॉडल में महत्वपूर्ण यादृच्छिक प्रभाव। मुझे आपको सावधान करना चाहिए कि इस तरह के निर्णय अक्सर मॉडल चयन के बजाय आवेदन की समझ के आधार पर बेहतर किए जाते हैं।


2
(+1): प्रत्येक मॉडल के लिए मॉडल फॉर्मूला लिखना वास्तव में आर-नोटेशन को अधिक पारदर्शी बनाने का सबसे अच्छा तरीका है; बहुत बढ़िया!
ओकराम

@ मैक्रो ऊपर दिए गए समीकरणों पर एक प्रश्न (उनके लिए धन्यवाद btw) - क्या उनमें भी सामान्य त्रुटि अवधि है? यदि ऐसा है, तो उस शब्द का उपप्रकार क्या है?
फोमाइट

2
E(Yij|X)Yij|X

11

आपको ध्यान देना चाहिए कि Tआपके मॉडल का कोई भी यादृच्छिक प्रभाव नहीं है, लेकिन एक निश्चित प्रभाव है। यादृच्छिक प्रभाव केवल वे प्रभाव हैं जो |एक lmerसूत्र में दिखाई देते हैं !

इस विशिष्ट विवरण की और अधिक गहन चर्चा आपको इस lmer faq प्रश्न में मिल सकती है ।

इस प्रश्न से आपके मॉडल को निम्नलिखित (आपके निश्चित प्रभाव के लिए T) देना चाहिए :

  • एक वैश्विक ढलान
  • एक यादृच्छिक ढलान प्रत्येक स्तर के लिए समग्र ढलान से विचलन को निर्दिष्ट करता है Site
  • यादृच्छिक ढलानों के बीच संबंध।

और @ mark999 द्वारा कहा गया यह वास्तव में एक सामान्य विनिर्देश है। दोहराया उपायों के डिजाइनों में, आप आमतौर पर सभी दोहराया उपायों (भीतर-विषयों) कारकों के लिए यादृच्छिक ढलान और सहसंबंध रखना चाहते हैं।

कुछ उदाहरणों के लिए निम्नलिखित पेपर देखें (जो मैं हमेशा यहां उद्धृत करता हूं):

जुड, सीएम, वेस्टफॉल, जे।, और केनी, डीए (2012)। सामाजिक मनोविज्ञान में एक यादृच्छिक कारक के रूप में उत्तेजनाओं का इलाज: एक व्यापक और बड़े पैमाने पर अनदेखी समस्या का एक नया और व्यापक समाधान। जर्नल ऑफ़ पर्सनैलिटी एंड सोशल साइकोलॉजी , 103 (1), 54–69। डोई: 10.1037 / a0028347


2
पारिस्थितिकी से एक समान संदर्भ: शील्ज़ेथ, होल्गर और वोल्फगैंग फॉर्स्टेमियर। 2009. "निष्कर्षों से परे का समर्थन: मिश्रित मॉडलों में अति आत्मविश्वास का अनुमान।" व्यवहार पारिस्थितिकी 20 (2) (1 मार्च): 416–420। डोई: 10.1093 / beheco / arn145। beheco.oxfordjournals.org/content/20/2/416
बेन बोल्कर

1

कुछ केवल यादृच्छिक भाग में दिखाई देना चाहिए जब आप विशेष रूप से इसके पैरामीटर के प्रति रुचि नहीं रखते हैं, लेकिन निर्भर डेटा से बचने के लिए इसे शामिल करने की आवश्यकता है। जैसे, यदि बच्चों को कक्षाओं में नेस्ट किया जाता है, तो आप आमतौर पर बच्चों को केवल एक यादृच्छिक प्रभाव के रूप में चाहते हैं।


1
शायद मैं आपको गलत समझ रहा हूं, लेकिन मैंने सोचा होगा कि एक ही चर के लिए निश्चित और यादृच्छिक प्रभाव केवल एक यादृच्छिक प्रभाव वाले चर की तुलना में अधिक सामान्य था। एक ही चर के लिए निश्चित और यादृच्छिक प्रभाव रखने के लिए पिनेहिरो और बेट्स पुस्तक में असामान्य नहीं है।
mark999 ऑक्ट

2
@MichaelChernick जैसा कि मैं इसे समझता हूं, यदि आपके पास एक ही चर के लिए एक निश्चित प्रभाव और एक यादृच्छिक प्रभाव है, तो निश्चित प्रभाव आबादी में समग्र प्रभाव है, जबकि यादृच्छिक प्रभाव प्रत्येक विषय के लिए चर के एक अलग प्रभाव की अनुमति देता है। पिनेहिरो और बेट्स में कई उदाहरण हैं।
mark999

2
@PeterFlom, re: "यदि बच्चों को कक्षाओं में नेस्ट किया जाता है, तो आप आमतौर पर बच्चों को केवल एक यादृच्छिक प्रभाव के रूप में चाहते हैं।" मुझे लगता है कि आपका मतलब है कि वर्ग यादृच्छिक प्रभाव है। जब तक डेटा में आगे घोंसले का शिकार न हो (जैसे बच्चों पर बार-बार माप) तो बच्चे के स्तर के यादृच्छिक प्रभावों की पहचान नहीं की जाती है।
मैक्रों

1
@ मैक्रो हां, मेरा यही मतलब है, क्षमा करें। शब्दावली बहुत भ्रामक है! यही कारण है कि हो सकता है क्यों Gelman शर्तों 'तय' eschews और 'यादृच्छिक'
पीटर Flom - को पुनः स्थापित मोनिका

2
@ मिचेल, मैं आपसे सहमत हूं। इस प्रकार के पदानुक्रमित मॉडल में, यादृच्छिक प्रभावों को एक समूह चर द्वारा परिभाषित किया जाता है (जैसा कि अन्य बहुभिन्नरूपी मॉडल जैसे कि स्थानिक रूप से अनुक्रमित डेटा सेटों के विपरीत, जहां 'समूहन चर' लगातार भिन्न होता है)। ओपी के प्रश्न में, Siteयादृच्छिक प्रभाव के रूप में संदर्भित किया जाएगा, नहींT या Aया कुछ और। इस तरह से सोचना, Siteस्पष्ट रूप से प्रभाव दोनों निश्चित और यादृच्छिक नहीं हो सकता है, क्योंकि दोनों एक दूसरे से पहचाने नहीं जाएंगे। एक चर के लिए आपके पास स्थिर और यादृच्छिक गुणांक दोनों हो सकते हैं, लेकिन यह एक अलग सवाल है।
मैक्रों
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.