जब मुझे मिश्रित प्रभाव मॉडल में यादृच्छिक प्रभाव के स्तरों में भिन्नता के लिए एक निश्चित प्रभाव की अनुमति * नहीं देनी चाहिए?


16

एक अनुमानित चर (पी), एक यादृच्छिक प्रभाव (आर) और एक निश्चित प्रभाव (एफ) को देखते हुए, कोई दो * मिश्रित प्रभाव मॉडल ( lme4 वाक्यविन्यास) फिट कर सकता है :

m1 = lmer( P ~ (1|R) + F )
m2 = lmer( P ~ (1+F|R) + F)

जैसा कि मैं इसे समझता हूं, दूसरा मॉडल वह है जो यादृच्छिक प्रभाव के स्तरों में भिन्नता के लिए निश्चित प्रभाव की अनुमति देता है।

अपने शोध में मैं आमतौर पर कई मानव प्रतिभागियों में किए गए प्रयोगों से डेटा का विश्लेषण करने के लिए मिश्रित प्रभाव मॉडल नियुक्त करता हूं। मैं एक यादृच्छिक प्रभाव और निश्चित प्रभावों के रूप में प्रयोगात्मक जोड़तोड़ के रूप में भाग लेता हूं। मुझे लगता है कि डिग्री के प्रदर्शन में प्रभाव को प्रभावित करने वाले अंश को प्रतिभागियों में अलग-अलग होने देने के लिए यह एक प्राथमिकता है। हालाँकि, मुझे उन परिस्थितियों की कल्पना करने में परेशानी होती है, जिनके तहत मुझे किसी यादृच्छिक प्रभाव के स्तरों में भिन्नता के लिए निश्चित प्रभावों की अनुमति नहीं देनी चाहिए, इसलिए मेरा प्रश्न यह है:

यादृच्छिक प्रभाव के स्तरों में भिन्नता के लिए एक निश्चित प्रभाव की अनुमति कब नहीं दी जानी चाहिए ?


मैं अभी भी पूरी तरह से lme4 सिंटैक्स को नहीं समझता हूं, इसलिए मैं उत्तर देखने के लिए उत्सुक हूं। लेकिन मेरे पास एक कूबड़ है कि यह निम्नलिखित अंतर से संबंधित है: पी वह समय है जब छात्र होमवर्क करने में खर्च करता है, आर कक्षा स्तर पर एक इलाज है और एफ छात्र है। (हमें कक्षा के लिए भी एक यादृच्छिक प्रभाव होना चाहिए।) यदि सभी छात्र अलग-अलग समय पर सभी उपचारों के अधीन हैं, तो एफ का स्तर कक्षाओं में तुलनीय है। यदि हम एक पूरे स्कूल को एक साथ मापते हैं, तो हमारे पास प्रत्येक कक्षा में अलग-अलग छात्र हैं, इसलिए विभिन्न कक्षाओं में एफ के स्तर का एक-दूसरे के साथ कोई लेना-देना नहीं है।
थॉमस लेविन

जवाबों:


11

मैं मिश्रित प्रभाव वाले मॉडलिंग का विशेषज्ञ नहीं हूं, लेकिन सवाल का जवाब देना बहुत आसान है अगर यह पदानुक्रमित प्रतिगमन मॉडलिंग के संदर्भ में है। इसलिए हमारी टिप्पणियों में दो इंडेक्स और जिनमें इंडेक्स और क्लास के सदस्य हैं। पदानुक्रमित मॉडल हमें रेखीय प्रतिगमन फिट करते हैं, जहां गुणांक कक्षाओं में भिन्न होते हैं: एफ आई जे आई जेPijFijij

Yij=β0i+β1iFij

यह हमारा प्रथम स्तर का प्रतिगमन है। दूसरे स्तर का प्रतिगमन पहले प्रतिगमन गुणांक पर किया जाता है:

β0i=γ00+u0iβ1i=γ01+u1i

जब हम इसे प्रथम स्तर के प्रतिगमन में स्थानापन्न करते हैं तो हमें मिलता है

Yij=(γ0+u0i)+(γ01+u1i)Fij=γ0+u0i+u1iFij+γ01Fij

यहाँ निश्चित प्रभाव हैं और यादृच्छिक प्रभाव हैं। मिश्रित मॉडल का अनुमान है कि आप और के ।यू γ यूγuγu

मैंने जो मॉडल लिखा है वह lmerवाक्य रचना से मेल खाता है

P ~ (1+F|R) + F

अब अगर हम यादृच्छिक शब्द के बिना हैंβ1i=γ01

Yij=γ0+u0i+γ01Fij

जो lmerसिंटैक्स से मेल खाती है

P ~ (1|R) + F

तो अब प्रश्न यह हो जाता है कि हम त्रुटि शब्द को दूसरे स्तर के प्रतिगमन से कब निकाल सकते हैं? विहित उत्तर यह है कि जब हम सुनिश्चित होते हैं कि रजिस्टरों (यहां हमारे पास कोई भी नहीं है, लेकिन हम उन्हें शामिल कर सकते हैं, वे स्वाभाविक रूप से कक्षाओं के भीतर स्थिर हैं) दूसरे स्तर के प्रतिगमन में पूरी तरह से कक्षाओं में गुणांक के विचरण को स्पष्ट करते हैं।

तो इस विशेष मामले में यदि का गुणांक भिन्न नहीं होता है, या वैकल्पिक रूप से का विचरण बहुत छोटा होता है, तो हमें यह विचार करना चाहिए कि हम पहले मॉडल के साथ बेहतर हैं। u 1 iFiju1i

ध्यान दें । मैंने केवल बीजीय स्पष्टीकरण दिया है, लेकिन मुझे लगता है कि यह विशेष रूप से लागू उदाहरण के बारे में सोचना बहुत आसान है।


क्या पहले समीकरण में एक त्रुटि शब्द भी होना चाहिए:Yij=β0i+β1iFij+eij
निकिता

हां, लेकिन मैंने इसे स्पष्टता के लिए छोड़ दिया, मुझे लगता है।
mpiktas

10

आप "स्थिर प्रभाव" को शून्य के विचरण घटक के साथ "यादृच्छिक प्रभाव" के रूप में सोच सकते हैं।

तो, एक साधारण जवाब कि आप अलग-अलग प्रभाव क्यों नहीं होने देंगे, एक "बड़े पर्याप्त" विचरण घटक के लिए अपर्याप्त सबूत है। सबूत पूर्व सूचना और डेटा दोनों से आना चाहिए। यह मूल "ओटामस रेजर" सिद्धांत के अनुरूप है: अपने मॉडल को अधिक जटिल बनाने की ज़रूरत नहीं है क्योंकि यह होना चाहिए।

मैं निम्नलिखित तरीके से रैखिक मिश्रित मॉडल के बारे में सोचता हूं, इस प्रकार कई प्रतिगमन लिखता हूं:

Y=Xβ+Zu+e

तो मॉडल का "निश्चित" हिस्सा है, "यादृच्छिक" भाग है और ओएलएस शैली अवशिष्ट है। हमारे पास "यादृच्छिक प्रभाव" विचरण पैरामीटर और लिए । यह मानक परिणाम , जिसका अर्थ है: हमारे पास:XβZueuN(0,D(θ))θeN(0,σ2I)(Zu+e)N(0,ZD(θ)ZT+σ2I)

YN(Xβ,ZD(θ)ZT+σ2I)

इसकी तुलना ओएलएस रिग्रेशन (जिसमें ) से करें और हमें मिलता है:Z=0

YN(Xβ,σ2I)

तो मॉडल के "यादृच्छिक" भाग को मॉडल में शोर या त्रुटि घटक के सहसंबंध संरचना के बारे में पूर्व सूचना निर्दिष्ट करने के तरीके के रूप में देखा जा सकता है । ओएलएस मूल रूप से मानता है कि एक मामले में मॉडल के निश्चित भाग से कोई एक त्रुटि किसी अन्य त्रुटि की भविष्यवाणी करने के लिए बेकार है, भले ही हम निश्चितता के साथ मॉडल के निश्चित भाग को जानते हों। एक यादृच्छिक प्रभाव जोड़ना मूल रूप से कह रहा है कि आपको लगता है कि कुछ त्रुटियां अन्य त्रुटियों की भविष्यवाणी करने में उपयोगी होने की संभावना है।


5

यह कुछ बहुत अच्छे उत्तरों के साथ एक पुराना प्रश्न है, हालांकि मुझे लगता है कि अधिक व्यावहारिक दृष्टिकोण को संबोधित करने के लिए एक नए उत्तर से लाभ हो सकता है।

यादृच्छिक प्रभाव के स्तरों में भिन्नता के लिए एक निश्चित प्रभाव की अनुमति कब नहीं दी जानी चाहिए?

मैं अन्य उत्तरों में पहले से ही वर्णित मुद्दों को संबोधित नहीं करूंगा, इसके बजाय मैं अब-प्रसिद्ध का उल्लेख करूंगा, हालांकि मैं बर्र एट अल (2013) द्वारा "बदनाम" कागज को अक्सर कहूंगा कि इसे "अधिकतम रखें"

बर्र, डीजे, लेवी, आर।, शेपर्स, सी। और टिली, एचजे, 2013। पुष्टित्मक परिकल्पना परीक्षण के लिए यादृच्छिक प्रभाव संरचना: इसे अधिकतम रखें। जर्नल ऑफ़ मेमोरी एंड लैंग्वेज, 68 (3), पीपी.255-278।

इस पत्र में लेखकों का तर्क है कि सभी निश्चित प्रभावों को समूहीकरण के कारकों (यादृच्छिक अंतर) के स्तरों में भिन्न होने की अनुमति दी जानी चाहिए। उनका तर्क काफी सम्मोहक है - मूल रूप से यह कि उन्हें अलग-अलग करने की अनुमति नहीं देकर, यह मॉडल पर अड़चनें डाल रहा है। अन्य उत्तरों में यह अच्छी तरह वर्णित है। हालांकि, इस दृष्टिकोण के साथ संभावित गंभीर समस्याएं हैं, जो बेट्स अल अल (2015) द्वारा वर्णित हैं:

बेट्स, डी।, क्लीगल, आर।, वशिष्ठ, एस और बेयेन, एच।, 2015। पारसीमोनियस मिश्रित मॉडल। arXiv प्रीप्रिंट arXiv: 1506.04967

यहां यह ध्यान देने योग्य है कि बेट्स lme4आर में मिश्रित मॉडल फिट करने के लिए पैकेज का प्राथमिक लेखक है , जो शायद ऐसे मॉडलों के लिए सबसे व्यापक रूप से उपयोग किया जाने वाला पैकेज है। बेट्स एट अल ध्यान दें कि कई वास्तविक दुनिया अनुप्रयोगों में, डेटा केवल एक अधिकतम यादृच्छिक प्रभाव संरचना का समर्थन नहीं करेगा, अक्सर क्योंकि प्रासंगिक चर के लिए प्रत्येक क्लस्टर में टिप्पणियों की अपर्याप्त संख्या होती है। यह उन मॉडलों में खुद को प्रकट कर सकता है जो अभिसरण करने में विफल होते हैं, या यादृच्छिक प्रभावों में विलक्षण हैं। इस तरह के मॉडल के बारे में इस साइट पर बड़ी संख्या में प्रश्न उस पर निर्भर करते हैं। उन्होंने यह भी ध्यान दिया कि बर्र एट अल ने अपने पेपर के आधार के रूप में "सुव्यवस्थित" यादृच्छिक प्रभावों के साथ एक अपेक्षाकृत सरल सिमुलेशन का उपयोग किया। इसके बजाय बेट्स एट अल निम्नलिखित दृष्टिकोण का सुझाव देते हैं:

हमने (1) यादृच्छिक प्रभाव संरचना के विचरण-सहसंयोजक मैट्रिक्स की गतिशीलता का निर्धारण करने के लिए पीसीए का उपयोग करने का प्रस्ताव किया, (2) शुरू में सहसंबंध मापदंडों को शून्य करने के लिए विवश किया, खासकर जब एक अधिकतम मॉडल को फिट करने के लिए प्रारंभिक प्रयास में अभिसरण नहीं है, और (3) मॉडल से गैर-महत्वपूर्ण विचरण घटकों और उनके संबद्ध सहसंबंध मापदंडों को छोड़ने के लिए

एक ही कागज में, वे भी ध्यान दें:

महत्वपूर्ण रूप से, अभिसरण की विफलता अनुमान एल्गोरिथ्म के दोषों के कारण नहीं है, लेकिन एक मॉडल को फिट करने के प्रयास का एक सीधा परिणाम है जो डेटा द्वारा ठीक से समर्थित होने के लिए बहुत जटिल है।

तथा:

अधिकतम रूढ़िवादी मॉडल विरोधी रूढ़िवादी निष्कर्षों से बचाने के लिए आवश्यक नहीं हैं। यह सुरक्षा पूरी तरह से व्यापक मॉडलों द्वारा प्रदान की जाती है जो कि डेटा का समर्थन कर सकने वाली जटिलता के बारे में यथार्थवादी उम्मीदों द्वारा निर्देशित होती हैं। आंकड़ों में, जैसा कि विज्ञान में कहीं और कहा गया है, पारसमणि एक गुण है, न कि वाइस।

बेट्स एट अल (2015)

अधिक लागू दृष्टिकोण से, एक और विचार किया जाना चाहिए कि डेटा उत्पादन प्रक्रिया, डेटा को रेखांकित करने वाले जैविक / भौतिक / रासायनिक सिद्धांत, यादृच्छिक प्रभाव संरचना को निर्दिष्ट करने की दिशा में विश्लेषक का मार्गदर्शन करना चाहिए या नहीं।


"अक्सर क्योंकि प्रत्येक क्लस्टर में टिप्पणियों की अपर्याप्त संख्या होती है" क्या आप इस पर विस्तार से बता सकते हैं? मैंने सोचा, प्रति क्लस्टर न्यूनतम आवश्यक संख्या 1 है? यह यहां तक ​​कि आपका स्वीकृत उत्तर भी है: आंकड़े
LuckyPal

@ जिस प्रश्न से आप जुड़े हैं, वह रैंडम इंटरसेप्ट्स के बारे में है, यह रैंडम स्लोप्स के बारे में है। आप 1 के नमूने के आकार के लिए ढलान का अनुमान कैसे लगाएंगे?
रॉबर्ट लॉन्ग

मुद्दा लेना। धन्यवाद! +1 लेकिन यदि हम पर्याप्त क्लस्टर हैं तो प्रति क्लस्टर केवल एक अवलोकन के साथ एक निश्चित ढलान का अनुमान लगा सकते हैं? यह थोड़ा अजीब लगता है। हो सकता है, जब नमूना आकार के कारण यादृच्छिक ढलान के साथ अभिसरण समस्याएं होती हैं, ढलान का अनुमान - क्या यह यादृच्छिक है या नहीं - सामान्य रूप से संदिग्ध हो सकता है?
लकीपाल

@ LuckyPal हाँ, एक निश्चित ढलान का अनुमान सभी समूहों के पार है, इसलिए यह आमतौर पर कोई समस्या नहीं है। मैं मानता हूं कि छोटे समूहों के साथ एक यादृच्छिक ढलान का अनुमान लगाने के परिणामस्वरूप अभिसरण समस्याएं हो सकती हैं, लेकिन यह एक निश्चित ढलान के अनुमान को प्रभावित नहीं करना चाहिए।
राबर्ट लॉन्ग
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.