यह कुछ बहुत अच्छे उत्तरों के साथ एक पुराना प्रश्न है, हालांकि मुझे लगता है कि अधिक व्यावहारिक दृष्टिकोण को संबोधित करने के लिए एक नए उत्तर से लाभ हो सकता है।
यादृच्छिक प्रभाव के स्तरों में भिन्नता के लिए एक निश्चित प्रभाव की अनुमति कब नहीं दी जानी चाहिए?
मैं अन्य उत्तरों में पहले से ही वर्णित मुद्दों को संबोधित नहीं करूंगा, इसके बजाय मैं अब-प्रसिद्ध का उल्लेख करूंगा, हालांकि मैं बर्र एट अल (2013) द्वारा "बदनाम" कागज को अक्सर कहूंगा कि इसे "अधिकतम रखें"
बर्र, डीजे, लेवी, आर।, शेपर्स, सी। और टिली, एचजे, 2013। पुष्टित्मक परिकल्पना परीक्षण के लिए यादृच्छिक प्रभाव संरचना: इसे अधिकतम रखें। जर्नल ऑफ़ मेमोरी एंड लैंग्वेज, 68 (3), पीपी.255-278।
इस पत्र में लेखकों का तर्क है कि सभी निश्चित प्रभावों को समूहीकरण के कारकों (यादृच्छिक अंतर) के स्तरों में भिन्न होने की अनुमति दी जानी चाहिए। उनका तर्क काफी सम्मोहक है - मूल रूप से यह कि उन्हें अलग-अलग करने की अनुमति नहीं देकर, यह मॉडल पर अड़चनें डाल रहा है। अन्य उत्तरों में यह अच्छी तरह वर्णित है। हालांकि, इस दृष्टिकोण के साथ संभावित गंभीर समस्याएं हैं, जो बेट्स अल अल (2015) द्वारा वर्णित हैं:
बेट्स, डी।, क्लीगल, आर।, वशिष्ठ, एस और बेयेन, एच।, 2015। पारसीमोनियस मिश्रित मॉडल। arXiv प्रीप्रिंट arXiv: 1506.04967
यहां यह ध्यान देने योग्य है कि बेट्स lme4
आर में मिश्रित मॉडल फिट करने के लिए पैकेज का प्राथमिक लेखक है , जो शायद ऐसे मॉडलों के लिए सबसे व्यापक रूप से उपयोग किया जाने वाला पैकेज है। बेट्स एट अल ध्यान दें कि कई वास्तविक दुनिया अनुप्रयोगों में, डेटा केवल एक अधिकतम यादृच्छिक प्रभाव संरचना का समर्थन नहीं करेगा, अक्सर क्योंकि प्रासंगिक चर के लिए प्रत्येक क्लस्टर में टिप्पणियों की अपर्याप्त संख्या होती है। यह उन मॉडलों में खुद को प्रकट कर सकता है जो अभिसरण करने में विफल होते हैं, या यादृच्छिक प्रभावों में विलक्षण हैं। इस तरह के मॉडल के बारे में इस साइट पर बड़ी संख्या में प्रश्न उस पर निर्भर करते हैं। उन्होंने यह भी ध्यान दिया कि बर्र एट अल ने अपने पेपर के आधार के रूप में "सुव्यवस्थित" यादृच्छिक प्रभावों के साथ एक अपेक्षाकृत सरल सिमुलेशन का उपयोग किया। इसके बजाय बेट्स एट अल निम्नलिखित दृष्टिकोण का सुझाव देते हैं:
हमने (1) यादृच्छिक प्रभाव संरचना के विचरण-सहसंयोजक मैट्रिक्स की गतिशीलता का निर्धारण करने के लिए पीसीए का उपयोग करने का प्रस्ताव किया, (2) शुरू में सहसंबंध मापदंडों को शून्य करने के लिए विवश किया, खासकर जब एक अधिकतम मॉडल को फिट करने के लिए प्रारंभिक प्रयास में अभिसरण नहीं है, और (3) मॉडल से गैर-महत्वपूर्ण विचरण घटकों और उनके संबद्ध सहसंबंध मापदंडों को छोड़ने के लिए
एक ही कागज में, वे भी ध्यान दें:
महत्वपूर्ण रूप से, अभिसरण की विफलता अनुमान एल्गोरिथ्म के दोषों के कारण नहीं है, लेकिन एक मॉडल को फिट करने के प्रयास का एक सीधा परिणाम है जो डेटा द्वारा ठीक से समर्थित होने के लिए बहुत जटिल है।
तथा:
अधिकतम रूढ़िवादी मॉडल विरोधी रूढ़िवादी निष्कर्षों से बचाने के लिए आवश्यक नहीं हैं। यह सुरक्षा पूरी तरह से व्यापक मॉडलों द्वारा प्रदान की जाती है जो कि डेटा का समर्थन कर सकने वाली जटिलता के बारे में यथार्थवादी उम्मीदों द्वारा निर्देशित होती हैं। आंकड़ों में, जैसा कि विज्ञान में कहीं और कहा गया है, पारसमणि एक गुण है, न कि वाइस।
बेट्स एट अल (2015)
अधिक लागू दृष्टिकोण से, एक और विचार किया जाना चाहिए कि डेटा उत्पादन प्रक्रिया, डेटा को रेखांकित करने वाले जैविक / भौतिक / रासायनिक सिद्धांत, यादृच्छिक प्रभाव संरचना को निर्दिष्ट करने की दिशा में विश्लेषक का मार्गदर्शन करना चाहिए या नहीं।