एक मिश्रित मॉडल में एक कारक को यादृच्छिक के रूप में मानने से उल्टा क्या है?


24

मुझे कुछ कारणों से एक मॉडल कारक को यादृच्छिक के रूप में लेबल करने के लाभों को गले लगाने में समस्या है। मेरे लिए यह ऐसा प्रतीत होता है कि लगभग सभी मामलों में सभी कारकों के अनुसार तय किया गया इष्टतम उपचार है।

सबसे पहले, फिक्स्ड बनाम रैंडम का अंतर काफी मनमाना है। मानक स्पष्टीकरण यह है कि, यदि कोई विशेष प्रायोगिक इकाइयों में प्रति सेगमेंट में रुचि रखता है, तो एक को निश्चित प्रभावों का उपयोग करना चाहिए, और, यदि किसी को प्रयोगात्मक इकाइयों द्वारा प्रतिनिधित्व की गई आबादी में दिलचस्पी है, तो किसी को यादृच्छिक प्रभावों का उपयोग करना चाहिए। यह ज्यादा मदद का नहीं है क्योंकि इसका तात्पर्य है कि यदि डेटा और प्रायोगिक डिजाइन समान रहे तो भी निश्चित और यादृच्छिक विचारों के बीच वैकल्पिक हो सकता है। इसके अलावा, यह परिभाषा एक भ्रम को बढ़ावा देती है कि, यदि किसी कारक को यादृच्छिक के रूप में लेबल किया जाता है, तो मॉडल से निकाला गया इंट्रैक्शन किसी भी तरह से उस स्थिति में जनसंख्या पर लागू होता है जब कारक को निश्चित रूप से लेबल किया जाता है। अंत में, गेलमैन दर्शाता है कि निश्चित-यादृच्छिक अंतर भ्रामक है यहां तक ​​कि परिभाषा के स्तर पर भी क्योंकि निर्धारित और यादृच्छिक प्रभाव की चार और परिभाषाएं हैं।

दूसरा, मिश्रित मॉडल का अनुमान काफी जटिल है। "विशुद्ध रूप से तय" मॉडल के विपरीत, पी-वैल्यू प्राप्त करने के कुछ तरीके हैं। प्रो। बेट्स जिन्होंने आर में lme4 पैकेज में REML अनुमान को लागू किया था, पी-वैल्यू को पूरी तरह से रिपोर्ट करने से इनकार करने के लिए इतनी दूर चले गए। ।

तीसरा, एक बेतरतीब कारक द्वारा कितने निहित मापदंडों को पेश किया जाता है, इसका एक अस्पष्ट मुद्दा है। निम्नलिखित उदाहरण बर्नहेम और एंडरसन, मॉडल चयन और मल्टी-मॉडल आविष्कार में मेरा अनुकूलन है : एक व्यावहारिक सूचना-सैद्धांतिक दृष्टिकोण । पूर्वाग्रह-विचरण व्यापार दृष्टिकोण से, यादृच्छिक प्रभावों की भूमिका निम्नानुसार चित्रित की जा सकती है। K उपचार और मुख्य कारक प्रभावों के साथ एक-तरफ़ा ANOVA पर विचार करें , जिनमें से अनुमानित हैं। त्रुटि शब्द में वितरण है। यदि टिप्पणियों की संख्या तय हो जाती है, तो ऊपर जाते हुए पूर्वाग्रह-भिन्नता व्यापार बिगड़ जाएगा । मान लीजिए कि हमें कहना है किKK1N(0,σ2)KKमुख्य प्रभाव वितरण से तैयार किए गए हैं । संबंधित मॉडल में एक जटिलता होगी जो निश्चित (ओवरफिटेड) संस्करण के बीच में होती है और अंडरफाइड मॉडल जिसमें केवल इंटरसेप्ट होता है। निश्चित मॉडल में प्रभावी मापदंडों की संख्या हैN(0,σK)

1intercept+(K1)maineffects+1σ=K+1.

यादृच्छिक मॉडल में प्रभावी मापदंडों की संख्या कम से कम तीन है: । इसके अलावा, यादृच्छिक मॉडल में मुख्य प्रभावों पर लगाए गए वितरण (इस मामले में सामान्य) प्रतिबंध द्वारा निहित "छिपी" पैरामीटर की एक संख्या है।intercept,σ,σK

विशेष रूप से, अगर दो स्तरों के साथ एक कारक है, तो इसे यादृच्छिक कहने का कोई मतलब नहीं है, भले ही हम यह सुनिश्चित करने के लिए जानते हों कि इसका स्तर कुछ आबादी से यादृच्छिक पर नमूना लिया गया है। ऐसा इसलिए है क्योंकि निर्धारित प्रभाव संस्करण में तीन पैरामीटर हैं, और यादृच्छिक प्रभाव संस्करण में तीन पैरामीटर हैं। इस मामले में, यादृच्छिक मॉडल निर्धारित संस्करण की तुलना में अधिक जटिलता के लिए निकलता है। जाहिर है, यादृच्छिक संस्करण के लिए तय से एक स्विच अधिक बड़ा के लिए आधारित हैK। हालांकि, यादृच्छिक मॉडल में "छिपे हुए" मापदंडों की संख्या अज्ञात है, इसलिए एआईसी जैसे सूचना मानदंडों के आधार पर निश्चित और यादृच्छिक संस्करणों की तुलना करना असंभव है। इसलिए, जबकि यह उदाहरण यादृच्छिक प्रभावों (एक बेहतर पूर्वाग्रह-विचरण व्यापार की संभावना) के योगदान पर प्रकाश डालता है, यह भी दर्शाता है कि जब कारक को यादृच्छिक से तय किया गया है तो यह कहना मुश्किल है।

उपरोक्त समस्याओं में से कोई भी "शुद्ध रूप से तय" मॉडल में मौजूद नहीं है। इसलिए, मैं पूछने के लिए तैयार हूं:

  1. क्या कोई एक उदाहरण प्रदान कर सकता है जब कोई बहुत बुरा हुआ जब एक यादृच्छिक कारक का उपयोग किया गया था जैसे कि यह तय किया गया था? मेरा मानना ​​है कि कुछ सिमुलेशन अध्ययन होना चाहिए जो इस मुद्दे को स्पष्ट रूप से संबोधित करते हैं।

  2. क्या यह तय करने के लिए एक परिमाणात्मक मात्रात्मक विधि है कि यह तय होने से लेकर यादृच्छिक लेबल तक स्विच करने के लिए कब समझ में आता है?


अच्छी तरह से लिखित प्रश्न, और मैंने इसे पढ़ने से कुछ चीजें सीखीं। मुझे आश्चर्य है कि यदि यादृच्छिक प्रभाव विश्लेषण लंबे समय में बर्बाद हो जाता है, तो शायद अधिक सरल चौरसाई तकनीक द्वारा हरा दिया जाए। अगर मैं # 1 का जवाब देने की कोशिश करता हूं, तो मैं उच्च परिवर्तनशीलता, कई विषयों और विषय के भीतर छोटे नमूने के आकार के साथ एक स्थिति के लिए जाऊंगा। तब सभी जगह निश्चित विषय निर्धारित होंगे।
बेन ओगोरक

जवाबों:


20

1. मनोविज्ञान और भाषाविज्ञान में एक प्रसिद्ध उदाहरण हर्ब क्लार्क (1973; कोलमैन, 1964 के बाद) द्वारा वर्णित है: "भाषा-जैसा-निश्चित-प्रभाव गिरावट: मनोवैज्ञानिक अनुसंधान में भाषा के आँकड़ों की एक आलोचना।"

क्लार्क मनोवैज्ञानिक प्रयोगों पर चर्चा करने वाले एक मनोचिकित्सक हैं जिसमें अनुसंधान विषयों का एक नमूना उत्तेजना सामग्री के एक सेट पर प्रतिक्रिया करता है, आमतौर पर कुछ कॉर्पस से तैयार किए गए विभिन्न शब्द। वह बताते हैं कि इन मामलों में इस्तेमाल की जाने वाली मानक सांख्यिकीय प्रक्रिया, बार-बार किए गए उपायों एनोवा पर आधारित है, और क्लार्क द्वारा रूप में संदर्भित किया जाता है , प्रतिभागियों को एक यादृच्छिक कारक के रूप में मानता है लेकिन (शायद निहित) उत्तेजना सामग्री (या भाषा) का इलाज करता है जैसा तय हो। यह प्रायोगिक स्थिति कारक पर परिकल्पना परीक्षणों के परिणामों की व्याख्या करने में समस्याओं की ओर जाता है: स्वाभाविक रूप से हम यह मानना ​​चाहते हैं कि एक सकारात्मक परिणाम हमें दोनों आबादी के बारे में कुछ बताता है जिसमें से हमने अपने प्रतिभागी नमूने के साथ-साथ सैद्धांतिक आबादी को भी आकर्षित किया है जिससे हम समझ गए हैं भाषा सामग्री। लेकिन एफएफ1 , प्रतिभागियों को यादृच्छिक और उत्तेजनाओं के रूप में तय करके, केवल अन्य समान प्रतिभागियोंको सटीक समान उत्तेजनाओं काजवाब देनेवालेस्थिति कारक के प्रभाव के बारे में बताता है। एफ 1 विश्लेषण काआयोजनजब प्रतिभागियों और उत्तेजनाओं दोनों को अधिक उचित रूप से देखा जाता है, तो यादृच्छिक के रूप में देखा जा सकता है टाइप 1 त्रुटि दर जो नाममात्र α स्तरसे अधिक हो सकतीहै - आमतौर पर .05 - इस तरह की संख्या और परिवर्तनशीलता जैसे कारकों के आधार पर हद तक। उत्तेजना और प्रयोग का डिज़ाइन। इन मामलों में, अधिक उपयुक्त विश्लेषण, कम से कम शास्त्रीय एनोवा फ्रेमवर्क के तहत, क्या उपयोग किया जाता है जिसे अर्ध कहा जाता है-रैखिकआँकड़ों के अनुपात के आधार पर एफ आँकड़ेएफ1एफ1αएफ चौकों का मतलब है।

क्लार्क के पेपर ने उस समय मनोवैज्ञानिक विज्ञान में एक अलग छलांग लगाई, लेकिन व्यापक मनोवैज्ञानिक साहित्य में एक बड़ा सेंध लगाने में असफल रहे। (और मनोचिकित्सा विज्ञान के भीतर भी क्लार्क की सलाह कुछ वर्षों में विकृत हो गई, जैसा कि रायजमेकरों, स्क्रीज़नेकर्स, और ग्रेमेन, 1999 द्वारा प्रलेखित है।) लेकिन हाल के वर्षों में इस मुद्दे पर कुछ सुधार हुआ है, जो कि सांख्यिकीय प्रगति के लिए बड़े हिस्से के कारण है। मिश्रित-प्रभाव वाले मॉडल में, जिनमें से शास्त्रीय मिश्रित मॉडल एनोवा को एक विशेष मामले के रूप में देखा जा सकता है। इन हालिया पत्रों में से कुछ में बेयेन, डेविडसन, और बेट्स (2008), मुरायामा, सकाकी, यान और स्मिथ (2014) और ( अहम ) जुड, वेस्टफॉल और केनी (2012) शामिल हैं। मुझे यकीन है कि कुछ ऐसे हैं जो मैं भूल रहा हूँ।

2. बिल्कुल नहीं। यह देखने केतरीके हैं कि क्या कोई कारक एक यादृच्छिक प्रभाव के रूप में बेहतर रूप से शामिल है या मॉडल में बिल्कुल भी नहीं है (उदाहरण के लिए, पिनहेइरो और बेट्स, 2000, पीपी 83-87; हालांकि बर्र, लेवी,स्केपर्स और टिली,देखें) 2013)। और निश्चित रूप से यह निर्धारित करने के लिए शास्त्रीय मॉडल तुलना तकनीकें हैं कि क्या कोई कारक निश्चित प्रभाव के रूप में बेहतर रूप से शामिल है या नहीं (यानी, वेस्ट)। लेकिन मुझे लगता है कि यह निर्धारित करना कि किसी कारक को निश्चित माना जाता है या यादृच्छिक को आम तौर पर एक वैचारिक प्रश्न के रूप में सबसे अच्छा छोड़ दिया जाता है, जिसका उत्तर अध्ययन के डिजाइन और उससे निकाले जाने वाले निष्कर्षों की प्रकृति पर विचार करके दिया जाना है।एफ

मेरे स्नातक सांख्यिकी प्रशिक्षकों में से एक, गैरी मैकलेलैंड ने यह कहना पसंद किया कि शायद सांख्यिकीय अनुमान का मौलिक प्रश्न है: "किसकी तुलना में?" गैरी के बाद, मुझे लगता है कि हम उस वैचारिक प्रश्न को फ्रेम कर सकते हैं जिसका मैंने ऊपर उल्लेख किया है: काल्पनिक प्रयोगात्मक परिणामों का संदर्भ वर्ग क्या है जो मैं अपने वास्तविक देखे गए परिणामों की तुलना करना चाहता हूं? मनोचिकित्सा के संदर्भ में रहना, और एक प्रयोगात्मक डिजाइन पर विचार करना, जिसमें हमारे पास दो शब्दों में से एक में वर्गीकृत किए गए शब्दों का एक नमूना है, जो दो स्थितियों में वर्गीकृत हैं (क्लार्क, 1973 की लंबाई पर चर्चा की गई विशेष डिजाइन), मैं इस पर ध्यान केंद्रित करूंगा। दो संभावनाएँ:

  1. प्रयोगों का सेट, जिसमें प्रत्येक प्रयोग के लिए, हम सब्जेक्ट्स का एक नया नमूना, शब्दों का एक नया नमूना और जेनेरेटिव मॉडल से त्रुटियों का एक नया नमूना तैयार करते हैं। इस मॉडल के तहत, विषय और शब्द दोनों यादृच्छिक प्रभाव हैं।
  2. प्रयोगों का सेट, जिसमें प्रत्येक प्रयोग के लिए, हम विषयों का एक नया नमूना और त्रुटियों का एक नया नमूना बनाते हैं, लेकिन हम हमेशा शब्दों के एक ही सेट का उपयोग करते हैं । इस मॉडल के तहत, विषय यादृच्छिक प्रभाव हैं लेकिन शब्द निश्चित प्रभाव हैं।

इसे पूरी तरह से ठोस बनाने के लिए, नीचे दिए गए कुछ प्लॉट हैं (ऊपर) मॉडल 1 के तहत 4 सिम्युलेटेड प्रयोगों से काल्पनिक परिणामों के 4 सेट; (नीचे) मॉडल 2 के तहत 4 सिम्युलेटेड प्रयोगों से काल्पनिक परिणामों के 4 सेट। प्रत्येक प्रयोग दो तरीकों से परिणामों को देखता है: (बाएं पैनल) विषय द्वारा वर्गीकृत, विषय-दर-शर्त के साथ प्रत्येक विषय के लिए एक साथ साजिश रची और बांधा गया; (दाएं पैनल) शब्दों द्वारा समूहीकृत, बॉक्स प्लॉट प्रत्येक शब्द के लिए प्रतिक्रियाओं के वितरण को सारांशित करने के साथ। सभी प्रयोगों में 10 शब्दों का जवाब देने वाले 10 विषय शामिल हैं, और सभी प्रयोगों में प्रासंगिक स्थिति में बिना किसी अंतर के "शून्य परिकल्पना" सच है।

विषय और शब्द दोनों यादृच्छिक: 4 नकली प्रयोग

both_random

यहां ध्यान दें कि प्रत्येक प्रयोग में, विषय और शब्दों के लिए प्रतिक्रिया प्रोफ़ाइल पूरी तरह से अलग हैं। विषयों के लिए, हमें कभी-कभी कम समग्र उत्तरदाता, कभी-कभी उच्च उत्तरदाता, कभी-कभी ऐसे विषय मिलते हैं, जो बड़े शर्त अंतर दिखाते हैं, और कभी-कभी ऐसे विषय जो छोटे स्थिति अंतर दिखाते हैं। इसी तरह, शब्दों के लिए, हमें कभी-कभी ऐसे शब्द मिलते हैं जो कम प्रतिक्रियाओं को प्राप्त करते हैं, और कभी-कभी ऐसे शब्द मिलते हैं जो उच्च प्रतिक्रियाओं को प्राप्त करते हैं।

विषय यादृच्छिक, शब्द तय: 4 नकली प्रयोग

subs_random

यहाँ ध्यान दें कि 4 सिम्युलेटेड प्रयोगों में, विषय हर बार अलग दिखते हैं, लेकिन शब्दों के लिए प्रतिक्रिया प्रोफ़ाइल मूल रूप से एक जैसी दिखती है, इस धारणा के अनुरूप कि हम इस मॉडल के तहत हर प्रयोग के लिए शब्दों के एक ही सेट का पुनः उपयोग कर रहे हैं।

हमारी पसंद है कि क्या हम सोचते हैं कि मॉडल 1 (विषय और शब्द दोनों यादृच्छिक) या मॉडल 2 (विषय यादृच्छिक, शब्द निर्धारित) प्रायोगिक परिणामों के लिए उपयुक्त संदर्भ वर्ग प्रदान करता है जिसे हमने वास्तव में देखा है कि क्या हालत में हेरफेर के हमारे आकलन से बड़ा फर्क पड़ सकता है। "काम किया।" हम मॉडल 2 के तहत मॉडल 1 के तहत डेटा में अधिक संभावना भिन्नता की उम्मीद करते हैं, क्योंकि अधिक "चलती भागों" हैं। इसलिए यदि हम जो निष्कर्ष निकालना चाहते हैं वह मॉडल 1 की मान्यताओं के साथ अधिक सुसंगत है, जहां मौका परिवर्तनशीलता अपेक्षाकृत अधिक है, लेकिन हम मॉडल 2 की मान्यताओं के तहत अपने डेटा का विश्लेषण करते हैं, जहां मौका परिवर्तनशीलता अपेक्षाकृत कम है, तो हमारी टाइप 1 त्रुटि है हालत अंतर के परीक्षण के लिए दर कुछ (संभवतः काफी बड़ी) सीमा तक भड़काने वाली है। अधिक जानकारी के लिए, नीचे संदर्भ देखें।

संदर्भ

बेयेन, आरएच, डेविडसन, डीजे, और बेट्स, डीएम (2008)। विषयों और वस्तुओं के लिए यादृच्छिक प्रभावों के साथ मिश्रित-प्रभाव मॉडलिंग। स्मृति और भाषा का जर्नल, 59 (4), 390-412। पीडीएफ

बर्र, डीजे, लेवी, आर।, शेपर्स, सी।, और टिली, एचजे (2013)। पुष्टित्मक परिकल्पना परीक्षण के लिए यादृच्छिक प्रभाव संरचना: इसे अधिकतम रखें। जर्नल ऑफ़ मेमोरी एंड लैंग्वेज, 68 (3), 255-278। पीडीएफ

क्लार्क, एचएच (1973)। भाषा के रूप में निश्चित-प्रभाव की गिरावट: मनोवैज्ञानिक अनुसंधान में भाषा के आँकड़ों की आलोचना। मौखिक सीखने और मौखिक व्यवहार के जर्नल, 12 (4), 335-359। पीडीएफ

कोलमैन, ईबी (1964)। भाषा की आबादी के लिए सामान्यीकरण। मनोवैज्ञानिक रिपोर्ट, 14 (1), 219-226।

जुड, सीएम, वेस्टफॉल, जे।, और केनी, डीए (2012)। सामाजिक मनोविज्ञान में एक यादृच्छिक कारक के रूप में उत्तेजनाओं का इलाज: एक व्यापक और बड़े पैमाने पर अनदेखी समस्या का एक नया और व्यापक समाधान। व्यक्तित्व और सामाजिक मनोविज्ञान की पत्रिका, 103 (1), 54. पीडीएफ

मुरायामा, के।, साकची, एम।, यान, वीएक्स और स्मिथ, जीएम (2014)। टाइप टू एरर इन्फ्लेशन इनफ्लेशन बाई ट्रेडिशनल बाई-पार्टिसिपेंट एनालिसिस टू मेटेमोरी एक्यूरेसी: ए जनरलाइज्ड मिक्स्ड-इफेक्ट्स मॉडल पर्सपेक्टिव। प्रायोगिक मनोविज्ञान जर्नल: सीखना, स्मृति और अनुभूति। पीडीएफ

पिनहेइरो, जेसी, और बेट्स, डीएम (2000)। एस और एस-प्लस में मिश्रित-प्रभाव मॉडल। स्प्रिंगर।

राएजमेकर्स, जेजी, स्क्रीज़नेमेकर्स, जे।, और ग्रेमेन, एफ। (1999)। कैसे "भाषा-के रूप में तय-प्रभाव गिरावट" से निपटने के लिए: आम गलतफहमी और वैकल्पिक समाधान। जर्नल ऑफ़ मेमोरी एंड लैंग्वेज, 41 (3), 416-426। पीडीएफ


1
+1 यह एक बेहतरीन जवाब है, और आपका 2012 का पेपर बहुत अच्छा पढ़ा गया है।
अमीबा का कहना है कि मोनिका

चूंकि मूल प्रश्न पहले से ही एक उत्कृष्ट चर्चा से जुड़ा हुआ है जो इस बात से जुड़ा है - आप वास्तव में क्या उल्लेख कर रहे हैं?
जेम्स

1
द जेलमैन लिंक
जेक वेस्टफॉल

@ जेम्स मैं आगे गया और कुछ चित्रों सहित कुछ और वैचारिक सामान जोड़े। आप क्या सोचते हैं मुझे बताओ।
जेक वेस्टफॉल

चित्रों के लिए धन्यवाद। आपके अंतिम पैराग्राफ के अनुसार, मॉडल में अधिक प्रभाव यादृच्छिक के रूप में लेबल किए जाते हैं, शेष निश्चित प्रभाव (ओं) के लिए पी-मूल्य जितना अधिक होता है। हालांकि, एक एडिटिव मॉडल के लिए ऐसा दिखता है जब PROC MIXED में डिफ़ॉल्ट "कंटेंट" विधि का उपयोग किया जाता है, तो निश्चित प्रभाव के लिए पी-वैल्यू समान होगी। एक विशेष उदाहरण इस प्रश्न में है: आंकड़े.stackexchange.com/q/112640/54099 आप इसे कैसे समझा सकते हैं?
जेम्स

1

मान लीजिए कि मेरे पास एक निर्माण प्रक्रिया है जिसमें कई अलग-अलग मशीनों पर सामग्री बनाना शामिल है। वे एकमात्र ऐसी मशीन हैं जिनके पास मेरे पास "मशीन" एक निश्चित प्रभाव है। लेकिन मैं प्रत्येक मशीन पर बहुत सारी सामग्री बनाता हूं और मुझे भविष्य के लॉट के बारे में चीजों की भविष्यवाणी करने में दिलचस्पी है। मैं "लॉट नंबर" को एक यादृच्छिक कारक बनाऊंगा क्योंकि मैं उन परिणामों में दिलचस्पी रखता हूं जो मुझे भविष्य के लॉट के लिए मिलेंगे ।


1
प्रिय एमिल: मुझे डर है कि आप मेरे द्वारा पूछे गए सवालों को समझने में विफल रहे। आपका उदाहरण "फिक्स्ड बनाम रैंडम" की सबसे आम परिभाषा दिखाता है जो मैंने खुद अपने प्रश्न में प्रदान की थी। वैसे भी, अपने उदाहरण का उपयोग करके, क्या आप मुझे बता सकते हैं कि एक मॉडल से भविष्य की प्रतिक्रिया के बारे में निष्कर्ष निकालना एक बुरा विचार क्यों है जहां बहुत संख्या एक निश्चित कारक है?
जेम्स

यदि आप "बहुत संख्या" को निर्धारित के रूप में मानते हैं, तो आपके इंट्रेंस केवल उस लॉट पर लागू होंगे जो आपने पहले ही परीक्षण किया है। अन्य स्थितियों में एक ही तरह की चीज होती है। यदि आप यादृच्छिक प्रभावों के बारे में अनुमान लगाना चाहते हैं, तो उन्हें निश्चित प्रभावों के रूप में मानने से आम तौर पर गलत उत्तर मिलेंगे। कई मिश्रित मॉडल स्थितियों में, यादृच्छिक प्रभावों को निश्चित प्रभावों के रूप में मानना ​​यहां तक ​​कि उन प्रभावों के संबंध में गलत उत्तर देगा जो वास्तव में तय किए गए हैं।
एमिल फ्राइडमैन

यह उल्टा बनाम नीचे की बात नहीं है। यदि कोई अनुचित विश्लेषण करता है तो परिणाम आमतौर पर गलत होंगे।
एमिल फ्रीडमैन

क्या आप एक सिमुलेशन अध्ययन के लिए एक संदर्भ प्रदान कर सकते हैं जो यह दर्शाता है कि कैसे तय / यादृच्छिक लेबल के आधार पर परिणाम गलत हो जाता है?
जेम्स

यह भी ध्यान दें कि एमएलई मुफ्त में नहीं आता है, खासकर जब विचरण घटक मौजूद होते हैं। 3 कारकों के साथ एक पार फैले हुए डिज़ाइन को स्थापित करने की कोशिश करें और दो जोड़े कोवरिएट्स जारी रखें। फिर एक शुद्ध निश्चित मॉडल और कुछ मिश्रित विनिर्देशों का अनुमान लगाने की कोशिश करें। जब तक एक यादृच्छिक घटक होता है जो ओएलएस से एमएलई / आरईएमएल में स्विच का कारण बनता है, अभिसरण के साथ समस्याएं, शून्य या नकारात्मक विचरण घटक प्राप्त करना, या अन्य अर्थहीन परिणाम अधिक होने की संभावना है।
जेम्स

1

तो आप उन्हें यादृच्छिक मानते हैं ताकि कारक के नमूना आकार और टिप्पणियों की समग्र संख्या के आधार पर उस विशेष कारक के लिए औसत और औसत के बीच औसत प्रभाव हो। यह आपको यह कहने की अनुमति देता है कि आपके परिणाम बड़े पैमाने पर जनसंख्या पर लागू होते हैं, क्योंकि आपके पास एक प्रकार का भारित औसत है और उस कारक के कारण भिन्नता का अनुमान है, यदि नहीं, तो आप वास्तव में केवल यह कह सकते हैं कि आपके परिणाम कारक स्तरों पर लागू होते हैं आप प्रतिगमन के बाद से इस्तेमाल किया उन्हें असतत कारकों के रूप में व्यवहार करेंगे और यादृच्छिक नहीं जो भारित औसत प्राप्त करेंगे।

जब आप एक ही विषय पर उपायों को दोहराते हैं तो वे भी उपयोगी होते हैं, क्योंकि आप एक ही विषय पर उपायों के बीच संबंध के लिए उनका उपयोग कर सकते हैं।


आरएम के लिए, यही कारण है कि मैंने पहली जगह में सवाल पूछा है। जैसा कि मैंने यहां बताया है: आंकड़े .stackexchange.com / q / 112640 / 54099 विषय को निश्चित या यादृच्छिक के रूप में मानने से उपचार पी-मान नहीं बदलता है, इसलिए परेशान क्यों होते हैं।
जेम्स

यदि आपके पास एक कारक के साथ एक साधारण क्रॉस डिज़ाइन है और एक यादृच्छिक और एक्सपेक्टेड मीन स्क्वायर का उपयोग करते हैं, तो निश्चित कारक के लिए पी-मूल्य आपके द्वारा तय किए गए दोनों के अनुसार अलग-अलग होगा।
एमिल फ्रीडमैन

1

Yमैंj=β1एक्समैंj+β2जेडमैं+मैं+μमैंjएक्समैंjजेडमैंβ2जेडमैंमैंजेडमैं

Yमैंj=β1एक्समैंj+मैं+μमैंjजेडमैं

β1β1


(मूल उत्तर)

एक जगह जहां आपको अनिवार्य रूप से यादृच्छिक प्रभावों का उपयोग करने की आवश्यकता होती है, जब आप उन मापदंडों को शामिल करना चाहते हैं जो निश्चित प्रभाव के समूहीकरण स्तर पर अपरिवर्तनीय हैं।

उदाहरण के लिए, मान लें कि आप रोगी परिणामों पर डॉक्टर विशेषताओं (जैसे / शिक्षा) के प्रभाव की जांच करना चाहते हैं। डेटासेट रोगी-स्तर पर देखे गए रोगी परिणामों और रोगी / चिकित्सक विशेषताओं के साथ है। चूंकि एकल चिकित्सक के तहत इलाज किए जाने वाले रोगियों को सहसंबद्ध किया जाता है, आप इसके लिए नियंत्रण करना चाहते हैं। आप यहां डॉक्टर द्वारा निर्धारित प्रभाव डाल सकते हैं लेकिन ऐसा करने पर, आप मॉडल में डॉक्टर की किसी भी विशेषता को शामिल करते हैं। यदि समस्या डॉक्टर-स्तरीय विशेषताओं में है तो यह समस्याग्रस्त है।


क्या आप कुछ मॉडल स्टेटमेंट प्रदान कर सकते हैं?
जेम्स

0

मुझे लगता है कि यह अनुमानों की निरंतरता से संबंधित है।

एक्समैंj=मैं+j+मैं

j

नेमैन और स्कॉट (1948) की निरंतरता की समस्या बताते हैं

मैंj

मैंj

संगत। कम से कम, कि कैसे मैं समझ गया ...

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.