मिश्रित मॉडल में पैरामीटर आकलन के बारे में अंतर्ज्ञान (विचलन पैरामीटर बनाम सशर्त मोड)


15

मैंने कई बार पढ़ा है कि यादृच्छिक प्रभाव (BLUPs / सशर्त मोड के लिए, कहते हैं, विषयों) एक रैखिक मिश्रित प्रभाव मॉडल के पैरामीटर नहीं हैं, लेकिन इसके बजाय अनुमानित विचरण / सहसंयोजक मापदंडों से प्राप्त किया जा सकता है। जैसे रेनहोल्ड क्लीगल एट अल। (2011) राज्य:

रैंडम इफेक्ट्स विषय 'विचलन से भव्य मतलब आरटी और विषयों के विचलन तय-प्रभाव मापदंडों से हैं। उन्हें स्वतंत्र रूप से माना जाता है और सामान्य रूप से 0. के माध्यम से वितरित किया जाता है। यह पहचानना महत्वपूर्ण है कि ये यादृच्छिक प्रभाव एलएमएम के पैरामीटर नहीं हैं - केवल उनके संस्करण और सहसंयोजक हैं। [...] विषयों के डेटा के संयोजन में LMM पैरामीटर का उपयोग प्रत्येक विषय के लिए यादृच्छिक प्रभावों के "पूर्वानुमान" (सशर्त मोड) उत्पन्न करने के लिए किया जा सकता है।

क्या कोई सहज स्पष्टीकरण दे सकता है कि यादृच्छिक प्रभावों के बिना (सह) विचरण मापदंडों का अनुमान कैसे लगाया जा सकता है?

जवाबों:


6

एक साधारण रैखिक मिश्रित मॉडल पर विचार करें, उदाहरण के लिए एक यादृच्छिक अवरोधन मॉडल जहां हम विभिन्न विषयों में x पर की निर्भरता का अनुमान लगाते हैं, और यह मानते हैं कि प्रत्येक विषय का अपना यादृच्छिक अवरोधन है: y = a + b x + c i + ϵ यहाँ अवरोध मैं एक गाऊसी वितरण से आते हुए मॉडलिंग कर रहे हैं मैं ~ एन ( 0 , τ 2 ) यादृच्छिक शोर भी गाऊसी और ε ~ एन ( 0 , σ 2yx

y=a+bx+ci+ϵ.
ci
ciN(0,τ2)
मेंवाक्य रचना इस मॉडल के रूप में लिखा जाएगा।
ϵN(0,σ2).
lme4y ~ x + (1|subject)

यह उपरोक्तानुसार फिर से लिखना शिक्षाप्रद है:

ycN(a+bx+c,σ2)cN(0,τ2)

यह एक ही संभावित मॉडल को निर्दिष्ट करने का एक अधिक औपचारिक तरीका है। इस सूत्रीकरण से हम प्रत्यक्ष रूप से देख सकते हैं कि यादृच्छिक प्रभाव "पैरामीटर" नहीं हैं: वे बिना किसी क्रम के यादृच्छिक चर हैं। तो हम c के मूल्यों को जाने बिना कैसे भिन्नता मापदंडों का अनुमान लगा सकते हैं ?cic

yccycyc

N(a+bx,σ2+τ2)ny

yN(a+bx,Σ)
Σ=σ2In+τ2IN1Mσ2τ2cci

abτ2σ2cii


1
y~एन(+एक्स,σ2मैं)
y~एन(+एक्स,Σ)
सेक्सटस एम्पिरिकस

ccसी

मुझे लगता है कि मुझे अभी एकीकरण कदम नहीं मिला है। जैसा कि @Martijn Weterings ने थोड़ा (R कोड) उदाहरण या संदर्भ दिया है कि कोई भी यह पा सकता है कि यह बहुत अच्छा होगा!
स्टेटमेकर

मेरे उत्तर को स्वीकार करने और मुझे इनाम @statmerkur देने के लिए धन्यवाद, लेकिन यह बहुत बुरा है कि यह अस्पष्ट है। मैं एक उदाहरण के बारे में सोचने की कोशिश करूंगा। जब मैं उत्तर को अपडेट करूंगा तो मैं आपको पिंग करूंगा।
अमीबा का कहना है कि मोनिका

@statmerkur इस प्रश्न के उत्तर में मैं एक मिश्रित प्रभाव मॉडल (मैन्युअल रूप से संभावना फ़ंक्शन को लिखने के अर्थ में मैनुअल गणना, आर में एक मानक अनुकूलन फ़ंक्शन द्वारा किया जाता है) आँकड़े.stackexchange.com/a/ प्रदर्शित करता है 337348/164061
सेक्सटस एम्पिरिकस

0

आप निश्चित प्रभावों का उपयोग करके यादृच्छिक-प्रभावों पर भरोसा किए बिना आसानी से विचरण और सहसंयोजी मापदंडों का अनुमान लगा सकते हैं ( एक चर्चा तय-प्रभाव बनाम यादृच्छिक-प्रभावों के लिए यहां देखें ; इस तथ्य से अवगत रहें कि इन शर्तों की अलग-अलग परिभाषाएं हैं)।

फिक्स्ड प्रभाव आसानी से प्रत्येक समूह के लिए एक (बाइनरी) सूचक चर जोड़कर प्राप्त किया जा सकता है (या प्रत्येक समयावधि या जो भी आप यादृच्छिक प्रभाव के रूप में उपयोग करने के लिए सोच रहे हैं, यह है बराबर परिवर्तन के भीतर करने के लिए)। यह आपको आसानी से तय-प्रभाव (जो एक पैरामीटर के रूप में देखा जा सकता है) का अनुमान लगाने की अनुमति देता है।

फिक्स्ड-इफेक्ट धारणा को आपको निश्चित-प्रभावों के वितरण की धारणा बनाने की आवश्यकता नहीं है, आप आसानी से निश्चित-प्रभावों के विचरण का अनुमान लगा सकते हैं (हालांकि यह अत्यंत शोर अगर प्रत्येक समूह के भीतर अवलोकन की संख्या छोटी है, तो वे न्यूनतम हैं; यादृच्छिक-प्रभावों की तुलना में बहुत बड़े विचरण की कीमत के लिए पूर्वाग्रह क्योंकि आप इन संकेतक चर को जोड़ने के माध्यम से प्रत्येक समूह के लिए स्वतंत्रता की एक डिग्री खो देते हैं)। आप निश्चित-प्रभावों के विभिन्न सेटों के बीच, या निश्चित-प्रभावों और अन्य सहसंयोजकों के बीच सहसंयोजकों का अनुमान लगा सकते हैं। हमने ऐसा किया है कि उदाहरण के लिए जर्मन बुंडेसलिगा में प्रतिस्पर्धात्मक संतुलन और वर्गीकरण मिलान नामक एक पेपर में यह अनुमान लगाने के लिए कि क्या बेहतर फुटबॉल खिलाड़ी बेहतर टीमों के लिए खेलते हैं।

यादृच्छिक-प्रभावों को सहसंयोजक के बारे में एक पूर्व धारणा की आवश्यकता होती है। शास्त्रीय यादृच्छिक-प्रभाव वाले मॉडल में, आप मानते हैं कि यादृच्छिक-प्रभाव एक त्रुटि की तरह हैं और वे अन्य सहसंयोजकों से स्वतंत्र हैं (ताकि आप उन्हें अनदेखा कर सकें और ओएलएस का उपयोग कर सकें और मान्यताओं के लिए अन्य पैरामीटर के लिए अभी भी लगातार अप्रभावी अनुमान प्राप्त कर सकें। यादृच्छिक प्रभाव मॉडल सच पकड़)।

आगे और अधिक तकनीकी जानकारी यहाँ उपलब्ध है । एंड्रयू जेलमैन ने अपनी अच्छी पुस्तक डेटा विश्लेषण में इस बारे में बहुत अधिक सहज ज्ञान युक्त काम किया है, प्रतिगमन और बहुस्तरीय / पदानुक्रमित मॉडल का उपयोग करके डेटा विश्लेषण


1
मैं यादृच्छिक प्रभावों के (सह) विचरण मापदंडों (मेरे संपादन देखें) का उल्लेख कर रहा हूं।
स्टेटमर ठाकुर २ stat ’

2
मुझे नहीं लगता कि यह सवाल का जवाब देता है।
अमीबा का कहना है कि मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.