चलो प्रतिक्रिया और भविष्यवक्ता छात्र का वेक्टर दिखाता है (क्रमशः) मैं स्कूल में जे ।yij,xijij
(1) बाइनरी डेटा के लिए, मुझे लगता है कि निरंतर डेटा के लिए किए गए उन लोगों के अनुरूप विचरण decompositions करने के लिए मानक तरीका है जो लेखक आपके लिंक में विधि डी (नीचे अन्य तरीकों पर टिप्पणी करेंगे) को द्विआधारी डेटा के रूप में कल्पना करते हैं। एक अंतर्निहित निरंतर चर से उत्पन्न होता है जो एक रैखिक मॉडल द्वारा शासित होता है और उस अव्यक्त पैमाने पर विचरण को विघटित करता है। कारण यह है कि लॉजिस्टिक मॉडल (और अन्य GLM) स्वाभाविक रूप से इस तरह से पैदा होते हैं -
इस देखने के लिए, को परिभाषित ऐसी है कि वह एक रेखीय मिश्रित मॉडल के आधार पर नियंत्रित होता है:y⋆ij
y⋆ij=α+xijβ+ηj+εij
जहां प्रतिगमन गुणांक कर रहे हैं, η j ~ एन ( 0 , σ 2 ) स्कूल स्तर यादृच्छिक प्रभाव है और ε मैं j अवशिष्ट विचरण शब्द है और एक मानक है रसद वितरण । अब छोडोα,βηj∼N(0,σ2)εij
yij=⎧⎩⎨⎪⎪10if y⋆ij≥0if y⋆ij<0
चलो अब, बस रसद CDF हमारे पास का उपयोग करpij=P(yij=1|xij,ηj)
pij=1−P(y⋆ij<0|xij,ηj)=exp{−(α+xijβ+ηj)}1+exp{−(α+xijβ+ηj)}
अब दोनों पक्षों के लॉगिट परिवर्तन को लेते हुए , आपके पास है
log(pij1−pij)=α+xijβ+ηj
जो वास्तव में लॉजिस्टिक मिश्रित प्रभाव मॉडल है। तो, लॉजिस्टिक मॉडल ऊपर निर्दिष्ट अव्यक्त चर मॉडल के बराबर है। एक महत्वपूर्ण नोट:
- पैमाने की पहचान तब से नहीं की जाती है, यदि आप इसे नीचे पैमाने पर रखना चाहते हैं, लेकिन एक स्थिर s , तो यह बस उपरोक्त को बदल देगा।εijs
exp{−(α+xijβ+ηj)/s}1+exp{−(α+xijβ+ηj)/s}
इसलिए गुणांक और यादृच्छिक प्रभाव बस इसी राशि द्वारा बढ़ाया जाएगा । तो, रों = 1 प्रयोग किया जाता है, जिसका मतलब वी एक आर ( ε मैं जे ) = π 2 / 3 ।
s=1var(εij)=π2/3
अब, यदि आप इस मॉडल और फिर मात्रा का उपयोग करते हैं
σ^2ησ^2η+π2/3
अंतर्निहित अव्यक्त चरों के अंतःसंबंध सहसंबंध का अनुमान लगाता है । एक और महत्वपूर्ण नोट:
- यदि के रूप में निर्दिष्ट किया जाता है, बजाय, एक मानक सामान्य वितरण होने, तो आप मिश्रित प्रभाव है मॉडल PROBIT । उस मामले में σ 2 ηεijका अनुमान हैtetrachoric सहसंबंधएक ही स्कूल है, जो पियर्सन (करीब 1900 मुझे लगता है कि) द्वारा दिखाया गया में दो बेतरतीब ढंग से चुने विद्यार्थियों के बीच सांख्यिकीय पहचान होने की जब अंतर्निहित निरंतर डेटा सामान्य रूप से वितरित किया गया था (यह काम वास्तव में इन सहसंबंध दिखाया द्विआधारी मामले से परे कई श्रेणी के मामले में पहचाने गए, जहां इन सहसंबंधों कोपॉलीकोरिक सहसंबंधकहा जाताहै)। इस कारण से, यह एक संभावित मॉडल का उपयोग करने के लिए बेहतर हो सकता है (और मेरी सिफारिश होगी) जब बाइनरी डेटा के इंट्राक्लास सहसंबंध का अनुमान लगाने में प्राथमिक रुचि (टेट्राकोरिक) है।
σ^2ησ^2η+1
आपके द्वारा लिंक किए गए कागज में उल्लिखित अन्य विधियों के बारे में:
xij
(बी) सिमुलेशन पद्धति सहज रूप से एक सांख्यिकीविद से अपील कर रही है क्योंकि यह आपको डेटा के मूल पैमाने पर अनुमानित विघटन अपघटन देगा, लेकिन दर्शकों के आधार पर, आपके "तरीकों" में इसका वर्णन करना जटिल हो सकता है। अनुभाग और (ii) एक समीक्षक को बंद कर सकता है जो कुछ "अधिक मानक" की तलाश में था
(सी) डेटा को रोकना निरंतर है, शायद यह एक महान विचार नहीं है, हालांकि यह बहुत अच्छा प्रदर्शन नहीं करेगा यदि अधिकांश संभावनाएं 0 या 1 के करीब नहीं हैं। लेकिन, ऐसा करने से लगभग निश्चित रूप से एक समीक्षक को लाल झंडा उठाना पड़ेगा। इसलिए मैं दूर रहूंगा।
अब आखिरकार,
(2) यदि निर्धारित प्रभाव वर्षों में बहुत भिन्न होते हैं, तो आपको यह सोचना सही होगा कि सालों भर यादृच्छिक प्रभाव भिन्नताओं की तुलना करना मुश्किल हो सकता है, क्योंकि वे संभावित रूप से विभिन्न पैमानों पर होते हैं (यह गैर-पहचान से संबंधित है ऊपर उल्लिखित स्केलिंग समस्या)।
Ik=1k
α+xijβ+η1jI1+η2jI2+η3jI3+η4jI4+η5jI5+η6jI6
यह आपको हर साल एक अलग ICC देगा लेकिन समान निश्चित प्रभाव। यह समय में एक यादृच्छिक ढलान का उपयोग करने के लिए आकर्षक हो सकता है, जिससे आपके रैखिक भविष्यवक्ता बन सकते हैं
α+xijβ+η1+η2t
लेकिन मैं इसकी अनुशंसा नहीं करता, क्योंकि यह केवल आपके संघों को समय के साथ बढ़ने की अनुमति देगा , कमी नहीं ।