मिश्रित प्रभाव मॉडल निर्भरता का समाधान क्यों करते हैं?


14

कहो कि हम रुचि रखते हैं कि उन छात्रों द्वारा अध्ययन किए जाने वाले घंटों की संख्या से छात्र परीक्षा ग्रेड कैसे प्रभावित होते हैं। इस संबंध का पता लगाने के लिए, हम निम्नलिखित लीनियर रिग्रेशन को चला सकते हैं:

exam.gradesi=a+β1×hours.studiedi+ei

लेकिन अगर हम कई अलग-अलग स्कूलों में विद्यार्थियों का नमूना लेते हैं, तो हम अलग-अलग स्कूलों के विद्यार्थियों की तुलना में एक-दूसरे के समान स्कूल में विद्यार्थियों की अपेक्षा कर सकते हैं। इस निर्भरता के मुद्दे से निपटने के लिए, कई पाठ्यपुस्तकों / वेब पर सलाह, एक मिश्रित प्रभाव चलाने और एक यादृच्छिक प्रभाव के रूप में स्कूल में प्रवेश करने के लिए है। तो मॉडल बन जाएगा: लेकिन इस निर्भरता समस्या यह है कि रेखीय प्रतीपगमन में मौजूद था हल करता है?

exam.gradesi=a+β1×hours.studiedi+schoolj+ei

कृपया जवाब दें जैसे कि आप 12 वर्ष के व्यक्ति से बात कर रहे हैं


क्या यह निर्भरता समस्या को "विशिष्ट" हल करता है। लेकिन आप शायद यह देख सकते हैं कि अब विस्तारित मॉडल में एक शब्द है जो किसी विशेष स्कूल से संबंधित प्रभाव के लिए कम से कम आंशिक रूप से हो सकता है।
image_doctor 10

जवाबों:


23

मॉडल में यादृच्छिक शब्दों को शामिल करना ग्रेड के लिए कुछ सहसंयोजक संरचना को प्रेरित करने का एक तरीका है। स्कूल के लिए यादृच्छिक कारक एक ही स्कूल के विभिन्न छात्रों के बीच एक गैर शून्य कोवरियन को प्रेरित करता है, जबकि स्कूल अलग होने पर यह होता है।0

चलो अपने मॉडल लिखने जहां रों अनुक्रमित स्कूल और मैं अनुक्रमित छात्रों (प्रत्येक विद्यालय में)। शर्तों स्कूल रों स्वतंत्र यादृच्छिक एक में तैयार चर हैं एन ( 0 , τ )एस , मैं स्वतंत्र यादृच्छिक एक में तैयार चर हैं एन ( 0 , 2

Ys,i=α+hourss,iβ+schools+es,i
sischoolsN(0,τ)es,iN(0,σ2)

इस सदिश का मूल्य अपेक्षित है

[α+hourss,iβ]s,i
जो काम किया घंटे की संख्या से निर्धारित होता है।

के बीच सहप्रसरण और वाई एस ' , मैं ' है 0 जब रों रों 'Ys,iYs,i0ss , जिसका अर्थ है कि उम्मीद मूल्यों से ग्रेड के प्रस्थान स्वतंत्र जब छात्रों को एक ही स्कूल में नहीं हैं।

के बीच सहप्रसरण और वाई एस , मैं ' है τ जब मैं मैं ' , और का विचरण वाई एस , मैं है τ + σYs,iYs,iτiiYs,iτ+σ2 : एक ही स्कूल से छात्रों के ग्रेड उनकी उम्मीद मूल्यों से प्रस्थान सहसंबद्ध होगा ।

उदाहरण और सिम्युलेटेड डेटा

यहां पांच स्कूलों से पचास छात्रों के लिए एक छोटी अनुसंधान अनुकरण है (यहाँ मैं ले ); चर के नाम स्व दस्तावेज हैं: σ2=τ=1

set.seed(1)
school        <- rep(1:5, each=10)
school_effect <- rnorm(5)

school_effect_by_ind <- rep(school_effect, each=10)
individual_effect    <- rnorm(50)

हम प्रत्येक छात्र के लिए उम्मीद ग्रेड, है कि मामले से प्रस्थान साजिश , एक साथ (बिंदीदार रेखा) प्रत्येक स्कूल के लिए मतलब प्रस्थान के साथ:schools+es,i

plot(individual_effect + school_effect_by_ind, col=school, pch=19, 
     xlab="student", ylab="grades departure from expected value")
segments(seq(1,length=5,by=10), school_effect, seq(10,length=5,by=10), col=1:5, lty=3)

मिश्रित मॉडल

schoolsα+hoursβ

इस उदाहरण के लिए विचरण मैट्रिक्स

schoolses,i

[A00000A00000A00000A00000A]
10×10A
A=[2111111111121111111111211111111112111111111121111111111211111111112111111111121111111111211111111112].

1
Elvis: thats probably a great answer for people more versed in statistics than I. However I can extract little meaning from it. Could you edit your response in a way that a 12 year old might be able to understand?
luciano

1
A... 12 years old?! Wow! I will add some simulations, if this can help.
Elvis

5
Done. Hope this helps. If not, please be more specific about what you don’t get. Note that a 12 yo would not understand the question either... you can’t ask for an answer simpler than the question.
Elvis
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.