वाम तिरछा बनाम सममित वितरण मनाया गया


10

यह मेरे लिए वर्णन करने के लिए बहुत कठिन है, लेकिन मैं अपनी समस्या को समझने का प्रयास करूँगा। तो सबसे पहले आपको यह जानना होगा कि मैंने अब तक एक बहुत ही सरल रैखिक प्रतिगमन किया है। इससे पहले कि मैं गुणांक का अनुमान लगाता, मैंने अपने के वितरण को देखा । यह भारी बचा हुआ तिरछा है। मॉडल का अनुमान लगाने के बाद, मुझे QQ- प्लॉट में एक बाएं तिरछी अवशिष्ट का स्वागत के रूप में निरीक्षण करना काफी निश्चित था, लेकिन मैंने बिल्कुल नहीं किया। इस समाधान का कारण क्या हो सकता है? कहां चूक हुई? या वितरण है कुछ भी नहीं त्रुटि अवधि के वितरण के साथ क्या करना?yy


@Aniko आपके पिछले प्रश्न के जवाब में एक अच्छा जवाब देता है ।
whuber

जवाबों:


22

अपने प्रश्न का उत्तर देने के लिए, आइए एक बहुत ही सरल उदाहरण लेते हैं। सरल प्रतिगमन मॉडल द्वारा दिया गया है , जहां । अब मान लीजिए कि है। यदि शून्य के बराबर नहीं है, तो का वितरण सामान्य नहीं होगा, लेकिन वास्तव में दो सामान्य वितरणों का मिश्रण होता है, जिनमें से एक का मतलब और एक का मतलब ।yi=β0+β1xi+ϵiϵiN(0,σ2)xiβ1yiβ0β0+β1

यदि काफी बड़ा है और काफी छोटा है, तो हिस्टोग्राम देगा। हालांकि, कोई भी हिस्टोग्राम प्राप्त कर सकता है जो "एकल" तिरछा वितरण जैसा दिखता है। यहाँ एक उदाहरण है (R का उपयोग करके):β1σ2yiyi

xi <- rbinom(10000, 1, .2)
yi <- 0 + 3 * xi + rnorm(10000, .7)
hist(yi, breaks=20)
qqnorm(yi); qqline(yi)

यह का वितरण नहीं है जो मायने रखता है - लेकिन त्रुटि शब्दों का वितरण।yi

res <- lm(yi ~ xi)
hist(resid(res), breaks=20)
qqnorm(resid(res)); qqline(resid(res))

और यह पूरी तरह से सामान्य लग रहा है - न केवल आलंकारिक रूप से बोल =)


"लेकिन त्रुटि शब्दों का वितरण" आपका मतलब है कि अवशेषों में त्रुटि शब्द नहीं हैं, है ना? अवशिष्ट बनाम त्रुटि के बारे में अधिक जानकारी: आंकड़े.stackexchange.com/questions/133389/…
vasili111

7

@Wolfgang से उत्कृष्ट उत्तर के संदर्भ में, यहां उनके आर कोड से भूखंड हैं:

यहाँ छवि विवरण दर्ज करें

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.