रैखिक प्रतिगमन में सामान्यता की धारणा


11

रैखिक प्रतिगमन की धारणा के रूप में, त्रुटि के वितरण की सामान्यता कभी-कभी गलत तरीके से "विस्तारित" होती है या इसे y या x की सामान्यता की आवश्यकता के रूप में व्याख्या की जाती है।

क्या ऐसा परिदृश्य / डेटासेट बनाना संभव है, जहां X और Y गैर-सामान्य हों, लेकिन त्रुटि शब्द है और इसलिए प्राप्त रेखीय प्रतिगमन अनुमान मान्य हैं?


5
तुच्छ उदाहरण: X का बर्नौली वितरण है (अर्थात, मान 0 या 1 ले रहा है); वाई = एक्स + एन (0, 0.1)। न तो X और न ही Y को आमतौर पर अपने आप वितरित किया जाता है, लेकिन X पर Y को पुनः प्राप्त करना अभी भी काम करता है।
हांग ऑय

मुझे लगता है कि आप अवशिष्टों के वितरण के बारे में सोच रहे हैं, न कि चरों के वितरण के बारे में।
tashuhka


जवाबों:


16

एक छवि के साथ हाँग ओइस टिप्पणी पर विस्तार। यहां एक डेटासेट की एक छवि है जहां कोई भी मार्जिन सामान्य रूप से वितरित नहीं किया गया है, लेकिन अवशेष अभी भी हैं, इस प्रकार रैखिक प्रतिगमन की धारणाएं अभी भी मान्य हैं:

यहाँ छवि विवरण दर्ज करें

छवि निम्नलिखित आर कोड द्वारा उत्पन्न की गई थी:

library(psych)
x <- rbinom(100, 1, 0.3)
y <- rnorm(length(x), 5 + x * 5, 1)

scatter.hist(x, y, correl=F, density=F, ellipse=F, xlab="x", ylab="y")
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.