इस प्रश्न का दृष्टिकोण करने का एक तरीका यह है कि हम इसे उल्टा देखें: हम सामान्य रूप से वितरित अवशेषों के साथ कैसे शुरू कर सकते हैं और उन्हें विषमलैंगिक होने की व्यवस्था कर सकते हैं? इस दृष्टि से उत्तर स्पष्ट हो जाता है: छोटे अवशिष्टों को छोटे अनुमानित मानों के साथ जोड़ दें।
स्पष्ट करने के लिए, यहाँ एक स्पष्ट निर्माण है।
बाईं ओर डेटा स्पष्ट रूप से रैखिक फिट (लाल रंग में दिखाया गया है) के सापेक्ष विषमलैंगिक है। यह दाईं ओर स्थित भूखंड बनाम पूर्वानुमानित भूखंड द्वारा घर से प्रेरित है । लेकिन - निर्माण के द्वारा - अवशिष्ट का अनियंत्रित सेट सामान्य रूप से वितरित करने के करीब है, क्योंकि मध्य शो में उनका हिस्टोग्राम। (सामान्यता के शापिरो-विल्क परीक्षण में पी-मान 0.60 है, जो नीचे दिए गए कोड को चलाने के बाद जारी किए गए R
कमांड के साथ प्राप्त किया गया है shapiro.test(residuals(fit))
)।
वास्तविक डेटा इस तरह भी दिख सकता है। नैतिकता यह है कि विषमलैंगिकता अवशिष्ट आकार और भविष्यवाणियों के बीच के संबंध को दर्शाती है जबकि सामान्यता हमें इस बारे में कुछ नहीं बताती है कि अवशिष्ट किसी अन्य चीज़ से कैसे संबंधित हैं।
यहाँ R
इस निर्माण के लिए कोड है।
set.seed(17)
n <- 256
x <- (1:n)/n # The set of x values
e <- rnorm(n, sd=1) # A set of *normally distributed* values
i <- order(runif(n, max=dnorm(e))) # Put the larger ones towards the end on average
y <- 1 + 5 * x + e[rev(i)] # Generate some y values plus "error" `e`.
fit <- lm(y ~ x) # Regress `y` against `x`.
par(mfrow=c(1,3)) # Set up the plots ...
plot(x,y, main="Data", cex=0.8)
abline(coef(fit), col="Red")
hist(residuals(fit), main="Residuals")
plot(predict(fit), residuals(fit), cex=0.8, main="Residuals vs. Predicted")
ncvTest
कार्य का उपयोग कर सकते हैं । Whuber के उदाहरण में, आदेश एक पैदावार पी -value कि लगभग शून्य है और निरंतर त्रुटि विचरण के खिलाफ पुख्ता सबूत (जो उम्मीद थी ज़ाहिर है,) प्रदान करता है।R
ncvTest(fit)