अवशिष्ट मानक त्रुटि क्या है?


35

आर में एक बहु प्रतिगमन मॉडल चलाते समय, आउटपुट में से एक स्वतंत्रता के 95,161 डिग्री पर 0.0589 का एक अवशिष्ट मानक त्रुटि है। मुझे पता है कि मेरे मॉडल में टिप्पणियों की संख्या और मेरे मॉडल में चर की संख्या के बीच अंतर से 95,161 डिग्री दी गई है। अवशिष्ट मानक त्रुटि क्या है?


2
यह प्रश्न और इसके उत्तर मदद कर सकते हैं: हम अवशिष्ट मानक त्रुटि क्यों कहते हैं?
एंटोनी वर्नेट

एक त्वरित प्रश्न: क्या "अवशिष्ट मानक त्रुटि" "अवशिष्ट मानक विचलन" के समान है? जेलमैन और हिल (पृ। 41, 2007) उनका परस्पर उपयोग करते प्रतीत होते हैं।
जेटलाग

जवाबों:


26

एक फिट प्रतिगमन मॉडल बिंदु अनुमान भविष्यवाणियों को उत्पन्न करने के लिए मापदंडों का उपयोग करता है जो मनाया प्रतिक्रियाओं के साधन हैं यदि आप उसी मानों के साथ अध्ययन को अनंत बार मानने के लिए थे (और जब रैखिक मॉडल सत्य होता है)। इन अनुमानित मूल्यों और मॉडल को फिट करने के लिए उपयोग किए जाने वाले लोगों के बीच के अंतर को "अवशिष्ट" कहा जाता है, जो डेटा संग्रह प्रक्रिया की नकल करते समय, 0 के साथ यादृच्छिक चर के गुण होते हैं।X

इसके बाद देखे गए अवशेषों का उपयोग इन मूल्यों में परिवर्तनशीलता का अनुमान लगाने और मापदंडों के नमूना वितरण का अनुमान लगाने के लिए किया जाता है। जब अवशिष्ट मानक त्रुटि ठीक 0 होती है तो मॉडल पूरी तरह से डेटा को फिट करता है (ओवरफिटिंग के कारण होने वाली संभावना)। यदि अवशिष्ट मानक त्रुटि को बिना किसी प्रतिक्रिया के परिवर्तनशीलता से महत्वपूर्ण रूप से भिन्न नहीं दिखाया जा सकता है, तो यह बताने के लिए बहुत कम सबूत हैं कि रैखिक मॉडल में कोई पूर्वानुमानित क्षमता है।


3
इसका उत्तर शायद पहले भी दिया गया हो। देखें कि क्या यह प्रश्न आपके लिए आवश्यक उत्तर प्रदान करता है। [आर के एलएम की व्याख्या () आउटपुट] [१] [१]: सांख्यिकी.स्टैकएक्सचेंज.com
questions

26

कहें कि हमारे पास निम्नलिखित एनोवा तालिका है (आर के example(aov)आदेश से अनुकूलित ):

          Df Sum Sq Mean Sq F value Pr(>F)
Model      1   37.0   37.00   0.483  0.525
Residuals  4  306.3   76.57               

यदि आप अपनी स्वतंत्रता की संबंधित डिग्री द्वारा भिन्नता के किसी भी स्रोत (मॉडल या अवशेष) से ​​वर्गों के योग को विभाजित करते हैं, तो आपको औसत वर्ग मिलता है। विशेष रूप से अवशिष्टों के लिए:

306.34=76.57576.57

तो 76.57 आपके प्रतिक्रिया चर पर अवशिष्ट (यानी मॉडल को लागू करने के बाद) भिन्नता के अवशेषों का औसत वर्ग है।

76.57


1
I up-voted the answer from @AdamO because as a person who uses regression directly most often, that answer was the most straightforward for me. However, I appreciate this answer as it illustrates the notational/conceptual/methodological relationship between ANOVA and linear regression.
svannoy

12

Typically you will have a regression model looks like this:

Y=β0+β1X+ϵ
where ϵ is an error term independent of X.

If β0 and β1 are known, we still cannot perfectly predict Y using X due to ϵ. Therefore, we use RSE as a judgement value of the Standard Deviation of ϵ.

RSE is explained pretty much clearly in "Introduction to Statistical Learning".


2
This should be the accepted answer. RSE is s just an estimate of the Standard Deviation of ϵ, i.e. the residual. It's also known as the residual standard deviation (RSD), and it can be defined as RSE=RSS(n2) (e.g. see ISL page 66).
Amelio Vazquez-Reina

1
For anyone reading the epub of ISL, you can locate "page 66" with ctrl-f "residual standard error." (Epub files do not have true page numbers).
user2426679
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.