मानक विचलन त्रुटि (RMSE) बनाम मानक विचलन कैसे करें?


21

मान लीजिए कि मेरे पास एक मॉडल है जो मुझे अनुमानित मूल्य देता है। मैं उन मूल्यों के आरएमएसई की गणना करता हूं। और फिर वास्तविक मूल्यों का मानक विचलन।

क्या उन दो मूल्यों (संस्करण) की तुलना करने का कोई मतलब है? मुझे क्या लगता है, अगर आरएमएसई और मानक विचलन समान / समान है तो मेरे मॉडल की त्रुटि / विचरण समान है जो वास्तव में चल रहा है। लेकिन अगर उन मूल्यों की तुलना करने का कोई मतलब नहीं है, तो यह निष्कर्ष गलत हो सकता है। यदि मेरा विचार सच है, तो क्या इसका मतलब यह है कि मॉडल उतना ही अच्छा है क्योंकि यह हो सकता है क्योंकि यह विशेषता नहीं कर सकता कि विचरण का कारण क्या है? मुझे लगता है कि अंतिम भाग शायद गलत है या कम से कम जवाब देने के लिए अधिक जानकारी की आवश्यकता है।

जवाबों:


22

मान लीजिए कि हमारे प्रतिक्रियाओं हैं चलो और हमारी भविष्यवाणी मान हैं y 1 , ... , y एनy1,...,yny^1,...,y^n

नमूना विचरण ( सरलता के लिए n - 1 के बजाय का उपयोग करके ) 1 हैnn-1, जबकि एमएसई है11nΣमैं=1n(yमैं-y¯)2। इस प्रकार नमूना विचलन देता है कि प्रतिक्रियाएँ माध्य के चारों ओर कितनी भिन्न होती हैं जबकि MSE यह बताता है कि प्रतिक्रियाएँ हमारे पूर्वानुमानों के आसपास कितनी भिन्न होती हैं। अगर हम समग्र माध्य ˉ y के बारे में सोचते हैं जोसबसे सरल भविष्यवक्ता होने के नाते है, तो हम कभी भी विचार करेंगे, तो MSE की तुलना प्रतिक्रियाओं के नमूना प्रसरण से हम देख सकते हैं कि हमने अपने मॉडल के साथ कितनी अधिक भिन्नता बताई है। यह वही है जोरैखिक प्रतिगमन मेंआर2मूल्य करता है।1nΣमैं=1n(yमैं-y^मैं)2y¯आर2

निम्न चित्र पर विचार करें: का नमूना प्रसरण क्षैतिज रेखा के आसपास परिवर्तनशीलता है। यदि हम Y अक्ष पर सभी डेटा को प्रोजेक्ट करते हैं तो हम इसे देख सकते हैं। एमएसई प्रतिगमन लाइन के लिए मतलब वर्ग दूरी, यानी प्रतिगमन रेखा के आसपास परिवर्तनशीलता (यानी है y मैं )। तो नमूना विचरण द्वारा मापी गई परिवर्तनशीलता क्षैतिज रेखा के लिए औसत चुकता दूरी है, जिसे हम देख सकते हैं कि प्रतिगमन रेखा के औसत वर्ग दूरी की तुलना में काफी अधिक है। yमैंYy^मैंयहां छवि विवरण दर्ज करें


5

Σमैं(yमैं-y^मैं)2n-पी,

Σमैं(yमैं-y¯)2n-1,
y¯yमैं

y^मैं=y¯y¯

y^मैं

Σमैं(yमैं-y^मैं)2n,

जो गणना करने के लिए सबसे आसान है।


मुझे @Chaconne के उत्तर पर टिप्पणी करने का कोई विशेषाधिकार नहीं है, लेकिन मुझे संदेह है कि अगर उनके अंतिम कथन में एक टाइपो है, जहां वे कहते हैं: "तो नमूना विचरण द्वारा मापी गई परिवर्तनशीलता क्षैतिज रेखा के लिए औसत चुकता दूरी है, जिसे हम यह देखने के लिए कि लाइन की औसत वर्ग दूरी से काफी कम है "। लेकिन उनके जवाब में आंकड़ा में, लाइन के साथ y मानों की भविष्यवाणी बहुत सटीक है, जिसका अर्थ है कि MSE छोटा है, एक औसत मूल्य के साथ "भविष्यवाणी" की तुलना में कम से कम बेहतर है।
जिओ-फेंग ली

3

1nΣमैं=1n(yमैं-y¯)2

1nΣमैं=1n(yमैं-y^मैं)2

यह तर्क त्रुटि के अन्य उपायों पर लागू होता है, न केवल आरएमएसई के लिए, बल्कि आरएमएसई एसडी के लिए सीधी तुलना के लिए विशेष रूप से आकर्षक है क्योंकि उनके गणितीय सूत्र अनुरूप हैं।


यह सबसे अच्छा जवाब है क्योंकि यह बताता है कि मतभेदों का वर्णन करने के बजाय तुलना कैसे उपयोगी हो सकती है।
हंस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.