निरपेक्ष त्रुटि या रूट मतलब चुकता त्रुटि?


58

मीन एब्सोल्यूट एरर (MAE) के बजाय रूट मीन स्क्वायर्ड एरर (RMSE) का उपयोग क्यों करें ??

नमस्ते

मैं एक गणना में उत्पन्न त्रुटि की जाँच कर रहा हूँ - मैंने शुरू में इस त्रुटि की गणना रूट रूट सामान्यीकृत चुकता त्रुटि के रूप में की थी।

थोड़ा करीब से देखने पर, मुझे लगता है कि त्रुटि को चुकाने का प्रभाव छोटे लोगों की तुलना में बड़ी त्रुटियों के लिए अधिक वजन देता है, विषम अनुमान की ओर त्रुटि अनुमान को कम कर देता है। रेट्रोस्पेक्ट में यह काफी स्पष्ट है।

तो मेरा सवाल है - रूट एग्जॉस्ट एरर में मीन एब्सोल्यूट एरर की तुलना में त्रुटि का अधिक उपयुक्त माप क्या होगा? उत्तरार्द्ध मेरे लिए अधिक उपयुक्त लगता है या मुझे कुछ याद आ रहा है?

इसे समझने के लिए मैंने नीचे एक उदाहरण संलग्न किया है:

  • तितर बितर साजिश एक अच्छा सहसंबंध के साथ दो चर दिखाता है,

  • दो चार्ट हिस्टोग्राम के लिए सामान्यीकृत RMSE (टॉप) और MAE (बॉटम) का उपयोग करते हुए Y (देखे गए) और Y (पूर्वानुमानित) के बीच की त्रुटि है।

यहाँ छवि विवरण दर्ज करें

इस डेटा में कोई महत्वपूर्ण आउटलेयर नहीं हैं और MAE RMSE की तुलना में कम त्रुटि देता है। क्या एमएई के अलावा कोई तर्कसंगत है, जो अन्य पर त्रुटि के एक उपाय का उपयोग करने के लिए बेहतर है?


9
क्योंकि आरएमएसई और एमएई त्रुटि के दो अलग-अलग उपाय हैं, उनके बीच एक संख्यात्मक तुलना (जो इस बात को शामिल करने में शामिल है कि एमएई आरएमएसई की तुलना में "कम" है) सार्थक नहीं लगता है। वह मानदंड कुछ कसौटी के अनुसार फिट होना चाहिए: वह मानदंड, जो भी हो, त्रुटि का प्रासंगिक माप होना चाहिए।
whuber

लाइन को कम से कम वर्गों का उपयोग करके फिट किया गया था - लेकिन मापी गई त्रुटि में अंतर दिखाने के लिए तस्वीर सिर्फ एक उदाहरण है। मेरा वास्तविक मुद्दा न्यूनतम त्रुटि, MAE या RMSE के कुछ माप के लिए चार फ़ंक्शन मापदंडों के समाधान के लिए एक अनुकूलक का उपयोग करने में है।
user1665220

स्पष्टीकरण के लिए धन्यवाद। लेकिन क्या त्रुटि आप में रुचि रखते हैं, ठीक है? फिट में त्रुटि या पैरामीटर में त्रुटियों का अनुमान है ?
whuber

1
फिट में त्रुटि। मेरे पास कुछ लैब नमूने हैं जो वाई देते हैं, जिसे मैं एक फ़ंक्शन का उपयोग करके भविष्यवाणी करना चाहता हूं। मैं मनाया और अनुमानित डेटा के बीच फिट के लिए त्रुटि को कम करके 4 घातांक के लिए फ़ंक्शन का अनुकूलन करता हूं।
user1665220

RMSE में हम मदों की संख्या (n) की जड़ मानते हैं। N की जड़ से विभाजित MSE की जड़ है। MSE की जड़ ठीक है, लेकिन n द्वारा विभाजित करने के बजाय RMSE को प्राप्त करने के लिए इसे n की जड़ से विभाजित किया गया है। मुझे लग रहा है कि यह एक नीति होगी। वास्तविकता होगी (रूट ऑफ़ एमएसई) / एन। इस तरह से एमएई बेहतर है।

जवाबों:


57

यह आपके नुकसान फ़ंक्शन पर निर्भर करता है। कई परिस्थितियों में यह मतलब से दूर बिंदुओं को और अधिक वजन देने के लिए समझ में आता है - अर्थात, 10 से बंद होना 5. के रूप में बंद होने से दोगुना से भी अधिक बुरा है। ऐसे मामलों में आरएमएसई त्रुटि का एक अधिक उपयुक्त उपाय है।

यदि दस से बंद किया जा रहा है तो 5 से बंद होने के रूप में केवल दो बार खराब है, तो एमएई अधिक उपयुक्त है।

किसी भी स्थिति में, यह RMSE और MAE की एक दूसरे से तुलना करने का कोई मतलब नहीं है जैसा कि आप अपने दूसरे-से-अंतिम वाक्य में करते हैं ("MAE RMSE की तुलना में कम त्रुटि देता है")। जिस तरह से उनकी गणना की जाती है, उससे एमएई कभी भी आरएमएसई से अधिक नहीं होगा। वे केवल त्रुटि के एक ही उपाय की तुलना में समझ में आते हैं: आप विधि 2 के लिए RMSE से विधि 1 के लिए RMSE से, या विधि 2 के लिए विधि 1 से MAE के लिए MAE के लिए तुलना कर सकते हैं, लेकिन आप यह नहीं कह सकते कि MAE, RMSE से विधि के लिए बेहतर है 1 क्योंकि यह छोटा है।


मैं समझता हूं कि एमएई कभी भी आरएमएसई से अधिक नहीं होगा। मैं दोनों त्रुटि अनुमानों का उपयोग कर रहा हूं और आउटलेर्स के प्रभाव के रूप में संकेत देने के लिए मूल्यों के बीच के अंतर को देख रहा हूं। यानी जब वे करीब-करीब महान हो जाते हैं, जब वे अलग हो जाते हैं तो मैं देखता हूं कि क्या चल रहा है। अंतत: मैं उन मापदंडों की भविष्यवाणी करना चाहता हूं जो डेटा को सबसे अच्छा सूट करते हैं, और उदाहरण के लिए 12% से बेहतर 9% त्रुटि ध्वनि - मैं सिर्फ यह सुनिश्चित करना चाहता था कि मैं सही कारण के लिए सही उठा रहा हूं। आपकी सलाह के लिए चीयर्स
user1665220

RMSE (फलस्वरूप MSE) और MAE के बीच मुख्य अंतर यह नहीं है कि वे त्रुटियों को कैसे करते हैं। यदि आवश्यक हो तो आप एक वजन समारोह का उपयोग कर सकते हैं। मुख्य अंतर यह है कि एमएसई एल 2 स्पेस से संबंधित है (एमएई के पास ऐसी कोई चीज नहीं है)। उदाहरण के लिए, MSE एक बंद लूप नियंत्रण के लिए आवश्यक ऊर्जा की मात्रा को माप सकता है जब E प्रतिक्रिया संकेत है (एक संकेत का याद रखें मतलब स्क्वायर, इस मामले में त्रुटि, यह ऊर्जा का आनुपातिक है)। इसके अलावा गणित और परिणामस्वरूप एल्गोरिथ्म जैसे Marquardt-Levenberg इस स्थान में काम करता है। सीधे शब्दों में कहें, वे एमएसई को अपने उद्देश्य समारोह के रूप में उपयोग करते हैं।
eulerleibniz

17

यहां एक और स्थिति है जब आप एमएई के बजाय (आर) एमएसई का उपयोग करना चाहते हैं: जब आपकी टिप्पणियों का सशर्त वितरण असममित होता है और आप एक निष्पक्ष फिट चाहते हैं। (आर) एमएसई सशर्त द्वारा कम से कम है मतलब सशर्त द्वारा, MAE मंझला । इसलिए यदि आप एमएई को कम से कम करते हैं, तो फिट मंझला और पक्षपाती होगा।

बेशक, यह सब वास्तव में आपके नुकसान फ़ंक्शन पर निर्भर करता है।

यदि आप पूर्वानुमान या पूर्वानुमान का मूल्यांकन करने के लिए MAE या (R) MSE का उपयोग कर रहे हैं तो वही समस्या होती है । उदाहरण के लिए, कम मात्रा में बिक्री डेटा में आमतौर पर एक असममित वितरण होता है। यदि आप MAE का अनुकूलन करते हैं, तो आपको यह जानकर आश्चर्य हो सकता है कि MAE- इष्टतम पूर्वानुमान एक सपाट शून्य पूर्वानुमान है।

यहाँ इसे कवर करने के लिए एक छोटी सी प्रस्तुति दी गई है , और यहाँ M4 पूर्वानुमान प्रतियोगिता पर हाल ही में आमंत्रित टिप्पणी है जहाँ मैंने इस आशय की व्याख्या की है


+1। वितरणों की तुलना करने का विचार बहुत अच्छा है, लेकिन ... एक मीट्रिक ऐसा नहीं होगा, जिसे आप प्रस्तुत करते हैं जैसे कुछ में बुरी तरह विफल N = 1e3; set.seed(1); y = rpois(N, lambda=1); yhat = c(y[2:N],0)? भविष्य कहनेवाला घनत्व "अंतर" न्यूनतम होगा लेकिन वास्तविक yhatबेकार होगा। दी, यह एक चरम मामला है। (मुझे कुछ स्पष्ट याद आ रहा है, इसके लिए क्षमा याचना - अग्रिम में मेरे पास केवल प्रस्तुति तक कागज नहीं है।)
us2r11852

@ us @r11852: हाँ, आपके पूर्वानुमान का क्रम बेकार होगा, और विशेष रूप से, एक सपाट पूर्वानुमान से अधिक खराब होता है (जो माध्य और माध्यिका दोनों है, इसलिए यह MAE और MSE दोनों के लिए इष्टतम है) । घनत्व पूर्वानुमान केवल बिंदु पूर्वानुमान का अनुक्रम नहीं है! यह प्रत्येक भावी समय बिंदु के लिए एक पूर्ण घनत्व भविष्यवाणी है । इसलिए हम पहली बार बिंदु के लिए एक पॉइस (1) की भविष्यवाणी करेंगे, दूसरे के लिए, तीसरे के लिए आदिy^=1
एस। कोलासा - बहाल मोनिका

स्पष्टीकरण के लिए बहुत-बहुत धन्यवाद; मैं अब बेहतर प्रस्तुति दे सकता हूं। (हम्म ... मुझे आपके पेपर पर पकड़ बनाने की ज़रूरत है। :))
us11r11852 कहते हैं,

@ us @r11852: ईमेल द्वारा मुझसे संपर्क करने के लिए स्वतंत्र महसूस करें ( यहां पता ढूंढें ) - यदि आपका मेल मेरे स्पैम फ़िल्टर में समाप्त नहीं हुआ है, तो मैं खुशी से आपको वह कागज भेजूंगा।
एस। कोलासा -

@ us @r11852 मैंने "N =" की तरह पूरी तरह से आपको खो दिया है?
जक

5

यहाँ छवि विवरण दर्ज करें

आरएमएसई यूक्लिडियन दूरी में नुकसान का वर्णन करने का एक और अधिक प्राकृतिक तरीका है। इसलिए यदि आप इसे 3 डी में रेखांकन करते हैं, तो नुकसान शंकु आकार में है, जैसा कि आप ऊपर हरे रंग में देख सकते हैं। यह उच्च आयामों पर भी लागू होता है, हालांकि इसकी कल्पना करना कठिन है।

एमएई को शहर-ब्लॉक दूरी के रूप में सोचा जा सकता है। यह वास्तव में नुकसान को मापने के तरीके के रूप में स्वाभाविक नहीं है, जैसा कि आप ग्राफ को नीले रंग में देख सकते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.