मंझला पूर्वानुमान करने के लिए MAE को न्यूनतम क्यों करता है और इसका मतलब नहीं है?


20

से पूर्वानुमान: सिद्धांत और व्यवहार रोब जम्मू Hyndman और जॉर्ज Athanasopoulos द्वारा पाठ्यपुस्तक , विशेष रूप से सटीकता माप पर अनुभाग :

एक पूर्वानुमान विधि जो MAE को न्यूनतम करती है, माध्यिका के पूर्वानुमान को जन्म देगी, जबकि RMSE को कम करने से माध्य के पूर्वानुमान को बढ़ावा मिलेगा।

क्या कोई सहज स्पष्टीकरण दे सकता है कि एमएई को कम से कम करने के लिए औसतन पूर्वानुमान क्यों होता है और इसका मतलब नहीं है? और व्यवहार में इसका क्या अर्थ है?

मैंने एक ग्राहक से पूछा है: "मीन पूर्वानुमानों को अधिक सटीक बनाने के लिए या बहुत गलत पूर्वानुमानों से बचने के लिए आपके लिए क्या अधिक महत्वपूर्ण है?"। उन्होंने कहा कि पूर्वानुमान को अधिक सटीक बनाने के लिए उच्च प्राथमिकता है। तो, इस मामले में, मुझे एमएई या आरएमएसई का उपयोग करना चाहिए? इस उद्धरण को पढ़ने से पहले मुझे विश्वास था कि ऐसी स्थिति के लिए एमएई बेहतर होगा। और अब मुझे संदेह है।

जवाबों:


17

एक कदम पीछे हटना और एक मिनट के लिए पूर्वानुमान पहलू के बारे में भूलना उपयोगी है। चलो किसी भी वितरण पर विचार करें और मान लें कि हम एक ही संख्या का उपयोग करके इसे संक्षेप में प्रस्तुत करना चाहते हैं।एफ

आप अपने आँकड़े वर्गों में बहुत जल्दी सीखते हैं कि की अपेक्षा को एक एकल संख्या सारांश के रूप में उपयोग करने से अपेक्षित चुकता त्रुटि कम हो जाएगी।एफ

अब सवाल यह है: के माध्यिका का उपयोग अपेक्षित पूर्ण त्रुटि को कम क्यों करता है ?एफ

इसके लिए, मैं अक्सर हनले एट अल द्वारा "विज़ुअलाइज़िंग द मेडियनिंग द मिनिमम-डेविएशन लोकेशन" की सिफारिश करता हूं (2001, द अमेरिकन स्टेटिस्टिशियन ) । उन्होंने अपने पेपर के साथ एक छोटा एप्लेट स्थापित किया , जो दुर्भाग्य से आधुनिक ब्राउज़रों के साथ काम नहीं करता है, लेकिन हम पेपर में तर्क का पालन कर सकते हैं।

मान लीजिए कि आप लिफ्ट के एक बैंक के सामने खड़े हैं। उन्हें समान रूप से व्यवस्थित किया जा सकता है, या एलेवेटर के दरवाजों के बीच कुछ दूरी दूसरों की तुलना में बड़ी हो सकती हैं (जैसे, कुछ लिफ्ट क्रम से बाहर हो सकती हैं)। सामने जो लिफ्ट की आप जब लिफ्ट में से एक कम से कम की उम्मीद की पैदल दूरी पर है करने के लिए खड़े होना चाहिए करता पहुंचें? ध्यान दें कि यह अपेक्षित चलना अपेक्षित पूर्ण त्रुटि की भूमिका निभाता है!

मान लीजिए कि आपके पास तीन ए, बी और सी हैं।

  • यदि आप ए के सामने प्रतीक्षा करते हैं, तो आपको ए से बी (यदि बी आता है), या ए से सी (यदि सी आता है) से चलने की आवश्यकता हो सकती है - बी पास!
  • यदि आप B के सामने प्रतीक्षा करते हैं, तो आपको B से A (यदि A आता है) या B से C (यदि C आता है) से चलने की आवश्यकता है।
  • यदि आप C के सामने प्रतीक्षा करते हैं, तो आपको C से A तक चलने की आवश्यकता है (यदि A आता है) - B से गुजरना - या C से B (यदि B आता है)।

ध्यान दें कि पहली और आखिरी प्रतीक्षा की स्थिति से, एक दूरी है - पहली में एबी, अंतिम स्थिति में बीसी - कि आपको आने वाले लिफ्ट के कई मामलों में चलने की आवश्यकता है । इसलिए, आपका सबसे अच्छा दांव मध्य लिफ्ट के ठीक सामने खड़ा होना है - भले ही तीन लिफ्ट की व्यवस्था कैसे की जाए।

यहाँ हनले एट अल से चित्र 1 है।

हेनली एट अल।, चित्रा 1

यह आसानी से तीन से अधिक लिफ्ट के लिए सामान्यीकृत करता है। या पहले पहुंचने के विभिन्न अवसरों के साथ लिफ्ट के लिए। या वास्तव में अनगिनत असीम रूप से कई लिफ्ट के लिए। इसलिए हम इस तर्क को सभी असतत वितरणों पर लागू कर सकते हैं और फिर निरंतर वितरणों तक पहुंचने के लिए सीमा तक पास कर सकते हैं।

एफ^

एफ^λln2

इस प्रकार, यदि आपको संदेह है कि आपका भविष्य कहनेवाला वितरण असममित है, जैसा कि ऊपर दिए गए दो मामलों में है, तो यदि आप निष्पक्ष अपेक्षा के पूर्वानुमान प्राप्त करना चाहते हैं, तो उपयोग करें । यदि वितरण को सममित माना जा सकता है (आमतौर पर उच्च-मात्रा श्रृंखला के लिए), तो माध्यिका और माध्य संयोग होता है, और का उपयोग आपको निष्पक्ष पूर्वानुमान के लिए भी मार्गदर्शन करेगा - और एमएई को समझना आसान है।

इसी प्रकार, कम से कम भी सममित वितरण के लिए, पक्षपाती पूर्वानुमान के लिए नेतृत्व कर सकते हैं। मेरे पहले के इस उत्तर में एक असममित उदाहरण के साथ एक असममित रूप से वितरित सख्ती से सकारात्मक (lognormally वितरित) श्रृंखला है जिसका अर्थ है कि हम एमएसई, एमएई या एमएपीई को कम से कम करना चाहते हैं, इस पर निर्भर करते हुए तीन अलग-अलग बिंदु पूर्वानुमानों का उपयोग करके पूर्वानुमानित किया जा सकता है।


9

स्टेफ़ान जवाब आपको एक सहज व्याख्या देता है कि पूर्ण औसत त्रुटि को कम करने से आपको मंझला क्यों पड़ता है। अब इसका उपयोग करने के लिए MSE, MAE या MAPE में से कौन सा उत्तर देना है:

MAE मजबूत है , जिसका अर्थ है कि यह आउटलेर्स के प्रति कम संवेदनशील है। एक श्रृंखला को एक त्रुटि के साथ एक लाख बार अधिक कल्पना करें कि यह क्या होना चाहिए। एमएसई पर, यह पूर्वानुमान को एक मिलियन / एन बार (जहां एन अंकों की संख्या है) खींचेगा, जबकि एमएई केवल 1 इकाई के लिए खींचा जाएगा।

दुर्भाग्य से, एमएई अद्वितीय नहीं है , इसलिए यह कुछ प्रकार के स्किज़ोफ्रेनिक व्यवहार का प्रदर्शन कर सकता है।

इसलिए मेरी सिफारिश पहले MSE करने की है, फिर MAE रिग्रेशन शुरू करने के लिए MSE मापदंडों का उपयोग करता है।

किसी भी मामले में दोनों पूर्वानुमानों की तुलना करें: यदि वे बहुत भिन्न हैं तो आपके डेटा में कुछ बदबूदार है।

यहाँ छवि विवरण दर्ज करेंयहाँ छवि विवरण दर्ज करें

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.