एक कदम पीछे हटना और एक मिनट के लिए पूर्वानुमान पहलू के बारे में भूलना उपयोगी है। चलो किसी भी वितरण पर विचार करें और मान लें कि हम एक ही संख्या का उपयोग करके इसे संक्षेप में प्रस्तुत करना चाहते हैं।एफ
आप अपने आँकड़े वर्गों में बहुत जल्दी सीखते हैं कि की अपेक्षा को एक एकल संख्या सारांश के रूप में उपयोग करने से अपेक्षित चुकता त्रुटि कम हो जाएगी।एफ
अब सवाल यह है: के माध्यिका का उपयोग अपेक्षित पूर्ण त्रुटि को कम क्यों करता है ?एफ
इसके लिए, मैं अक्सर हनले एट अल द्वारा "विज़ुअलाइज़िंग द मेडियनिंग द मिनिमम-डेविएशन लोकेशन" की सिफारिश करता हूं । (2001, द अमेरिकन स्टेटिस्टिशियन ) । उन्होंने अपने पेपर के साथ एक छोटा एप्लेट स्थापित किया , जो दुर्भाग्य से आधुनिक ब्राउज़रों के साथ काम नहीं करता है, लेकिन हम पेपर में तर्क का पालन कर सकते हैं।
मान लीजिए कि आप लिफ्ट के एक बैंक के सामने खड़े हैं। उन्हें समान रूप से व्यवस्थित किया जा सकता है, या एलेवेटर के दरवाजों के बीच कुछ दूरी दूसरों की तुलना में बड़ी हो सकती हैं (जैसे, कुछ लिफ्ट क्रम से बाहर हो सकती हैं)। सामने जो लिफ्ट की आप जब लिफ्ट में से एक कम से कम की उम्मीद की पैदल दूरी पर है करने के लिए खड़े होना चाहिए करता पहुंचें? ध्यान दें कि यह अपेक्षित चलना अपेक्षित पूर्ण त्रुटि की भूमिका निभाता है!
मान लीजिए कि आपके पास तीन ए, बी और सी हैं।
- यदि आप ए के सामने प्रतीक्षा करते हैं, तो आपको ए से बी (यदि बी आता है), या ए से सी (यदि सी आता है) से चलने की आवश्यकता हो सकती है - बी पास!
- यदि आप B के सामने प्रतीक्षा करते हैं, तो आपको B से A (यदि A आता है) या B से C (यदि C आता है) से चलने की आवश्यकता है।
- यदि आप C के सामने प्रतीक्षा करते हैं, तो आपको C से A तक चलने की आवश्यकता है (यदि A आता है) - B से गुजरना - या C से B (यदि B आता है)।
ध्यान दें कि पहली और आखिरी प्रतीक्षा की स्थिति से, एक दूरी है - पहली में एबी, अंतिम स्थिति में बीसी - कि आपको आने वाले लिफ्ट के कई मामलों में चलने की आवश्यकता है । इसलिए, आपका सबसे अच्छा दांव मध्य लिफ्ट के ठीक सामने खड़ा होना है - भले ही तीन लिफ्ट की व्यवस्था कैसे की जाए।
यहाँ हनले एट अल से चित्र 1 है।
यह आसानी से तीन से अधिक लिफ्ट के लिए सामान्यीकृत करता है। या पहले पहुंचने के विभिन्न अवसरों के साथ लिफ्ट के लिए। या वास्तव में अनगिनत असीम रूप से कई लिफ्ट के लिए। इसलिए हम इस तर्क को सभी असतत वितरणों पर लागू कर सकते हैं और फिर निरंतर वितरणों तक पहुंचने के लिए सीमा तक पास कर सकते हैं।
एफ^
एफ^λ ≤ ln2
इस प्रकार, यदि आपको संदेह है कि आपका भविष्य कहनेवाला वितरण असममित है, जैसा कि ऊपर दिए गए दो मामलों में है, तो यदि आप निष्पक्ष अपेक्षा के पूर्वानुमान प्राप्त करना चाहते हैं, तो rmse का उपयोग करें । यदि वितरण को सममित माना जा सकता है (आमतौर पर उच्च-मात्रा श्रृंखला के लिए), तो माध्यिका और माध्य संयोग होता है, और मॅई का उपयोग आपको निष्पक्ष पूर्वानुमान के लिए भी मार्गदर्शन करेगा - और एमएई को समझना आसान है।
इसी प्रकार, कम से कम मैप भी सममित वितरण के लिए, पक्षपाती पूर्वानुमान के लिए नेतृत्व कर सकते हैं। मेरे पहले के इस उत्तर में एक असममित उदाहरण के साथ एक असममित रूप से वितरित सख्ती से सकारात्मक (lognormally वितरित) श्रृंखला है जिसका अर्थ है कि हम एमएसई, एमएई या एमएपीई को कम से कम करना चाहते हैं, इस पर निर्भर करते हुए तीन अलग-अलग बिंदु पूर्वानुमानों का उपयोग करके पूर्वानुमानित किया जा सकता है।