क्या ARIMA को बेहतर बनाने के लिए MEAN के लिए यह असामान्य है?


37

मैंने हाल ही में कई पूर्वानुमान विधियों (MEAN, RWF, ETS, ARIMA और MLPs) को लागू किया और पाया कि MEAN ने आश्चर्यजनक रूप से अच्छा किया। (MEAN: जहां भविष्य की सभी भविष्यवाणियों का अवलोकन प्रेक्षित मानों के अंकगणितीय माध्य के बराबर किया गया है।) MEAN ने मेरे द्वारा उपयोग की जाने वाली तीन श्रृंखलाओं पर ARIMA को भी पछाड़ दिया।

क्या मैं जानना चाहता हूं कि क्या यह असामान्य है? इसका मतलब यह है कि मैं उपयोग कर रहे श्रृंखला अजीब हैं? या यह इंगित करता है कि मैंने कुछ गलत सेट किया है?



@ मेहरदाद निश्चित रूप से मार्टिंगलेस के आसपास एक अच्छा जवाब तैयार कर सकता है।
छायाकार

1
यह सरल तरीकों के लिए अच्छा प्रदर्शन करने के लिए काफी सामान्य है, विशेष रूप से आउट-ऑफ-सैंपल (जहां यह मायने रखता है)। यह प्रभाव लघु श्रृंखला पर अधिक मजबूत हो जाता है। यदि बहुत अधिक सीरियल संबंध या प्रवृत्ति नहीं है, तो हम अपेक्षाकृत लंबी श्रृंखला के साथ भी बहुत अच्छा करने की उम्मीद करेंगे।
Glen_b

जवाबों:


31

मैं एक प्रैक्टिशनर हूं, दोनों ही निर्माता और पूर्वानुमान के उपयोगकर्ता और प्रशिक्षित सांख्यिकीविद् नहीं। नीचे मैं अपने कुछ विचारों को साझा करता हूं कि अनुभवजन्य साक्ष्य पर भरोसा करने वाले शोध लेख का संदर्भ देकर आपका मतलब पूर्वानुमान ARIMA से बेहतर क्यों निकला। एक पुस्तक जो समय और समय पर फिर से संदर्भित करने के लिए जाती है, वह आर्मस्ट्रांग और इसकी वेबसाइट द्वारा पूर्वानुमानित पुस्तक के सिद्धांत हैं, जो कि मैं किसी भी भविष्यवक्ता के लिए एक उत्कृष्ट पढ़ने के रूप में सुझाऊंगा, उपयोग और मार्गदर्शन के सिद्धांतों पर महान जानकारी प्रदान करता है।

आपको पहले प्रश्न का उत्तर देने के लिए - मैं जानना चाहता हूं कि क्या यह असामान्य है?

टाइम-सीरीज़ और क्रॉस-सेक्शनल डेटा के लिए एक्सट्रैपलेशन नामक एक अध्याय है जो एक ही वेबसाइट में मुफ्त भी उपलब्ध है । अध्याय का उद्धरण निम्नलिखित है

"उदाहरण के लिए, वास्तविक समय एम 2-प्रतियोगिता में, जिसने 29 मासिक श्रृंखलाओं की जांच की, बॉक्स-जेनकिन्स कम से कम-सटीक विधियों में से एक साबित हुआ और इसकी समग्र औसतन त्रुटि एक भोले पूर्वानुमान के लिए 17% से अधिक थी"

इस बात का एक अनुभवजन्य साक्ष्य है कि आपके मतलब के पूर्वानुमान ARIMA मॉडल से बेहतर क्यों थे।

अनुभवजन्य प्रतियोगिताओं में अध्ययन के बाद भी अध्ययन किया गया है और तीसरी एम 3 प्रतियोगिता जो बॉक्स को दिखाती है - जेनकिंस एआरआईएमए दृष्टिकोण सटीक पूर्वानुमान का उत्पादन करने में विफल रहता है और सबूतों का अभाव है कि यह अविभाजित प्रवृत्ति एक्सट्रपलेशन के लिए बेहतर प्रदर्शन करता है।

उसी वेबसाइट में ग्रीन और आर्मस्ट्रांग द्वारा " सिंपल फोरकास्टिंग: टियर्स बिफोर बिफोर बिडेम " शीर्षक से एक अन्य शोधपत्र और एक निरंतर अध्ययन भी किया गया है । कागज के लेखक संक्षेप में इस प्रकार हैं:

कुल मिलाकर हमने 29 पेपरों की पहचान की, जिनमें जटिल तरीकों से पूर्वानुमानों की सटीकता की 94 औपचारिक तुलनाओं को शामिल किया गया है जो साधारण से-लेकिन सभी मामलों में परिष्कृत रूप से सरल नहीं हैं। अस्सी-तीन प्रतिशत तुलनाओं में पाया गया कि सरल तरीकों से पूर्वानुमान जटिल तरीकों से उन लोगों की तुलना में अधिक सटीक थे, या समान रूप से सटीक थे। औसतन, 21 अध्ययनों में सरल तरीकों से पूर्वानुमानों की त्रुटियों की तुलना में जटिल तरीकों से पूर्वानुमानों की त्रुटियां लगभग 32 प्रतिशत अधिक थीं।

आपके तीसरे प्रश्न का उत्तर देने के लिए : क्या यह दर्शाता है कि मैंने कुछ गलत किया है? नहीं, मैं ARIMA को जटिल विधि के रूप में और साधारण तरीकों के रूप में पूर्वानुमान का अनुमान लगाऊंगा। इस बात के पर्याप्त प्रमाण हैं कि औसत तरीके जैसे कि ARIMA की तरह जटिल परिणामों की भविष्यवाणी करते हैं।

अपने दूसरे प्रश्न का उत्तर देने के लिए : इसका मतलब यह है कि मैं जिस श्रृंखला का उपयोग कर रहा हूं वह अजीब है?

नीचे मैं वास्तविक दुनिया के पूर्वानुमान के विशेषज्ञ माने जाते हैं:

  • मकारिदाकिस (एम, एम 2 और एम 3 नामक पूर्वानुमान पर अग्रणी अनुभवजन्य प्रतियोगिता और पूर्वानुमान के तरीकों पर आधारित साक्ष्य के लिए प्रशस्त तरीका)
  • आर्मस्ट्रांग (पूर्वानुमान अभ्यास पर पुस्तकों / लेखों के रूप में मूल्यवान अंतर्दृष्टि प्रदान करता है)
  • गार्डनर (इन्वेंटेड डम्प्ड ट्रेंड घातांक चौरसाई एक और सरल विधि जो आश्चर्यजनक रूप से अच्छी तरह से काम करती है ARIMA)

उपरोक्त सभी शोधकर्ता एडिमा की तरह सरलता (आपके मतलब के पूर्वानुमान जैसे तरीके) बनाम जटिल तरीके की वकालत करते हैं। इसलिए आपको सहज महसूस करना चाहिए कि आपके पूर्वानुमान अच्छे हैं और हमेशा अनुभवजन्य साक्ष्यों के आधार पर जटिलता पर सरलता का पक्ष लेते हैं। इन शोधकर्ताओं ने लागू पूर्वानुमान के क्षेत्र में बहुत योगदान दिया है।

स्टीफन की सरल पूर्वानुमान पद्धति की अच्छी सूची के अलावा। थेटा फोरकास्टिंग विधि नामक एक अन्य विधि भी है जो एक बहुत ही सरल विधि है (मूल रूप से एक बहाव के साथ सरल घातीय चौरसाई जो कि 1/2 के समान है; रैखिक प्रतिगमन का ढलान) मैं इसे आपके टूलबॉक्स में जोड़ दूंगा। Forecast package in Rइस विधि को लागू करता है।


2
मुझे वास्तव में आपके द्वारा प्रदान किए गए पूर्वानुमान और आपके द्वारा समर्थन करने के लिए जोड़ दिए गए साक्ष्य पसंद हैं, लेकिन इस उत्तर के तत्व आपत्तिजनक हैं, क्योंकि वे "सांख्यिकीविदों" या शायद औपचारिक सांख्यिकीय प्रशिक्षण के खिलाफ एक शेख़ी की तरह बहुत अधिक पढ़ते हैं - और गलत हैं । उदाहरण के लिए, मकारिदकिस की उन्नत डिग्री (अनुमान क्या?) के आँकड़े हैं , यही वह सिखाता है, और यही वह करता है।
whuber

1
समझ गया, मैं इसे हटा दूँगा। मैं एक बिंदु बनाने की कोशिश कर रहा था कि सबूत आधारित तरीकों पर प्रमुख प्रगति गैर सांख्यिकीविदों से हुई। लेकिन मैं आपकी बात देखता हूं कि यह उस तरह से आ सकता है
भविष्यवक्ता

किया, इसके अलावा, Makridakis PHD प्रबंधन सूचना प्रणाली में इस प्रकाशित साक्षात्कार के
फोरकास्टर

एफडब्ल्यूआईडब्ल्यू, उनका लिंक्डइन पेज - जो वह बनाए रखता है - आंकड़ों में अपने पीएचडी दोनों को सूचीबद्ध करता है। लेकिन तर्क व्यर्थ है: यह दावा करना कि कोई व्यक्ति सांख्यिकीविद् नहीं है, क्योंकि उनकी डिग्री विशेष रूप से आंकड़ों में नहीं हो सकती है और यहां बिंदु के बगल में है। (जब तक बहुत हाल ही में सबसे जिन लोगों के कैरियर के आँकड़ों में था क्योंकि वहाँ कुछ आंकड़े कार्यक्रमों उपलब्ध अन्य क्षेत्रों में डिग्री था।)
whuber

2
+1। हालाँकि, आप लिखते हैं "इस बात का अनुभवजन्य साक्ष्य है कि आपके मतलब के पूर्वानुमान ARIMA मॉडल से बेहतर क्यों थे।" - नहीं, यह केवल हमें बताता है कि इसका मतलब बेहतर था (इस विशिष्ट उदाहरण में), क्यों नहीं । मैं तर्क को चारों ओर मोड़ देता हूं और ARIMA और अन्य मॉडलों पर प्रमाण का बोझ डाल देता हूं। मुझे कभी यह समझ में नहीं आया कि डेटा-जनरेट करने की प्रक्रिया को मेरे मॉडल के खिलाफ पिछली त्रुटियों की परवाह क्यों करनी चाहिए, जो कि एमए शब्द अनिवार्य रूप से मॉडल है। मेरा व्यक्तिगत संदेह यह है कि एआरआईएमए इतना लोकप्रिय है क्योंकि आप वास्तव में सामान को साबित कर सकते हैं , जैसे कि यूनिट की जड़ें और स्टेशनरी - क्योंकि यह अच्छी तरह से पूर्वानुमान नहीं करता है।
एस। कोलासा - मोनिका

36

यह बिल्कुल आश्चर्यजनक नहीं है । भविष्यवाणी में, आप बहुत अक्सर कि अत्यंत सरल तरीकों को खोजने की तरह

  • समग्र मतलब है
  • भोली यादृच्छिक चलना (यानी, एक पूर्वानुमान के रूप में इस्तेमाल किया गया अंतिम अवलोकन)
  • मौसमी रैंडम वॉक (यानी, एक साल पीछे से अवलोकन)
  • एकल घातीय चिकनाई

अधिक जटिल तरीकों से बेहतर प्रदर्शन करें। यही कारण है कि आपको हमेशा अपने तरीकों को इन बहुत ही सरल बेंचमार्क के खिलाफ परीक्षण करना चाहिए।

जॉर्ज एथानोसोपोलस और रोब ह्यंडमैन का एक उद्धरण (जो क्षेत्र के विशेषज्ञ हैं):

कुछ पूर्वानुमान विधियां बहुत सरल और आश्चर्यजनक रूप से प्रभावी हैं।

ध्यान दें कि वे कैसे स्पष्ट रूप से कहते हैं कि वे बेंचमार्क के रूप में कुछ बहुत ही सरल तरीकों का उपयोग कर रहे हैं।

वास्तव में, पूर्वानुमान पर उनकी पूरी मुफ्त खुली ऑनलाइन पाठ्यपुस्तक की बहुत सिफारिश की जाती है।

संपादित करें: बेहतर स्वीकार किए गए पूर्वानुमान त्रुटि उपायों में से एक, Hyndman & Koehler द्वारा मीन एब्सोल्यूट स्केल्ड एरर (MASE) ( यहां भी देखें ) मापता है कि किसी दिए गए पूर्वानुमान में कितना सुधार होता है (इन-सैंपल) नायाब रैंडम वॉक पूर्वानुमान: यदि MASE <1, आपका पूर्वानुमान इन-सैंपल रैंडम वॉक से बेहतर है। आप उम्मीद करेंगे कि यह एक आसानी से पीटा जा सकता है, है ना?

ऐसा नहीं है: कभी-कभी, यहां तक ​​कि ARIMA या ETS जैसी कई मानक पूर्वानुमान विधियों में से सर्वश्रेष्ठ केवल 1.38 का एक MASE पैदावार देगा, यानी, (इन-सैंपल) यादृच्छिक वॉक पूर्वानुमान की तुलना में बदतर (आउट-ऑफ-सैंपल) होगा। यह यहां प्रश्न उत्पन्न करने के लिए पर्याप्त रूप से विवेकाधीन है। (यह प्रश्न इस का एक डुप्लिकेट नहीं है, क्योंकि MASE एक भोली विधि की नमूना सटीकता के लिए आउट-ऑफ-सैंपल सटीकता की तुलना करता है, लेकिन यह वर्तमान प्रश्न के लिए ज्ञानवर्धक भी है।)


1
स्वीकार करने के लिए धन्यवाद, लेकिन शायद आप एक दिन की प्रतीक्षा करना चाहते हैं - यदि किसी प्रश्न ने उत्तर स्वीकार कर लिया है, तो कम लोग भी इसे पढ़ेंगे, अकेले टिप्पणी या उत्तर दें। और अन्य लोगों के इस पर अलग-अलग कदम हो सकते हैं। अन-स्वीकार करने के लिए स्वतंत्र महसूस ;-)
एस। कोलासा - मोनिका

इसकी आप बहुत ईमानदार :) मैं इसे एक दिन दूंगा। धन्यवाद।
एंडी टी

9
"जटिल" "ओवरफिटेड" का एक करीबी रिश्तेदार है।
छायाकार

1
+1 अच्छा जवाब। यदि पूर्वानुमान चिकित्सा की तरह एक साक्ष्य आधारित क्षेत्र था, तो ARIMA विधि इतिहास होगी।
भविष्यवक्ता

2
गाऊसी मान्यताओं को मान्य किए बिना सरल दिमाग वाले एआरआईएमए हम में से अधिकांश के लिए पहले से ही इतिहास है लेकिन स्पष्ट रूप से सभी के लिए नहीं!
आयरिशस्टैट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.