समय श्रृंखला पूर्वानुमान करते समय अच्छे अभ्यास


10

मैं अल्पकालिक लोड पूर्वानुमान और सटीकता में सुधार के लिए जलवायु / मौसम डेटा के उपयोग पर महीनों से काम कर रहा हूं। मेरे पास एक कंप्यूटर विज्ञान पृष्ठभूमि है और इस कारण से मैं बड़ी गलतियों और ARIMA मॉडल जैसे सांख्यिकी उपकरणों के साथ काम करने की अनुचित तुलना नहीं करने की कोशिश कर रहा हूं। मैं कुछ चीजों के बारे में आपकी राय जानना चाहता हूं:

  1. मैं पूर्वानुमान पर मौसम डेटा के प्रभाव की जांच करने के लिए ARIMA और (S) ARIMAX मॉडल दोनों का उपयोग कर रहा हूं, क्या आपको लगता है कि एक्सपोनेंशियल स्मूथिंग विधियों का भी उपयोग करना आवश्यक होगा?

  2. 300 दैनिक नमूनों की एक समय श्रृंखला के बाद, मैं पहले दो सप्ताह से शुरू कर रहा हूं और मैं auto.arima R फ़ंक्शन (पूर्वानुमान पैकेज) के साथ बनाए गए मॉडल का उपयोग करके 5 दिनों का फॉरवर्ड पूर्वानुमान करता हूं। फिर, मैं अपने डेटा सेट में एक और नमूना जोड़ता हूं और मैं फिर से मॉडलों को जांचता हूं और मैं उपलब्ध डेटा के अंत तक एक और 5 दिनों का पूर्वानुमान और इसी तरह प्रदर्शन करता हूं। क्या आपको लगता है कि काम करने का यह तरीका सही है?

आपके सुझावों के लिए धन्यवाद, हालांकि हमारे काम का लक्ष्य एक इंजीनियरिंग जर्नल लेख है, मैं एक सांख्यिकीय दृष्टिकोण से यथासंभव कठोर काम करना चाहूंगा।


1
: इस सवाल का बारीकी से संबंधित हो प्रकट होता है stats.stackexchange.com/questions/16915/...
whuber

1
यहाँ एक पुराना उत्तर आँकड़े है ।stackexchange.com
questions/

जवाबों:


9
  1. मुझे लगता है कि यह घातीय चौरसाई मॉडल की भी खोज करने लायक होगा। घातीय चौरस करने वाले मॉडल ARIMA मॉडल से मॉडल के एक मौलिक रूप से भिन्न वर्ग हैं, और आपके डेटा पर अलग-अलग परिणाम दे सकते हैं।

  2. यह एक वैध दृष्टिकोण की तरह लगता है, और रोब हंडमैन द्वारा प्रस्तावित समय श्रृंखला क्रॉस-सत्यापन विधि के समान है ।

मैं प्रत्येक पूर्वानुमान (घातीय चौरसाई, ARIMA, ARMAX) से क्रॉस-वेलिडेशन त्रुटि एकत्र करूँगा और फिर 3 तरीकों की तुलना करने के लिए समग्र त्रुटि का उपयोग करूंगा।

आप ARIMA मापदंडों के लिए "ग्रिड खोज" पर भी विचार कर सकते हैं, बजाय auto.arima का उपयोग करने के। ग्रिड खोज में, आप एक अरिमा मॉडल के लिए प्रत्येक संभावित पैरामीटर का पता लगाएंगे और फिर पूर्वानुमान सटीकता का उपयोग करके "सर्वश्रेष्ठ" का चयन करेंगे।


उत्तर के लिए धन्यवाद, मैं STEPWISE खोज अक्षम के साथ auto.arima का उपयोग कर रहा हूं और मुझे लगता है कि इस तरह से यह मिन-मैक्स रेंज के बीच के सभी मापदंडों का पता लगाएगा (मैंने Hyndman & Kandahar 2008 का पेपर अभी तक नहीं पढ़ा है)
माटेयो डी फेलिस

@ मातेतो डी फेलिस: बात यह है कि यह एआईसी के आधार पर उन मापदंडों का अनुकूलन कर रहा है। मैं सुझाव दे रहा था कि यह उन मापदंडों को उनके आउट-ऑफ-सैंपल प्रदर्शन के अनुकूल बनाने के लायक हो सकता है, जिन्हें आप क्रॉस-वैलिडेशन द्वारा मूल्यांकन कर सकते हैं। इसके अलावा, यदि आप अन्य मॉडलों (जैसे ईटीएस) की तुलना करना चाहते हैं, तो आपको एक आउट-ऑफ-सैंपल प्रदर्शन मीट्रिक की आवश्यकता होगी, क्योंकि आप विभिन्न प्रकार के मॉडल (जैसे ऑटो.रिमा और ईटीएस) के बीच एआईसी की तुलना नहीं कर सकते हैं।
Zach

इस समय मैंने एक ग्रिड खोज (स्टेप वाइज FALSE के साथ auto.arima का उपयोग करके) का प्रदर्शन किया और फिर मैंने उनके प्रदर्शन का मूल्यांकन करने के लिए सबसे लगातार मॉडल की कोशिश की।
मट्टियो डी फेलिस

@ मातेतो डी फेलिस: यदि आपको समय-श्रृंखला क्रॉस-मान्यता को लागू करने में परेशानी हो रही है, तो यह ब्लॉग पोस्ट मदद कर सकती है: robjhyndman.com/researchtips/tscvexample
Zach

यह ध्यान दिया जाना चाहिए कि ARIMA और ETS ​​मॉडल मौलिक रूप से भिन्न नहीं हैं। वास्तव में, रैखिक घातीय चौरसाई मॉडल ARIMA मॉडल के विशेष मामले हैं। यहाँ देखें: otexts.org/fpp/8/10
मस्सा
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.