डेली डेटा के साथ टाइम सीरीज़ पूर्वानुमान: प्रतिगामी के साथ ARIMA


15

मैं बिक्री डेटा के दैनिक समय की श्रृंखला का उपयोग कर रहा हूं जिसमें लगभग 2 साल के दैनिक डेटा बिंदु शामिल हैं। कुछ ऑनलाइन ट्यूटोरियल / उदाहरणों के आधार पर मैंने डेटा में मौसमी पहचान की कोशिश की। ऐसा लगता है कि एक साप्ताहिक, मासिक और शायद एक वार्षिक आवधिकता / मौसम है।

उदाहरण के लिए, भुगतान के दिन हैं, विशेष रूप से महीने के प्रभाव के 1 दिन पर जो सप्ताह के दौरान कुछ दिनों तक रहता है। कुछ विशिष्ट हॉलिडे प्रभाव भी हैं, जो अवलोकनों को ध्यान में रखते हुए स्पष्ट रूप से पहचाने जाने योग्य हैं।

इनमें से कुछ टिप्पणियों से लैस, मैंने निम्नलिखित कोशिश की:

  1. ARIMA (के साथ Arimaऔर auto.arimaआर-पूर्वानुमान पैकेज से), प्रतिगामी (और फ़ंक्शन में आवश्यक अन्य डिफ़ॉल्ट मान) का उपयोग करके। मेरे द्वारा बनाया गया रेजिस्टर मूल रूप से 0/1 मानों का एक मैट्रिक्स है:

    • 11 महीने (एन -1) चर
    • 12 अवकाश चर
    • Payday भाग को समझ नहीं सका ... क्योंकि यह मेरे विचार से थोड़ा अधिक जटिल प्रभाव है। 1 महीने के दिन के दिन के आधार पर, पैश प्रभाव अलग तरह से काम करता है।

    मैंने समय श्रृंखला को मॉडल करने के लिए 7 (यानी, साप्ताहिक आवृत्ति) का उपयोग किया। मैंने परीक्षण की कोशिश की - एक बार में 7 दिनों का पूर्वानुमान। परिणाम उचित हैं: 11 सप्ताह के पूर्वानुमान के लिए औसत सटीकता साप्ताहिक एवीएमएस आरएमएसई से 5% तक आती है।

  2. टीबीएटीएस मॉडल (आर-पूर्वानुमान पैकेज से) - कई मौसमी (7, 30.4375, 365.25) का उपयोग करते हुए और स्पष्ट रूप से कोई प्रतिगामी नहीं। साप्ताहिक एएमजी RMSE 3.5% पर ARIMA मॉडल की तुलना में सटीकता आश्चर्यजनक रूप से बेहतर है।

    इस मामले में, एआरएमए त्रुटियों के बिना मॉडल थोड़ा बेहतर प्रदर्शन करता है। अब यदि मैं टीबीएटीएस मॉडल के परिणामों में # 1 में वर्णित ARIMA मॉडल से सिर्फ हॉलिडे इफेक्ट्स के लिए गुणांक लागू करता हूं, तो साप्ताहिक एवीजी RMSE 2.95% में सुधार होता है

अब इन मॉडलों के अंतर्निहित सिद्धांतों पर बहुत अधिक पृष्ठभूमि या ज्ञान के बिना, मैं दुविधा में हूं कि क्या यह टीबीएटीएस दृष्टिकोण भी एक वैध है। भले ही यह 11 सप्ताह के परीक्षण में आरएमएसई में काफी सुधार कर रहा है, मैं सोच रहा हूं कि क्या यह भविष्य में इस सटीकता को बनाए रख सकता है। या भले ही ARIMA से TBATS परिणाम में छुट्टी प्रभाव लागू करना उचित हो। किसी भी / सभी योगदानकर्ताओं से किसी भी विचार की बहुत सराहना की जाएगी।

टेस्ट डेटा के लिए लिंक

नोट: फ़ाइल को डाउनलोड करने के लिए "लिंक के रूप में सहेजें" करें।


1
साइट पर आपका स्वागत है, @CKI। यदि आप अपना डेटा वेब पर किसी स्थान पर अपलोड कर सकते हैं, तो आप यहां एक लिंक पोस्ट कर सकते हैं।
गूँज - मोनिका

मुझे यह जानने में दिलचस्पी है कि रजिस्टरों की स्थापना कैसे हुई।
कक्षीय

सप्ताह के 6 दिन डमी, 11 मासिक डमी और अवकाश सरल 0/1 रजिस्ट्रार हैं। महीने का निश्चित दिन, छुट्टियों के आसपास का नेतृत्व और अंतराल, समय की प्रवृत्ति, मौसमी नाड़ी और नाड़ी एक खोजी खोज पर आधारित हैं।
टॉम रीली

तो CKI, आपने इसे कैसे हल किया?
टॉम रीली

हैलो CKI, क्या आप सीज़न मैट्रिक्स बनाने के लिए इस्तेमाल की जाने वाली अपनी कुछ आर स्क्रिप्ट को साझा कर सकते हैं
अहमद

जवाबों:


9

आपको अलग-अलग क्षितिज से अलग-अलग मूल के मॉडल और पूर्वानुमान का मूल्यांकन करना चाहिए और एक दृष्टिकोण प्राप्त करने के लिए एक नंबर नहीं।

मुझे लगता है कि आपका डेटा अमेरिका से है। मैं दैनिक डेटा के 3+ वर्ष पसंद करता हूं क्योंकि आप एक सप्ताह के अंत में दो छुट्टियां ले सकते हैं और सप्ताह के किसी दिन पढ़ नहीं सकते हैं। ऐसा लगता है कि आपका धन्यवाद प्रभाव 2012 में एक दिन की छुट्टी है या किसी प्रकार की रिकॉर्डिंग त्रुटि थी और इसने मॉडल को धन्यवाद दिवस प्रभाव को याद करने का कारण बना दिया।

यदि आप वर्ष के% के रूप में देखें तो जनवरी आमतौर पर डेटासेट में कम होते हैं। सप्ताहांत अधिक है। डमी इस व्यवहार को दर्शाते हैं .... MONTH_EFF01, FIXED_EFF_N10507, FIXED_EFF_N10607

मैंने पाया है कि दैनिक डेटा के साथ एआर घटक का उपयोग करते हुए माना जाता है कि सप्ताह के पैटर्न के अंतिम दो सप्ताह दिन यह है कि पैटर्न सामान्य रूप से कैसा है जो एक बड़ी धारणा है। हमने 11 मासिक डमी और 6 दैनिक डमी से शुरुआत की। कुछ ने मॉडल से बाहर कर दिया। बी ** 1 का मतलब है कि छुट्टी के अगले दिन एक अंतराल प्रभाव होता है। महीने के 6 विशेष दिन थे (दिन 2,3,5,21,29,30 ---- 21 सहज हो सकते हैं?) और 3 समय के रुझान, 2 मौसमी दालें (जहां सप्ताह का एक दिन भटकना शुरू हो गया था) ठेठ, इस डेटा से पहले एक 0 और हर 7 वें दिन के बाद 1) और 2 आउटलेर्स (धन्यवाद धन्यवाद!) इसे चलाने में सिर्फ 7 मिनट का समय लगा। सभी परिणाम यहां www.autobox.com/se/dd/daily.zip डाउनलोड करें

इसमें यह देखने के लिए जाँच करने के लिए एक त्वरित और गंदे XLS शीट शामिल है कि क्या मॉडल समझ में आता है। बेशक, XLS% वास्तव में खराब हैं क्योंकि वे कच्चे बेंचमार्क हैं।

इस मॉडल का अनुमान लगाने की कोशिश करें:

Y(T) =  .53169E+06                                                                                        
       +[X1(T)][(+  .13482E+06B** 1)]                                       M_HALLOWEEN
       +[X2(T)][(+  .17378E+06B**-3)]                                       M_JULY4TH
       +[X3(T)][(-  .11556E+06)]                                            M_MEMORIALDAY
       +[X4(T)][(-  .16706E+06B**-4+  .13960E+06B**-3-  .15636E+06B**-2                                                 
       -  .19886E+06B**-1)]                                                 M_NEWYEARS
       +[X5(T)][(+  .17023E+06B**-2-  .26854E+06B**-1-  .14257E+06B** 1)]   M_THANKSGIVI
       +[X6(T)][(-  71726.    )]                                            MONTH_EFF01
       +[X7(T)][(+  55617.    )]                                            MONTH_EFF02
       +[X8(T)][(+  27827.    )]                                            MONTH_EFF03
       +[X9(T)][(-  37945.    )]                                            MONTH_EFF09
       +[X10(T)[(-  23652.    )]                                            MONTH_EFF10
       +[X11(T)[(-  33488.    )]                                            MONTH_EFF11
       +[X12(T)[(+  39389.    )]                                            FIXED_EFF_N10107
       +[X13(T)[(+  63399.    )]                                            FIXED_EFF_N10207
       +[X14(T)[(+  .13727E+06)]                                            FIXED_EFF_N10307
       +[X15(T)[(+  .25144E+06)]                                            FIXED_EFF_N10407
       +[X16(T)[(+  .32004E+06)]                                            FIXED_EFF_N10507
       +[X17(T)[(+  .29156E+06)]                                            FIXED_EFF_N10607
       +[X18(T)[(+  74960.    )]                                            FIXED_DAY02
       +[X19(T)[(+  39299.    )]                                            FIXED_DAY03
       +[X20(T)[(+  27660.    )]                                            FIXED_DAY05
       +[X21(T)[(-  33451.    )]                                            FIXED_DAY21
       +[X22(T)[(+  43602.    )]                                            FIXED_DAY29
       +[X23(T)[(+  68016.    )]                                            FIXED_DAY30
       +[X24(T)[(+  226.98    )]                                            :TIME TREND        1                   1/  1   1/ 3/2011   I~T00001__010311stack
       +[X25(T)[(-  133.25    )]                                            :TIME TREND      423                  61/  3   2/29/2012   I~T00423__010311stack
       +[X26(T)[(+  164.56    )]                                            :TIME TREND      631                  91/  1   9/24/2012   I~T00631__010311stack
       +[X27(T)[(-  .42528E+06)]                                            :SEASONAL PULSE  733                 105/  5   1/ 4/2013   I~S00733__010311stack
       +[X28(T)[(-  .33108E+06)]                                            :SEASONAL PULSE  370                  53/  6   1/ 7/2012   I~S00370__010311stack
       +[X29(T)[(-  .82083E+06)]                                            :PULSE           326                  47/  4  11/24/2011   I~P00326__010311stack
       +[X30(T)[(+  .17502E+06)]                                            :PULSE           394                  57/  2   1/31/2012   I~P00394__010311stack
      +                    +   [A(T)]
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.