अंतर्निहित साप्ताहिक सीज़न के साथ मौसमी रूप से समायोजित महीने-दर-महीना वृद्धि


9

एक पक्ष के शौक के रूप में, मैं पूर्वानुमान समय श्रृंखला (विशेष रूप से, आर का उपयोग करके) की खोज कर रहा हूं।

मेरे डेटा के लिए, मेरे पास प्रति दिन विज़िट की संख्या है, हर दिन लगभग 4 साल वापस जा रहे हैं। इस डेटा में कुछ अलग पैटर्न हैं:

  1. सोमवार-शुक्रवार को बहुत सारे दौरे होते हैं (सोम / त्यू पर सबसे अधिक), लेकिन सत-सन पर बहुत कम।
  2. वर्ष के कुछ समय में गिरावट (यानी अमेरिकी छुट्टियों के आसपास कई कम दौरे, गर्मियों में कम वृद्धि दिखाते हैं)
  3. साल-दर-साल महत्वपूर्ण वृद्धि

इस डेटा के साथ आगामी वर्ष का पूर्वानुमान लगाने में सक्षम होना अच्छा होगा, और इसका उपयोग मौसम-दर-महीने की वृद्धि को समायोजित करने के लिए भी किया जाएगा। मासिक दृष्टि से मुझे फेंकने वाली मुख्य बात यह है:

  • कुछ महीनों में अन्य महीनों की तुलना में अधिक Mon / Tue होगा (और यह वर्षों से लगातार नहीं है)। इसलिए अधिक कार्यदिवस वाले महीने को तदनुसार समायोजित करने की आवश्यकता होती है।

साल के आधार पर 52-53 से वीक नंबरिंग सिस्टम बदलने के बाद से एक्सप्लोसिंग वीक भी मुश्किल लगता है, और ऐसा लगता tsहै कि इसे हैंडल नहीं किया गया है।

मैं महीने के दिनों के लिए औसत ले रहा हूं, लेकिन परिणामी इकाई थोड़ी अजीब है (ग्रोथ वीक डेज विजिट्स में ग्रोथ) और वह डेटा ड्रॉप कर रहा है जो वैध है।

मुझे लगता है कि इस तरह का डेटा टाइम सीरीज़ में आम होगा, (उदाहरण के लिए ऑफिस बिल्डिंग में बिजली का उपयोग कुछ इस तरह से हो सकता है), किसी को कोई सलाह है कि इसे कैसे मॉडल करें, विशेष रूप से, आर में?

मैं जिस डेटा के साथ काम कर रहा हूं वह बहुत सीधे आगे है, यह शुरू होता है:

            [,1]
2008-10-05 17607
2008-10-06 36368
2008-10-07 40250
2008-10-08 39631
2008-10-09 40870
2008-10-10 35706
2008-10-11 18245
2008-10-12 23528
2008-10-13 48077
2008-10-14 48500
2008-10-15 49017
2008-10-16 50733
2008-10-17 46909
2008-10-18 22467

और वर्तमान तक यह जारी है, विकास की एक समग्र प्रवृत्ति के साथ, कुछ अमेरिकी छुट्टी सप्ताह के आसपास डुबकी, और विकास आमतौर पर गर्मियों के दौरान धीमा।


डेटा का एक और दिलचस्प पहलू यह है कि अचानक ऐसी घटनाएं होती हैं जो विकास की समग्र प्रवृत्ति को ~ युगल महीनों की अवधि में बाधित करती हैं। हालांकि अभी, जहां मैं ठीक से मौसम सेट करने की कोशिश कर रहा हूं, मैं उस पहलू को नजरअंदाज कर रहा हूं।
काइल ब्रान्ड

इसके अलावा, मुझे सही करें अगर मैं "सीज़निटी" का सही ढंग से उपयोग नहीं कर रहा हूँ। मैं वर्तमान में इसके बारे में सोच रहा हूं कि मैं समय इकाई के भीतर एक संरक्षक हूं। तो मेरे लिए "साप्ताहिक सीज़नलिटी" का अर्थ है "एक पैटर्न जो हर हफ्ते दोहराता है"।
काइल ब्रान्ड

हम्म, परिचित लगता है (-;

आंकड़े के जवाब देखें ।stackexchange.com/questions/14742/… । एक प्रारंभिक बिंदु हो सकता है।
पीटर एलिस

शायद इस के दिल में सप्ताह + वर्ष का संयोजन है? ऐसा लगता है ts(और यहां तक ​​कि msts) एक वर्ष की "प्राकृतिक" अवधि के साथ एक सप्ताह की एक नमूना अवधि फिट नहीं होती है (न ही कैलेंडर वास्तव में मुझे लगता है)। या, मुझे यह समझ में नहीं आ रहा है कि उस काम को कैसे किया जाए ...
काइल ब्रान्ड

जवाबों:


5

मैं हर समय इस तरह के डेटा का मॉडल बनाता हूं। आपको सम्मिलित करने की आवश्यकता है

  • हफ्ते का दिन
  • छुट्टी प्रभाव (लीड, समकालीन और अंतराल प्रभाव)
  • महीने के विशेष दिन
  • शायद शुक्रवार छुट्टी से पहले या सोमवार छुट्टी के बाद
  • साप्ताहिक प्रभाव
  • मासिक प्रभाव
  • त्रुटियों सफेद रेंडर प्रस्तुत करने के लिए ARIMA संरचना;
  • और अन्य। ।

स्टैटिस्टिकल अप्रोच को ट्रांसफर फंक्शन मॉडलिंग विद इन्टरवेंशन डेटिनेशन कहा जाता है। यदि आप अपना डेटा या तो dave@autobox.com के माध्यम से या अधिमानतः एसई के माध्यम से निजी तौर पर साझा करना चाहते हैं, तो मैं वास्तव में आपको अंतिम मॉडल की बारीकियों को दिखाने के लिए खुशी से अधिक होगा और आगे आपकी क्षमता इसे स्वयं या कम से कम आपकी मदद करने की होगी। और दूसरों को यह समझने के लिए कि क्या किया जाना चाहिए और क्या किया जा सकता है। किसी भी मामले में आप बिना किसी खर्च के होशियार हो जाते हैं, यह सिक्का या समय हो सकता है। आप अधिक जानने के लिए समय श्रृंखला प्रश्नों के लिए मेरी कुछ अन्य प्रतिक्रियाओं को पढ़ सकते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.