एक पक्ष के शौक के रूप में, मैं पूर्वानुमान समय श्रृंखला (विशेष रूप से, आर का उपयोग करके) की खोज कर रहा हूं।
मेरे डेटा के लिए, मेरे पास प्रति दिन विज़िट की संख्या है, हर दिन लगभग 4 साल वापस जा रहे हैं। इस डेटा में कुछ अलग पैटर्न हैं:
- सोमवार-शुक्रवार को बहुत सारे दौरे होते हैं (सोम / त्यू पर सबसे अधिक), लेकिन सत-सन पर बहुत कम।
- वर्ष के कुछ समय में गिरावट (यानी अमेरिकी छुट्टियों के आसपास कई कम दौरे, गर्मियों में कम वृद्धि दिखाते हैं)
- साल-दर-साल महत्वपूर्ण वृद्धि
इस डेटा के साथ आगामी वर्ष का पूर्वानुमान लगाने में सक्षम होना अच्छा होगा, और इसका उपयोग मौसम-दर-महीने की वृद्धि को समायोजित करने के लिए भी किया जाएगा। मासिक दृष्टि से मुझे फेंकने वाली मुख्य बात यह है:
- कुछ महीनों में अन्य महीनों की तुलना में अधिक Mon / Tue होगा (और यह वर्षों से लगातार नहीं है)। इसलिए अधिक कार्यदिवस वाले महीने को तदनुसार समायोजित करने की आवश्यकता होती है।
साल के आधार पर 52-53 से वीक नंबरिंग सिस्टम बदलने के बाद से एक्सप्लोसिंग वीक भी मुश्किल लगता है, और ऐसा लगता ts
है कि इसे हैंडल नहीं किया गया है।
मैं महीने के दिनों के लिए औसत ले रहा हूं, लेकिन परिणामी इकाई थोड़ी अजीब है (ग्रोथ वीक डेज विजिट्स में ग्रोथ) और वह डेटा ड्रॉप कर रहा है जो वैध है।
मुझे लगता है कि इस तरह का डेटा टाइम सीरीज़ में आम होगा, (उदाहरण के लिए ऑफिस बिल्डिंग में बिजली का उपयोग कुछ इस तरह से हो सकता है), किसी को कोई सलाह है कि इसे कैसे मॉडल करें, विशेष रूप से, आर में?
मैं जिस डेटा के साथ काम कर रहा हूं वह बहुत सीधे आगे है, यह शुरू होता है:
[,1]
2008-10-05 17607
2008-10-06 36368
2008-10-07 40250
2008-10-08 39631
2008-10-09 40870
2008-10-10 35706
2008-10-11 18245
2008-10-12 23528
2008-10-13 48077
2008-10-14 48500
2008-10-15 49017
2008-10-16 50733
2008-10-17 46909
2008-10-18 22467
और वर्तमान तक यह जारी है, विकास की एक समग्र प्रवृत्ति के साथ, कुछ अमेरिकी छुट्टी सप्ताह के आसपास डुबकी, और विकास आमतौर पर गर्मियों के दौरान धीमा।
ts
(और यहां तक कि msts
) एक वर्ष की "प्राकृतिक" अवधि के साथ एक सप्ताह की एक नमूना अवधि फिट नहीं होती है (न ही कैलेंडर वास्तव में मुझे लगता है)। या, मुझे यह समझ में नहीं आ रहा है कि उस काम को कैसे किया जाए ...