मैं आर forecast
पैकेज से प्रभावित हूं , साथ ही zoo
अनियमित समय श्रृंखला के लिए पैकेज और लापता मूल्यों के प्रक्षेप।
मेरा आवेदन कॉल सेंटर ट्रैफ़िक पूर्वानुमान के क्षेत्र में है, इसलिए सप्ताहांत पर डेटा (लगभग) हमेशा गायब रहता है, जिसे अच्छी तरह से निपटाया जा सकता है zoo
। इसके अलावा, कुछ असतत बिंदु गायब हो सकते हैं, मैं सिर्फ आर के NA
लिए उपयोग करता हूं ।
बात यह है: पूर्वानुमान पैकेज के सभी अच्छे जादू, जैसे eta()
, auto.arima()
आदि, सादे ts
वस्तुओं की अपेक्षा करते हैं, अर्थात समकालिक समय श्रृंखला जिसमें कोई लापता डेटा नहीं है। मुझे लगता है कि सम-विषम समय श्रृंखला के लिए वास्तविक दुनिया के आवेदन निश्चित रूप से अस्तित्व में हैं, लेकिन - मेरी राय में - बहुत सीमित।
कुछ असतत NA
मूल्यों की समस्या को आसानी से किसी भी प्रस्तावित प्रक्षेप कार्यों का उपयोग करके हल किया जा सकता zoo
है forecast::interp
। उसके बाद, मैं पूर्वानुमान चलाता हूं।
मेरे सवाल:
- क्या कोई बेहतर उपाय सुझाता है?
(मेरा मुख्य प्रश्न) कम से कम मेरे एप्लिकेशन डोमेन में, कॉल सेंटर ट्रैफ़िक फोरकास्टिंग (और जहाँ तक मैं अधिकांश अन्य समस्या डोमेन की कल्पना कर सकता हूँ), टाइम सीरीज़ समान नहीं हैं। कम से कम हमारे पास "व्यावसायिक दिन" योजना या कुछ और है। इसे संभालने का सबसे अच्छा तरीका क्या है और अभी भी पूर्वानुमान पैकेज के सभी शांत जादू का उपयोग करें?
क्या मुझे सप्ताहांतों को भरने के लिए टाइम सीरीज़ को "कंप्रेस" करना चाहिए, क्या पूर्वानुमान है, और फिर सप्ताहांत में एनए मूल्यों को फिर से सम्मिलित करने के लिए डेटा को फिर से "फुलाओ"? (यह एक शर्म की बात होगी, मुझे लगता है?)
क्या चिड़ियाघर या इसके जैसे अनियमित समय श्रृंखला पैकेज के साथ पूर्वानुमान पैकेज को पूरी तरह से संगत बनाने की कोई योजना है? यदि हाँ, तो कब और यदि नहीं, तो क्यों नहीं?
मैं पूर्वानुमान के लिए काफी नया हूं (और सामान्य रूप से आंकड़े), इसलिए मैं कुछ महत्वपूर्ण अनदेखी कर सकता हूं।
auto.arima
लापता मूल्यों को संभाल सकता है।