साप्ताहिक सीज़न के साथ मेरे पास काफी पूर्वानुमानित दैनिक समय श्रृंखला है। जब कोई छुट्टियां न हों तो मैं उन भविष्यवाणियों के साथ आने में सक्षम हूं जो बहुत सटीक (क्रॉस-वैरिफिकेशन द्वारा पुष्टि) प्रतीत होती हैं। हालाँकि, जब छुट्टियां होती हैं, तो मेरे पास निम्नलिखित मुद्दे होते हैं:
- मुझे अपने पूर्वानुमान में छुट्टियों के लिए गैर-शून्य नंबर मिलते हैं, भले ही सभी ऐतिहासिक छुट्टियां हैं 0. यह वास्तव में मुख्य मुद्दा नहीं है। मुद्दा यह है ...
- चूंकि छुट्टियों के बाद के दिनों में "स्पिल ओवर" की प्रक्रिया नहीं होती है, इसलिए एक साधारण डमी वैरिएबल इसमें कटौती नहीं करता है, क्योंकि ये आउटलेर अल्पकालिक नवोन्मेषी प्रतीत होते हैं। अगर कोई साप्ताहिक सीज़न नहीं था, तो मैं शायद छुट्टी के बाद पाँच या इतने दिनों की छुट्टी पर असुरक्षित डेटा वितरित करने के लिए एक अनुमान के साथ आ सकता हूं (जैसा कि सुझाव दिया गया कि आप छुट्टियों के लीड और लैग प्रभाव को दर्शाते हुए चर कैसे बनाते हैं? एक समय-श्रृंखला विश्लेषण में कैलेंडर प्रभाव? )। हालांकि, "स्पिल ओवर" का वितरण उस सप्ताह के दिन पर निर्भर करता है जिस दिन छुट्टी होती है, और छुट्टी क्रिसमस या थैंक्सगिविंग है या नहीं, जहां वर्ष के बाकी दिनों की तुलना में कम दर पर ऑर्डर दिए जाते हैं।
मेरी क्रॉस-मान्यता से कुछ स्नैपशॉट हैं जो सप्ताह के विभिन्न दिनों में दिखाई देने वाली छुट्टियों के लिए वास्तविक (लाल) बनाम अनुमानित (नीला) परिणाम दिखाते हैं:
मुझे यह भी चिंता है कि क्रिसमस का प्रभाव उस सप्ताह के दिन पर निर्भर करता है जिस दिन यह पड़ता है, और मेरे पास केवल छह या इतने वर्षों का ऐतिहासिक डेटा है।
क्या किसी के पास पूर्वानुमान के संदर्भ में इन प्रकार के नवोन्मेषी आउटलेयर से निपटने के लिए कोई सुझाव है? (दुर्भाग्य से मैं कोई डेटा साझा नहीं कर सकता)