पूर्वानुमान में छुट्टियों के प्रभाव के लिए कैसे खाते हैं


12

साप्ताहिक सीज़न के साथ मेरे पास काफी पूर्वानुमानित दैनिक समय श्रृंखला है। जब कोई छुट्टियां न हों तो मैं उन भविष्यवाणियों के साथ आने में सक्षम हूं जो बहुत सटीक (क्रॉस-वैरिफिकेशन द्वारा पुष्टि) प्रतीत होती हैं। हालाँकि, जब छुट्टियां होती हैं, तो मेरे पास निम्नलिखित मुद्दे होते हैं:

  1. मुझे अपने पूर्वानुमान में छुट्टियों के लिए गैर-शून्य नंबर मिलते हैं, भले ही सभी ऐतिहासिक छुट्टियां हैं 0. यह वास्तव में मुख्य मुद्दा नहीं है। मुद्दा यह है ...
  2. चूंकि छुट्टियों के बाद के दिनों में "स्पिल ओवर" की प्रक्रिया नहीं होती है, इसलिए एक साधारण डमी वैरिएबल इसमें कटौती नहीं करता है, क्योंकि ये आउटलेर अल्पकालिक नवोन्मेषी प्रतीत होते हैं। अगर कोई साप्ताहिक सीज़न नहीं था, तो मैं शायद छुट्टी के बाद पाँच या इतने दिनों की छुट्टी पर असुरक्षित डेटा वितरित करने के लिए एक अनुमान के साथ आ सकता हूं (जैसा कि सुझाव दिया गया कि आप छुट्टियों के लीड और लैग प्रभाव को दर्शाते हुए चर कैसे बनाते हैं? एक समय-श्रृंखला विश्लेषण में कैलेंडर प्रभाव? )। हालांकि, "स्पिल ओवर" का वितरण उस सप्ताह के दिन पर निर्भर करता है जिस दिन छुट्टी होती है, और छुट्टी क्रिसमस या थैंक्सगिविंग है या नहीं, जहां वर्ष के बाकी दिनों की तुलना में कम दर पर ऑर्डर दिए जाते हैं।

मेरी क्रॉस-मान्यता से कुछ स्नैपशॉट हैं जो सप्ताह के विभिन्न दिनों में दिखाई देने वाली छुट्टियों के लिए वास्तविक (लाल) बनाम अनुमानित (नीला) परिणाम दिखाते हैं:

यहाँ छवि विवरण दर्ज करें

मुझे यह भी चिंता है कि क्रिसमस का प्रभाव उस सप्ताह के दिन पर निर्भर करता है जिस दिन यह पड़ता है, और मेरे पास केवल छह या इतने वर्षों का ऐतिहासिक डेटा है।

क्या किसी के पास पूर्वानुमान के संदर्भ में इन प्रकार के नवोन्मेषी आउटलेयर से निपटने के लिए कोई सुझाव है? (दुर्भाग्य से मैं कोई डेटा साझा नहीं कर सकता)


1
मुझे इसमें भी काफी दिलचस्पी है।
EngrStudent

2
यदि आप अपना डेटा पोस्ट नहीं कर सकते हैं, तो हो सकता है कि आप अपने डेटा के समान बनाया हुआ डेटा पोस्ट कर सकें ? कई मामलों में यह अधिक प्रासंगिक उत्तरों की सुविधा देता है।
टिम

1
डेटा को स्केल करें। मॉडल समान होगा (बस स्केल किया गया)। आप पूर्वानुमानों को अपने मूल मीट्रिक पर भी वापस कर सकते हैं।
टॉम रेली

जवाबों:


1

क्या आप छुट्टी के लिए एक डमी वैरिएबल नहीं बना सकते, एक छुट्टी के लिए + 1 और एक छुट्टी के लिए + 2 और केवल उन्हें 1 पर सेट करें जब तक कि वे एक कार्यदिवस में आते हैं?

थैंक्सगिविंग और क्रिसमस के रूप में, इन छुट्टियों के लिए अलग-अलग डमी वैरिएबल को पेश करना आपके लिए सबसे खराब स्थिति विकल्प लगता है (क्योंकि आपके पास केवल छह साल का डेटा है)। एक निश्चित सीमा तक, हालांकि यह आपका एकमात्र विकल्प हो सकता है - लोग बस उन छुट्टियों पर अलग तरह से व्यवहार करते हैं, जैसा कि वे कहते हैं, चौथी जुलाई (और यदि आप उदाहरण के लिए खुदरा बिक्री पैटर्न का अध्ययन कर रहे हैं, तो आपको निश्चित रूप से उन लोगों के साथ रहना होगा। "विशेष" छुट्टियां होने के नाते और निश्चित रूप से उन्हें अलग से विश्लेषण करना चाहते हैं)। हालाँकि, शायद नीचे दिए गए विचार आपके लिए उपयोगी हैं:

  • धन्यवाद। क्या यह तथ्य नहीं होना चाहिए कि यह सप्ताह के एक ही दिन (गुरुवार) को पड़ता है? यानी थैंक्सगिविंग डमी सिर्फ छह साल के डेटा सेट में भी काम करने योग्य हो सकती है क्योंकि वीक डेज पैटर्न हमेशा एक जैसा रहेगा।
  • क्रिसमस। यह आपके ग्राफ को देखने से मुझे लगता है कि मुख्य मुद्दा यह है कि प्रभाव अन्य छुट्टियों के बाद अधिक समय तक रहता है - यदि आप "क्रिसमस" को क्रिसमस की पूर्व संध्या (24 दिसंबर) के रूप में परिभाषित करते हैं, तो ऐसा इसलिए होगा क्योंकि कई लोग घर पर भी रहेंगे क्रिसमस डे (25 दिसंबर) (और कुछ स्थानों पर बॉक्सिंग डे (26 दिसंबर))। मैं इस बारे में कुछ और सोचूंगा।

आशा है कि ये आपकी मदद करेगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.