@ इरिस्टैट ने बहुत कुछ कवर किया जो मैं कहने वाला था, लेकिन मैं समय श्रृंखला प्रतिगमन और ओएलएस प्रतिगमन के साथ इन आंकड़ों के मॉडलिंग में अपने व्यक्तिगत अनुभव के साथ जवाब दूंगा।
यदि यह एक दैनिक डेटा है तो मैं निम्नलिखित कार्य करूंगा:
विभिन्न मौसम के लिए एक डमी चर बनाएं:
- सप्ताह के मौसम के दिन पर कब्जा करने के लिए, 6 डमी चर बनाएं।
- महीने के मौसम के दिन पर कब्जा करने के लिए, 30 डमी चर बनाएं
- वर्ष के महीने पर कब्जा करने के लिए, 11 डमी चर बनाएं।
प्रवृत्ति चर के लिए डमी चर बनाएं:
यदि समय श्रृंखला रैखिक प्रवृत्ति प्रदर्शित करती है, तो एक समय प्रवृत्ति चर जोड़ें।
यदि समय श्रृंखला nonlinear प्रवृत्ति प्रदर्शित करती है, तो nonlinear समय प्रवृत्ति चर जैसे कि द्विघात / क्यूबिक / लॉग जोड़ें
स्वतंत्र चर चर जोड़ें
यह एक समय श्रृंखला डेटा है, इसलिए स्वतंत्र वैरिएबल के लीड और लैग प्रभावों के बारे में ध्यान रखा जाना चाहिए। उदाहरण के लिए, आप अपने मूल्य बिंदु प्रचार झंडे का उल्लेख करते हैं, हो सकता है कि वे आपकी प्रतिक्रिया पर तत्काल प्रभाव न डालें, यानी, वहाँ लैगिंग और एक क्षय / स्थायी प्रभाव हो सकता है। उदाहरण के लिए, यदि आप आज प्रमोशन चलाते हैं, तो आपको आज बिक्री में वृद्धि हो सकती है, लेकिन कुछ दिनों के बाद पदोन्नति का प्रभाव कम हो जाता है। कई प्रतिगमन का उपयोग करके इसे मॉडल करने का कोई आसान तरीका नहीं है, आप ट्रांसफर फ़ंक्शन मॉडलिंग का उपयोग करना चाहेंगे जो कि पार्सिमोनियस है और किसी भी प्रकार के लीड और लैग प्रभाव को संभाल सकता है। इस उदाहरण को मैंने पहले पोस्ट किया था, जहां एक हस्तक्षेप है (आपके मामले की कीमत बिंदु में) और अचानक वृद्धि हुई है, जिसके बाद एक क्षयकारी प्रभाव होता है। कहा कि अगर आपके पास हैलीड और लैग प्रभाव के बारे में एक प्राथमिक ज्ञान, मूल्य बिंदु और (हां / नहीं) पदोन्नति परिवर्तन से पहले और बाद में अपने मामले में अतिरिक्त चर बनाएं।
आपको चलती छुट्टियों के सूचक चर भी जोड़ने की आवश्यकता होगी, उदाहरण के लिए जैसा कि आयरिशस्टैट ने बताया है कि आप ईस्टर / धन्यवाद (अमेरिका में) जोड़ना चाहते हैं जो छुट्टियां आगे बढ़ा रहे हैं। यदि आप निश्चित तिथियों को निर्धारित कर रहे हैं, तो मौसम के कब्जे के लिए डमी कोडिंग योजना का उपयोग करने पर स्वचालित रूप से ध्यान रखा जाएगा।
इसके अलावा, आपको आउटलेर्स जैसे कि एडिटिव / पल्स (वन टाइम इवेंट) या लेवल शिफ्ट (स्थायी शिफ्ट) की पहचान करनी होगी और उन्हें रेजिस्टर के रूप में जोड़ना होगा। समय श्रृंखला डेटा के लिए कई प्रतिगमन में आउटलेर्स की पहचान करना लगभग असंभव है; आपको समय श्रृंखला की बाह्य पहचान विधियों की आवश्यकता होगी जैसे कि Tsay की प्रक्रिया या चेन और लियू की प्रक्रिया जो सॉफ्टवेयर में शामिल की गई है जैसे AUTOBOX, SPSS, SAS या tsoutlier
R में पैकेज।
संभावित समस्याएं:
यदि आप ओएलएस मल्टीपल रिग्रेशन का उपयोग करके समय श्रृंखला डेटा मॉडल करते हैं तो आपके सामने आने वाली समस्याएं हैं।
- त्रुटियों को स्वतःसंबंधित किया जा सकता है। यह अच्छा देखें वेबसाइट और इस वेबसाइट इस मुद्दे को समझा। इससे बचने का एक तरीका सामान्यीकृत कम से कम वर्गों (जीएलएस) या एआरआईएमएक्स दृष्टिकोण बनाम ओएलएस मल्टीपल रिग्रेशन का उपयोग करना है, जहां आप ऑटो सहसंबंध के लिए सही कर सकते हैं।
- 6 + 30 + 11 = 47
- डमी चर का उपयोग करके, आप मान रहे हैं कि आपकी मौसमी नियतात्मक है यानी यह समय के साथ नहीं बदलता है। चूंकि आपके पास केवल 3 साल का डेटा है, इसलिए मैं इसके बारे में चिंता नहीं करूंगा, लेकिन फिर भी यह श्रृंखला की साजिश करने और यह देखने के लिए सार्थक है कि क्या मौसम में परिवर्तन होता है।
और कई प्रतिगमन का उपयोग करने के कई और नुकसान हैं। यदि भविष्यवाणी आपके लिए अधिक महत्वपूर्ण है, तो मैं कम से कम 6 महीने का डेटा रखूंगा और आपके कई प्रतिगमन की भविष्य कहनेवाला क्षमता का परीक्षण करूंगा। यदि आपका मुख्य लक्ष्य स्वतंत्र चर के बीच सहसंबंध को स्पष्ट करना है, तो मैं कई प्रतिगमन का उपयोग करके सतर्क रहूंगा, और इसके बजाय मैं ARIMAX / GLS जैसे समय श्रृंखला दृष्टिकोण का उपयोग करूंगा।
यदि आप रुचि रखते हैं, तो आप ट्रांसफर फ़ंक्शन और डायनेमिक रिग्रेशन मॉडलिंग के लिए, पंकरात्ज़ द्वारा उत्कृष्ट पाठ का उल्लेख कर सकते हैं । सामान्य समय श्रृंखला के पूर्वानुमान के लिए कृपया मक्रीदकिस एट अल को देखें । इसके अलावा, प्रतिगमन और समय श्रृंखला आधारित पूर्वानुमान के लिए डायबॉल्ड द्वारा एक अच्छा संदर्भ पाठ होगा ।