बाहरी चर के साथ पूर्वानुमान समय श्रृंखला डेटा


10

वर्तमान में मैं एक समय श्रृंखला डेटा (मासिक डेटा) का पूर्वानुमान करने के लिए एक परियोजना पर काम कर रहा हूं। मैं पूर्वानुमान लगाने के लिए R का उपयोग कर रहा हूं। मेरे पास 1 आश्रित चर (y) और 3 स्वतंत्र चर (X1, x2, x3) हैं। Y चर में 73 अवलोकन हैं, और इसी तरह अन्य 3 चर (alos 73) हैं। जनवरी 2009 से जनवरी 2015 तक। मैंने सहसंबंधों और पी-मूल्य की जांच की है, और इसे एक मॉडल में रखना महत्वपूर्ण है। मेरा सवाल है: मैं सभी स्वतंत्र चर का उपयोग करके एक अच्छी भविष्यवाणी कैसे कर सकता हूं? मेरे पास इन चरों के लिए भविष्य के मूल्य नहीं हैं। मान लीजिए कि मैं भविष्यवाणी करना चाहता हूं कि 2 साल (2017 में) में मेरा y चर क्या होगा। मैं यह कैसे कर सकता हूँ?

मैंने निम्नलिखित कोड आज़माया:

    model = arima(y, order(0,2,0), xreg = externaldata) 

क्या मैं इस कोड के साथ 2 साल से अधिक y मूल्य की भविष्यवाणी कर सकता हूं?

मैंने एक प्रतिगमन कोड भी आज़माया:

    reg = lm(y ~ x1 + x2 + x3) 

लेकिन मैं इस कोड में समय कैसे लगाऊं? मैं कैसे अनुमान लगा सकता हूं कि मेरा y मान 2 वर्षों में क्या होगा? मैं आँकड़ों और पूर्वानुमानों के लिए नया हूँ। मैंने लैग वैल्यू में कुछ रीडिंग और कैम किया है, लेकिन मैं पूर्वानुमान करने के लिए मॉडल में लैग वैल्यू का उपयोग कैसे कर सकता हूं?

वास्तव में मेरा समग्र सवाल यह है कि मैं भविष्य के मूल्य के साथ बाहरी चर के साथ एक समय श्रृंखला डेटा का पूर्वानुमान कैसे लगा सकता हूं?


समय श्रृंखला डेटा के साथ कभी भी प्रतिगमन का उपयोग न करें। एक ट्रांसफर फंक्शन मॉडल दृष्टिकोण का उपयोग करें।
टॉम रीली

2
हाय सर, क्या आप मुझे ट्रांसफर फंक्शन मॉडल के बारे में और बता सकते हैं? और मुझे समय श्रृंखला डेटा के साथ प्रतिगमन का उपयोग क्यों नहीं करना चाहिए? अधिकांश अध्ययन समय श्रृंखला के साथ पुन: उपयोग करने का सुझाव देते हैं।
एसबी

एक ट्रांसफर फंक्शन मॉडल को अध्याय 10 में बॉक्स-जेनकिंस पाठ्यपुस्तक में समझाया गया है। लक्ष्य प्रत्येक कारण (पूर्व-श्वेतकरण) के लिए एक मॉडल का निर्माण करना है और फिर वाई (क्रॉस सहसंबंध) के खिलाफ संबंध खोजने के लिए अवशिष्ट का उपयोग करना है। यह आपकी पहचान करने में मदद करेगा कि कौन से चर महत्वपूर्ण हैं और यदि कोई लीड या लैग संबंध है। एक्स चर पर इस समीकरण या हर में ARIMA की आवश्यकता हो सकती है। आपके पास आउटलेयर, ट्रेंड, स्तर, मौसमी, पैरामीटर और भिन्नता में परिवर्तन भी हो सकते हैं।
टॉम रीली

एक प्रतिगमन मानता है कि समय महत्वपूर्ण नहीं है। रिग्रेशन का उपयोग गैटन द्वारा स्वेट पीज़ का अध्ययन करने के लिए किया गया था ... समय श्रृंखला समस्या नहीं। ट्रांसफर फ़ंक्शन समस्या का अनुमान लगाने के लिए प्रक्रिया के कुछ हिस्सों का उपयोग करता है।
टॉम रीली

जवाबों:


11

यदि आप बाहरी चर का उपयोग करके एक मॉडल फिट करते हैं और इस मॉडल से पूर्वानुमान लगाना चाहते हैं, तो आपको बाहरी चर, सादे और सरल भविष्य के मूल्यों की आवश्यकता होगी। इसके अलावा कोई रास्ता नहीं है।

आपके व्याख्यात्मक चर का अनुमान लगाने के अलग-अलग तरीके हैं। आप अंतिम देखे गए मान ("भोला यादृच्छिक चलना" पूर्वानुमान) या समग्र माध्य का उपयोग कर सकते हैं। आप बस उन्हें शून्य पर सेट कर सकते हैं यदि यह उनके लिए एक उपयोगी मूल्य है (उदाहरण के लिए, भूकंप की तरह अतीत में हुई विशेष घटनाएं, जिन्हें आप पुनरावृत्ति करने का अनुमान नहीं लगाते हैं)। या आप इन व्याख्यात्मक चर के लिए एक समय श्रृंखला मॉडल को फिट और पूर्वानुमान कर सकते हैं, उदाहरण के लिए, उपयोग करते हुए auto.arima

वैकल्पिक मॉडल को बिना व्याख्यात्मक चर के बिना अपने मूल्यों के लिए एक मॉडल फिट करने के लिए है, फिर इस मॉडल का उपयोग करके का पूर्वानुमान लगाने के लिए । एक लाभ यह है कि यह आपके व्याख्यात्मक चर में नियमितताओं को भी पकड़ सकता है। उदाहरण के लिए, आपकी आइसक्रीम की बिक्री तापमान से हो सकती है, और आपके पास कुछ महीने पहले तापमान के लिए अच्छे पूर्वानुमान नहीं हैं ... लेकिन तापमान मौसमी है, इसलिए बस तापमान के बिना एक मॉडल को फिट करना एक मौसमी मॉडल, और आपका मौसमी पैदावार देता है। पूर्वानुमान वास्तव में बहुत अच्छा हो सकता है भले ही आप बिक्री के वास्तविक चालक को शामिल न करेंyxregy

मैं इस मुफ्त ऑनलाइन पूर्वानुमान पाठ्यपुस्तक की सिफारिश करता हूं , विशेष रूप से कई प्रतिगमन पर यह खंड (दुर्भाग्य से, वहाँ ARIMAX के बारे में कुछ भी नहीं है), साथ ही साथ रोब Hyndman के ब्लॉग पोस्ट "ARIMAX मॉडल कीचड़"


1

जैसा कि योगी बर्रा ने कहा, "भविष्यवाणियां करना कठिन है, खासकर भविष्य के बारे में।"

कई स्टेटस सॉफ्टवेयर मॉड्यूल भविष्य की जानकारी के अभाव में समय श्रृंखला की अविभाज्य धारा के आधार पर पूर्वानुमान उत्पन्न करेंगे, उदाहरण के लिए, एसएएस में प्रोक पूर्वानुमान या उपलब्ध एआरआईएमए मॉड्यूल की कोई संख्या। ये पूर्वानुमान आपके डेटा के ऐतिहासिक व्यवहार पर आधारित अनुमान हैं।

आप हमें बताएं कि आपका डेटा मासिक है, लेकिन हमें यह न बताएं कि आपके पास कितने पीरियड उपलब्ध हैं। एक अन्य दृष्टिकोण DV के सापेक्ष आपके तीन IVs को 24 महीने पहले सेट करना है ताकि वे जिस अवधि की भविष्यवाणी कर रहे हैं वह t + 24 है। यह मानता है कि आपके पास मॉडल को इनिशियलाइज़ करने और उपयुक्त के रूप में किसी भी प्रासंगिक सीज़न को कैलिब्रेट करने के लिए पर्याप्त मात्रा में डेट है।


मैंने अपना पाठ संपादित किया है। क्या आप मेरे सवालों का जवाब दे सकते हैं?
एसबी

यह देखते हुए कि आपके पास पर्याप्त मात्रा में जानकारी है, आपके मॉडल में समय को एकीकृत करने के कई तरीके हैं। आप वर्ष के लिए डमी चर बना सकते हैं (जैसे, 2009, 2010, आदि), क्वार्टर के लिए, समय श्रृंखला में प्रत्येक महीने के लिए या, मौसमी के लिए लेखांकन के दृष्टिकोण के रूप में, वर्ष के प्रत्येक महीने। एक अन्य दृष्टिकोण समय को सांख्यिक प्रवृत्ति समारोह के रूप में मानने के लिए होगा, जैसे, रैखिक (जनवरी 2009 = 1, फरवरी = 2, आदि के साथ शुरू होने वाली अवधि की गणना में) या रैखिक प्रवृत्ति के आधार पर बहुपदीय रुझानों की संख्या। जैसे, द्विघात (रैखिक प्रवृत्ति) और ऊपर। तुम और क्या जानना चाहते हो?
माइक हंटर

लेकिन समय एक उचित चर नहीं हो सकता है? तो मैं 3 बाहरी चर का उपयोग करके अपने y चर की भविष्यवाणी कैसे कर सकता हूं? मैं एक कठिन समय वास्तव में एक मॉडल का चयन कर रहा हूं जो भविष्यवाणी करेगा?
एसबी

जैसा कि पूर्व टिप्पणी में उल्लिखित है, समय एक स्वतंत्र चर होगा। मुझे लगता है कि आपको प्रतिगमन, अर्थमिति और समय श्रृंखला साहित्य पर पढ़ना चाहिए। इस साइट पर कई थ्रेड हैं जो इन सवालों को संबोधित करते हैं और लेख, किताबें आदि का सुझाव देते हैं, इस वेब पेज के दाहिने हाथ को अपनी चिंताओं से संबंधित अधिक थ्रेड्स के लिए ब्राउज़ करें।
माइक हंटर

मैंने बहुत कुछ किया है और मैं इसका समाधान नहीं कर पाया हूं। यही कारण है कि मैंने यह सवाल यहां पूछा है। क्या आप कुछ साहित्य के कुछ सूत्र बता सकते हैं जिनका मैं उपयोग कर सकता हूं? या सही वेब पेज?
एसबी

1

जैसा कि मैंने इसे देखा, आपके पास तीन विकल्प हैं:

  1. अपने स्वतंत्र चर के लिए प्रकाशित पूर्वानुमान का उपयोग करें या उन्हें पूर्वानुमान करने के लिए एक मॉडल खोजें। उदाहरण के लिए, जनगणना में अनुमानित जनसंख्या डेटा होगा।
  2. आपके पास मौजूद डेटासेट का उपयोग करते हुए, समय के खिलाफ अपने प्रत्येक स्वतंत्र चर को फिर से प्राप्त करें और फिर इन परिणामों का उपयोग करके स्वतंत्र चर के लिए अपने पूर्वानुमान मॉडल का उपयोग करें
  3. स्वतंत्र चर को गिराएं और अपने आश्रित चर को समय के कार्य के रूप में मॉडल करें और y के मानों को कम करें।

प्रत्येक दृष्टिकोण की अपनी ताकत और कमजोरियां हैं, इसलिए सबसे अच्छा विशिष्ट संदर्भ पर निर्भर करता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.