मॉडलिंग असमान रूप से समय श्रृंखला


12

मेरे पास एक निरंतर चर है, अनियमित अंतराल पर एक वर्ष की अवधि में नमूना। कुछ दिनों में प्रति घंटे एक से अधिक अवलोकन होते हैं, जबकि अन्य अवधियों में दिनों के लिए कुछ भी नहीं होता है। इससे विशेष रूप से समय श्रृंखला में पैटर्न का पता लगाना मुश्किल हो जाता है, क्योंकि कुछ महीने (उदाहरण के लिए अक्टूबर) अत्यधिक नमूना हैं, जबकि अन्य नहीं हैं।

यहाँ छवि विवरण दर्ज करें

मेरा सवाल यह है कि इस बार की श्रृंखला के लिए सबसे अच्छा तरीका क्या होगा?

  • मेरा मानना ​​है कि अधिकांश समय श्रृंखला विश्लेषण तकनीकों (जैसे एआरएमए) को एक निश्चित आवृत्ति की आवश्यकता होती है। मैं एक निरंतर नमूना रखने के लिए या बहुत विस्तृत होने वाले डेटा का उप-सेट चुनने के लिए, डेटा को एकत्र कर सकता था। दोनों विकल्पों के साथ मुझे मूल डेटासेट से कुछ जानकारी याद आ रही है, जो अलग पैटर्न का अनावरण कर सकती है।
  • श्रृंखलाओं को श्रृंखला में विघटित करने के बजाय, मैं पूरे डेटासेट के साथ मॉडल को खिला सकता हूं और यह उम्मीद कर सकता हूं कि यह पैटर्न उठाएगा। उदाहरण के लिए, मैंने श्रेणीबद्ध चर में घंटे, कार्यदिवस और महीने को बदल दिया और अच्छे परिणामों के साथ कई प्रतिगमन की कोशिश की (R2 = 71)

मेरा विचार है कि ANN जैसी मशीन सीखने की तकनीक भी असमान समय श्रृंखला से इन पैटर्न को चुन सकती है, लेकिन मैं सोच रहा था कि क्या किसी ने कोशिश की है, और मुझे न्यूरल नेटवर्क में समय के पैटर्न का प्रतिनिधित्व करने के सर्वोत्तम तरीके के बारे में कुछ सलाह दे सकता है।

जवाबों:


4

ARIMA, एक्सपोनेंशियल स्मूथिंग और अन्य को वास्तव में समान रूप से स्पेस नमूना बिंदुओं की आवश्यकता होती है। जैसा कि आप लिखते हैं, आप अपने डेटा को बकेटिज़ कर सकते हैं (दिनों में कह सकते हैं), लेकिन जैसा कि आप लिखते हैं, आप जानकारी खो देंगे। इसके अलावा, आप लापता मानों को समाप्त कर सकते हैं, इसलिए आपको अशुद्ध करने की आवश्यकता होगी, क्योंकि ARIMA लापता मानों को संभालने में बहुत अच्छा नहीं है।

एक विकल्प, जैसा कि आप फिर से लिखते हैं, एक प्रतिगमन ढांचे में समय की डमी को खिलाना है। मुझे व्यक्तिगत रूप से श्रेणीबद्ध डमीज़ पसंद नहीं है, क्योंकि इसका मतलब पड़ोसी श्रेणियों के बीच एक तेज कटऑफ है। यह आमतौर पर बहुत स्वाभाविक नहीं है। इसलिए मैं समय-समय पर विभिन्न आवधिकताओं के साथ आवधिक विभाजन को देखता रहूंगा। इस दृष्टिकोण का आपके असमान नमूने से निपटने और लापता मूल्यों के साथ लाभ है।

R2

अंत में, मॉडलिंग को ज़्यादा मत करो। बस अपने डेटा को नेत्रगोलक से, यह स्पष्ट है कि जून में कुछ हुआ, अगस्त में एक दिन और सितंबर / अक्टूबर में। मैं आपको सबसे पहले दिखाई क्या यह सुझाव है कि कुछ था और के रूप में व्याख्यात्मक चर (जो आप ARIMAX में शामिल कर सकते हैं यदि आप चाहते हैं), अपने मॉडल, जैसे में इस में शामिल हैं। वहां जो हुआ वह जाहिर तौर पर मौसमी नहीं है।


0

चूँकि आपके सवाल और @Stephan Kolassa के अच्छे उत्तर पर ARIMA और न्यूरल नेटवर्क पर विशेष रूप से चर्चा की गई थी, इसलिए मैं यह उल्लेख करना चाहता था कि आप forecastपैकेज को Rएक बार में दे सकते हैं - इसमें एक nnetarफ़ंक्शन है जो 1 छिपी हुई परत के साथ एक सरल फीड फॉरवर्ड न्यूरल नेटवर्क को प्रशिक्षित करता है। पिछड़ गए इनपुट्स

शायद आप की तर्ज पर कुछ करने की कोशिश करें:

  • अपने प्रत्येक अवलोकन के लिए कई विशेषताएं निकालें जैसे सप्ताह का दिन, महीने का दिन, सप्ताह का दिन / सप्ताहांत आदि (केवल डेटाटाइम का उल्लेख आपके प्रश्न में संभावित निर्भरता के रूप में किया गया है, इसलिए मैंने इसे शामिल किया है - लेकिन आप उन सभी संभावित चीजों को शामिल कर सकते हैं जो आप विश्वास आपकी रुचि के चर को प्रभावित कर सकता है)।
  • आपके परिवर्तनीय ब्याज के अंतराल के साथ-साथ डेटाटाइम जानकारी (जैसे सप्ताह का दिन आदि) आपके इनपुट होंगे। आप xregउदाहरण के लिए बाहरी रेजिस्टर ( ) के रूप में डेटाटाइम चर शामिल कर सकते हैं ।

और इन निविष्टियों के आधार पर आपकी रुचियों के भविष्य के मूल्यों की भविष्यवाणी करें। इसके अतिरिक्त, आप यह भी सोच सकते हैं कि जिस मूल्य की आप भविष्यवाणी करना चाहते हैं, उसके प्रत्येक दिन मनाया गया मतलब और भिन्नता / विचलन शामिल है। इसका मतलब यह होगा कि आपको पहले अपने अपेक्षित माध्य और विचरण का अनुमान लगाना होगा जैसे कि ARIMA फिर उपरोक्त दृष्टिकोण के अतिरिक्त इनपुट के रूप में जोड़ें।

hth।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.