समय श्रृंखला मॉडल को इकट्ठा करें


13

मुझे समय-श्रृंखला पूर्वानुमान को स्वचालित करने की आवश्यकता है, और मैं उन श्रृंखलाओं (मौसमी, प्रवृत्ति, शोर, आदि) की विशेषताओं को पहले से नहीं जानता।

मेरा उद्देश्य प्रत्येक श्रृंखला के लिए सर्वोत्तम संभव मॉडल प्राप्त करना नहीं है, बल्कि बहुत खराब मॉडलों से बचना है। दूसरे शब्दों में, हर बार छोटी त्रुटियों को प्राप्त करना कोई समस्या नहीं है, लेकिन बड़ी त्रुटियों को एक बार में प्राप्त करना है।

मैंने सोचा कि विभिन्न तकनीकों के साथ गणना किए गए मॉडल के संयोजन से मैं इसे प्राप्त कर सकता हूं।

यही है, हालांकि ARIMA एक विशिष्ट श्रृंखला के लिए सबसे अच्छा तरीका होगा, यह किसी अन्य श्रृंखला के लिए सबसे अच्छा नहीं हो सकता है; घातीय चौरसाई के लिए भी यही है।

हालाँकि, यदि मैं प्रत्येक तकनीक से एक मॉडल को जोड़ती हूं, भले ही एक मॉडल इतना अच्छा न हो, दूसरा अनुमान को वास्तविक मूल्य के करीब लाएगा।

यह सर्वविदित है कि ARIMA दीर्घकालिक अच्छी तरह से व्यवहार वाली श्रृंखला के लिए बेहतर काम करता है, जबकि घातीय चौरसाई अल्पकालिक शोर श्रृंखला के साथ बाहर खड़ा है।

  • मेरा विचार अधिक मजबूत पूर्वानुमान प्राप्त करने के लिए दोनों तकनीकों से उत्पन्न मॉडल को संयोजित करना है, क्या इसका कोई मतलब है?

उन मॉडलों को संयोजित करने के कई तरीके हो सकते हैं।

  • यदि यह एक अच्छा तरीका है, तो मुझे उन्हें कैसे संयोजित करना चाहिए?

पूर्वानुमान का एक सरल मतलब एक विकल्प है, लेकिन हो सकता है कि मैं मॉडल के कुछ अच्छाई माप के अनुसार मतलब का वजन करूं तो मुझे बेहतर भविष्यवाणियां मिल सकती हैं।

  • मॉडल के संयोजन के समय विचरण का उपचार क्या होगा?

आपके विचार बहुत अच्छे लगते हैं, लेकिन मैं ARIMA मॉडल के स्वतः फिट होने के बारे में इतना निश्चित नहीं हूं । शायद एकतरफा श्रृंखला के लिए ... परम्परागत ज्ञान यह है कि होल्ट-विंटर्स स्वचालित रूप से बहुत मजबूत उपयोग किया जाता है, ताकि तरीकों के बीच आउट-ऑफ-सैंपल तुलना के लिए आपकी आधार रेखा बन सके।
Scortchi - को पुनः स्थापित मोनिका

@Scortchi मैं यह उल्लेख करना भूल गया कि सभी श्रृंखलाएं एकतरफा हैं! ;) मैं मानता हूं कि होल्ट-विंटर्स स्वचालित रूप से उपयोग किए जाने पर वास्तव में अच्छा प्रदर्शन करते हैं, लेकिन मैं एक और मॉडल से एक और राय प्राप्त करने का इरादा रखता हूं, उन मामलों से बचने के लिए जहां पूर्वानुमान इतने अच्छे नहीं हैं। कभी-कभी एचडब्ल्यू अजीब प्रवृत्ति व्यवहार दिखाता है।
जोहो डैनियल

1
यहां तक ​​कि एकतरफा मामले में मैं एक स्वचालित प्रक्रिया की कल्पना करने के लिए संघर्ष करता हूं - इसके बारे में सोचने के लिए प्रवृत्ति (स्टोचस्टिक या नियतात्मक), संभव परिवर्तन, मौसमी (गुणात्मक या additive) है, और मुझे लगता है कि एक मॉडल को प्राप्त करने के लिए मैं पूर्व ज्ञान का बहुत उपयोग करता हूं इस बारे में क्या समझ में आता है कि एक विशेष श्रृंखला वास्तविकता में क्या दर्शाती है। फिर भी, पुडिंग का प्रमाण खाने में है - मैं वास्तव में सिर्फ इतना कहना चाहता था कि सरल तकनीकों के साथ आउट-ऑफ-नमूना तुलना करने के लिए मत भूलना- इसलिए इसके साथ शुभकामनाएं।
Scortchi - को पुनः स्थापित मोनिका

जवाबों:


15

पूर्वानुमान का संयोजन एक उत्कृष्ट विचार है। (मुझे लगता है कि यह कहना अतिश्योक्ति नहीं होगी कि यह उन कुछ चीजों में से एक है, जिन पर अकादमिक पूर्वानुमान सहमत हैं।)

मुझे लगता है कि कुछ समय पहले उनके संयोजन में वजन के पूर्वानुमान के विभिन्न तरीकों को देखते हुए एक पेपर लिखा गया था: http://www.sciencedirect.com/science/article/pii/S0169207010001032 मूल रूप से, (एकैके) का उपयोग करके संयोजन में लगातार सुधार नहीं हुआ था सरल या छंटनी / जीत गए साधनों या मध्यस्थों से अधिक है, इसलिए मैं व्यक्तिगत रूप से एक जटिल प्रक्रिया को लागू करने से पहले दो बार सोचूंगा, जो निश्चित लाभ नहीं दे सकता है (याद रखें, हालांकि, यह संयोजन सूचना मानदंडों द्वारा लगातार एकल तरीकों से बेहतर प्रदर्शन करता है)। यह आपके पास निश्चित रूप से विशेष समय श्रृंखला पर निर्भर हो सकता है।

मैंने ऊपर कागज में भविष्यवाणी अंतराल के संयोजन को देखा, लेकिन इस तरह के विचरण के संयोजन पर नहीं। मुझे लगता है कि IJF में इस फ़ोकस के साथ बहुत समय पहले एक पेपर याद नहीं है , इसलिए आप IJF के बैक मुद्दों के माध्यम से "संयोजन" या "संयोजन" की खोज करना चाहते हैं।

कुछ अन्य कागजात जो संयोजन के पूर्वानुमानों पर नज़र डालते हैं, वे यहाँ हैं (1989 से, लेकिन एक समीक्षा) और यहाँ और यहाँ (घनत्व को भी देखता है) और यहाँ और यहाँ। इनमें से कई ध्यान दें कि यह अभी भी बुरी तरह से समझा जाता है कि पूर्वानुमान संयोजन अक्सर एकल चयनित मॉडल से बेहतर प्रदर्शन क्यों करते हैं। एम-थ्री पूर्वानुमान प्रतियोगिता पर दूसरा-से-अंतिम पेपर है; उनके मुख्य निष्कर्षों में से एक था (संख्या (पी) 458 पर)) कि "विभिन्न विधियों के बेहतर प्रदर्शन के संयोजन की सटीकता, औसतन विशिष्ट तरीकों को संयुक्त किया जा रहा है और अन्य तरीकों की तुलना में अच्छी तरह से करता है।" इन पत्रों में से आखिरी में पाया गया है कि संयोजन आवश्यक रूप से एकल मॉडलों की तुलना में बेहतर प्रदर्शन नहीं करते हैं, लेकिन यह कि वे भयावह विफलता के जोखिम को कम कर सकते हैं (जो आपके लक्ष्यों में से एक है)। अधिक साहित्य आसानी से में पाया जाना चाहिए पूर्वानुमान के इंटरनेशनल जर्नल , पूर्वानुमान के जर्नल और अर्थमिति या आपूर्ति श्रृंखला साहित्य में अधिक विशिष्ट अनुप्रयोगों के लिए।


1
मॉडल के संयोजन के बारे में शानदार दृष्टिकोण! आपका उत्तर बहुत रचनात्मक था!
जोआओ डैनियल

@ स्टेफान कोलासा, क्या आप आगे और पिछड़े भविष्यवाणियों के संयोजन पर कोई टिप्पणी करेंगे, जैसा कि बर्ग की विधि में है?
डेनिस

@ हेडिस: मैं फॉरवर्ड या बैकवर्ड प्रेडिक्टर्स से परिचित नहीं हूं, न ही बर्ग के तरीके के साथ, सॉरी ... हालांकि मैं यह मानूंगा कि पूर्वानुमान / भविष्यवाणियों (उर्फ पहनावा के तरीकों) का संयोजन आमतौर पर फायदेमंद होगा।
Stephan Kolassa

हाय स्टीफ़न, बढ़िया लेख। ऐसा लगता है कि पत्रिका साइट बदल गई है और अब मुख्य साइट से अपना आर कोड डाउनलोड करना संभव नहीं है। क्या अब इसे एक अलग साइट पर होस्ट किया जा रहा है?
इयान

@ यदि आप सदस्यता नहीं लेते हैं तो आपके पास इसका उपयोग नहीं हो सकता है। मुझे एक ईमेल भेजें ( यहां मेरा पता ढूंढें ), मैं स्क्रिप्ट भेज दूंगा। उन्हें खोदने के लिए मुझे कुछ दिन दीजिए।
Stephan Kolassa

1

इसे आगे क्यों नहीं बढ़ाया? मुझे नहीं लगता कि आपके द्वारा उत्पादित कोई भी एक मॉडल एक विशिष्ट विकल्प से बेहतर या अच्छा हो सकता है।

इसके साथ ही, यदि आप अपनी पसंद को उन लोगों तक सीमित कर सकते हैं जिनके लिए आप परीक्षण कर सकते हैं, और डेटा इनपुट को मानकीकृत किया जा सकता है, तो फिर आर में एक स्वचालित परीक्षण प्रक्रिया क्यों नहीं लिखनी चाहिए?

मान लें कि आप तय करते हैं कि आपका डेटा पांच मॉडलों द्वारा अनुमानित सीमा के भीतर गिर जाएगा और साथ ही एक "कमबैक" भी होगा। कहते हैं कि आप विभिन्न परीक्षणों द्वारा इनपुट को चिह्नित कर सकते हैं। फिर बस आगे बढ़ो और एक आर (या उस तरह का एक प्रोग्राम) एल्गोरिदम लिखें जो आपके लिए यह चलाता है। यह तब काम करता है जब आप परीक्षण डेटा के आधार पर किस मॉडल का फ़्लोचार्ट चला सकते हैं, यदि निर्णय ट्री का कोई भी बिंदु बाइनरी है।

यदि यह एक विकल्प नहीं है क्योंकि निर्णय बाइनरी नहीं हो सकता है, तो मेरा सुझाव है कि आप लागू परीक्षणों के आधार पर एक रेटिंग प्रणाली लागू करें और परिणाम देखने के लिए अपने ग्रिड के माध्यम से कुछ "चरम मामलों" सिम्युलेटेड डेटा को चलाएं कि क्या आप देख रहे हैं।

आप इन चीजों को स्पष्ट रूप से जोड़ सकते हैं, उदाहरण के लिए गैर-स्टेशनरिटी के लिए परीक्षण एक निश्चित हां-ना दे सकता है, जबकि अन्य विशेषताओं में एक रेंज में गिरावट हो सकती है जैसे कि मल्टीकोलिनरिटी।
आप इसे पहले कागज पर खींच सकते हैं, फिर इसे बना सकते हैं, इसे उन ज्ञात वितरणों के साथ अनुकरण कर सकते हैं, जिनकी आपको उम्मीद है।

फिर बस आर प्रोग्राम चलाएं हर बार नया डेटा आता है। मुझे आपके द्वारा सम्भावित कम्प्यूटेशनल क्षमताओं के साथ कई मॉडलों को संयोजित करने की कोई आवश्यकता नहीं है।


नीचे दिए गए विकल्पों को कम करना एक अच्छा विचार है, जैसे गैर-मौसमी तरीकों का उपयोग न करना यदि डेटा स्पष्ट रूप से मौसमी है। लेकिन फिर भी, मैं यह तर्क दूंगा कि कई मौसमी मॉडल (additive बनाम बहुसांस्कृतिक मौसमी, औसत या प्रवृत्ति के बिना आदि) के औसत औसत पूर्वानुमान सटीकता में सुधार होगा । कम से कम यह धारणा है कि मुझे पूर्वानुमान समुदाय के साथ-साथ एम 3 और इसी तरह की पूर्वानुमान प्रतियोगिताओं के लिए काफी जोखिम है।
स्टीफ़न कोलासा

क्या आपके पास इस पर अतिरिक्त कागजात हैं? मेरा मतलब है कि यह एक सीधे-आगे के लिए प्रासंगिक शोध विषय होगा। बहुत दिलचस्प विचार है, हालांकि सिर्फ सहज ज्ञान युक्त मैं इस बात से सहमत नहीं हूं कि यह आवश्यक रूप से मॉडलों के गतिशील ग्रिड से बेहतर होगा।
आईएमए

अच्छी बात। मैंने अधिक साहित्य बिंदुओं के साथ एक अतिरिक्त पैराग्राफ को शामिल करने के लिए अपने उत्तर को संपादित किया। मैं मानता हूं कि यह सीधा और प्रासंगिक है, और यह अभी भी खराब तरीके से समझा जाता है कि पूर्वानुमान का पूर्वानुमान आमतौर पर सटीकता में सुधार क्यों करता है।
स्टीफन कोलासे

हाँ, मेरा मतलब है कि आप सभी प्रकार की वितरण संबंधी समस्याओं को मॉडल कर सकते हैं और इस पर कम्प्यूटेशनल और मौलिक रूप से हमला कर सकते हैं। कागजात के लिए धन्यवाद, बहुत दिलचस्प।
आईएमए

0

दो पूर्वानुमान विधियों के संयोजन के लिए एक अच्छा और सरल सूत्र है, आप सिर्फ उन्हें पहले (और - 1) द्वारा दूसरे से गुणा करते हैं, जहां इस संयुक्त पूर्वानुमान के विचरण को कम करके पाया जाता है। जैसा कि आप दोनों पूर्वानुमान विधियों की त्रुटियों को जानते हैं, आप संयोजन की त्रुटियों की गणना कर सकते हैं जो कि "ए" पर निर्भर करेगा। गणना सरल है जब प्रत्येक विधि का अर्थ = 0. 2 से अधिक विधियों के संयोजन के लिए सूत्र अभी भी "सरल" इस अर्थ में है कि आप इसे विश्लेषणात्मक रूप से "हाथ से" गणना कर सकते हैं, या EXCEL से सॉल्वर विकल्प का भी उपयोग कर सकते हैं


क्या आप इस विधि का संदर्भ दे सकते हैं।
राशिफल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.