समय-श्रृंखला मॉडलिंग के लिए राज्य-अंतरिक्ष मॉडल और कलमन फ़िल्टर के नुकसान क्या हैं?


53

राज्य-अंतरिक्ष मॉडल और केएफ के सभी अच्छे गुणों को देखते हुए, मुझे आश्चर्य है कि - अनुमान के लिए राज्य-अंतरिक्ष मॉडलिंग और कलमन फ़िल्टर (या ईकेएफ, यूकेएफ या कण फिल्टर) का उपयोग करने के क्या नुकसान हैं ? आइए हम कहते हैं कि पारंपरिक पद्धति जैसे एआरआईएमए, वीएआर या एड-हॉक / हेयुरिस्टिक तरीके।

क्या उन्हें जांचना मुश्किल है? क्या वे जटिल और कठिन हैं कि एक मॉडल की संरचना में बदलाव भविष्यवाणियों को कैसे प्रभावित करेगा?

या, एक और तरीका है - राज्य अंतरिक्ष मॉडल पर पारंपरिक ARIMA, VAR के फायदे क्या हैं?

मैं केवल राज्य-अंतरिक्ष मॉडल के लाभों के बारे में सोच सकता हूं :

  1. यह आसानी से कुछ स्थिर मॉडल के संरचनात्मक विराम, पारियों, समय-भिन्न मापदंडों को संभालता है - बस उन मापदंडों को एक राज्य-अंतरिक्ष मॉडल के गतिशील राज्य बनाते हैं और मॉडल स्वचालित रूप से मापदंडों में किसी भी बदलाव को समायोजित करेगा;
  2. यह लापता डेटा को बहुत स्वाभाविक रूप से संभालता है, बस KF के ट्रांज़िशन स्टेप और अपडेट स्टेप को न करें;
  3. यह एक स्टेट-स्पेस मॉडल के ऑन-द-फ्लाई मापदंडों को बदलने की अनुमति देता है (शोर और संक्रमण / अवलोकन मैट्रिसेस के सहसंबंध) ताकि यदि आपका वर्तमान अवलोकन दूसरों की तुलना में थोड़ा अलग स्रोत से आया हो - तो आप इसे बिना किए अनुमानों में आसानी से शामिल कर सकते हैं कुछ खास;
  4. उपरोक्त गुणों का उपयोग करने से यह आसानी से अनियमित-अंतरित डेटा को संभालने की अनुमति देता है: या तो टिप्पणियों के बीच अंतराल के अनुसार हर बार एक मॉडल बदलें या नियमित अंतराल का उपयोग करें और लापता डेटा के रूप में टिप्पणियों के बिना अंतराल का इलाज करें;
  5. यह एक अंतर्निहित मात्रा का अनुमान लगाने के लिए एक ही मॉडल में एक साथ विभिन्न स्रोतों से डेटा का उपयोग करने की अनुमति देता है;
  6. यह कई व्याख्यात्मक अप्रचलित गतिशील घटकों से एक मॉडल का निर्माण करने और उन्हें अनुमान लगाने की अनुमति देता है;
  7. किसी भी ARIMA मॉडल को राज्य-स्थान के रूप में दर्शाया जा सकता है, लेकिन ARIMA रूप में केवल साधारण राज्य-स्थान मॉडल का ही प्रतिनिधित्व किया जा सकता है।

1
JFew अतिरिक्त लाभ, जैसा कि आपके पहले बिंदु में उल्लेख किया गया है, आसानी से कई स्तर के बदलाव और आउटलेर को शामिल कर सकते हैं। मेरे अनुभव में संरचनात्मक चोटों को एआरआईएमए की तुलना में राज्य स्थान के साथ आसानी से पहचाना जा सकता है। इसके अलावा आसानी से बहिर्जात चर के nonlinear प्रभाव को शामिल कर सकते हैं। समय श्रृंखला डेटा को स्थिर होने की आवश्यकता नहीं है जो एक विशाल + है।
फोरकास्टर

2
वैसे मैं किसी भी समय ARIMA पर राज्य अंतरिक्ष मॉडल ले लूंगा। मैं दो नुकसानों (प्रकार) के बारे में सोच सकता हूं: ए) एआईआईएमए मॉडल के संगत राज्य अंतरिक्ष मॉडल में डिजाइन मैट्रिसेस में बहुत सारे अनावश्यक शून्य हैं। एक तर्क दे सकता है कि ARIMA अधिक कॉम्पैक्ट है। बी) गैर-रेखीय / गैर-गाऊसी मॉडल हैं जिनके पास शायद ही कभी विश्लेषणात्मक रूप होते हैं जिन्हें कभी-कभी एआरआईएमए के रूप में वर्णित किया जा सकता है, लेकिन पारंपरिक राज्य-स्थान में मुश्किल होगा।
कागदस ओजेंक

2
@Kochede Durbin और Koopman कई नुकसानों के बारे में सोच भी नहीं सकते थे - उन्होंने अपनी शानदार पाठ्यपुस्तक में पृष्ठ 52 के नीचे दो का उल्लेख किया । और मैं कहूंगा कि ये नुकसान अब जरूरी नहीं हैं।

2
कुछ प्रश्न । क्या यह स्पष्ट रूप से समय की प्रवृत्ति में बदलाव की पहचान करता है और समय में उन बिंदुओं की रिपोर्ट करता है जहां प्रवृत्ति में परिवर्तन होता है? क्या यह पैरामीटर परिवर्तन और त्रुटि परिवर्तन के बीच अंतर करता है और इस पर रिपोर्ट करता है? क्या यह उपयोगकर्ता निर्दिष्ट भविष्यवक्ताओं के आसपास विशिष्ट लीड और अंतराल प्रभावों का पता लगाता है और रिपोर्ट करता है? क्या कोई समूह शिफ्ट / स्थानीय समय प्रवृत्ति घोषित होने से पहले किसी समूह में न्यूनतम मान निर्दिष्ट कर सकता है? क्या यह शक्ति परिवर्तन की आवश्यकता के बीच अंतर को निर्धारित करता है कि समय में नियतात्मक बिंदु कहाँ त्रुटि परिवर्तन होता है? ARMAX मॉडल इन सभी विचारों पर बात करते हैं।
आयरिशस्टैट

1
पूर्णता के लिए, कुछ परिस्थितियों में एक नुकसान यह है कि आपको उन्हें समझाना होगा। जो आपके दर्शकों पर निर्भर करता है। मुझे खुशी है कि अगर कोई इसे किसी ऐसी चीज के रूप में खारिज करना चाहता है जो एक तकनीक को चुनने के लिए अप्रासंगिक हो।
निक कॉक्स

जवाबों:


25

यहाँ नुकसान की कुछ प्रारंभिक सूची है जो मैं आपकी टिप्पणियों से निकालने में सक्षम था। आलोचना और परिवर्धन बहुत स्वागत है!

कुल मिलाकर - एआरआईएमए की तुलना में, राज्य-अंतरिक्ष मॉडल आपको अधिक जटिल प्रक्रियाओं को मॉडल करने की अनुमति देते हैं, व्याख्यात्मक संरचना रखते हैं और आसानी से डेटा अनियमितताओं को संभालते हैं; लेकिन इसके लिए आप एक मॉडल की बढ़ी हुई जटिलता, कठिन अंशांकन, कम सामुदायिक ज्ञान के साथ भुगतान करते हैं।

  1. ARIMA एक सार्वभौमिक सन्निकटन है - आपको परवाह नहीं है कि आपके डेटा के पीछे का सही मॉडल क्या है और आप इस मॉडल को अनुमानित करने के लिए सार्वभौमिक ARIMA डायग्नोस्टिक और फिटिंग टूल का उपयोग करते हैं । यह एक बहुपद वक्र फिटिंग की तरह है - आपको परवाह नहीं है कि सही कार्य क्या है, आप हमेशा इसे कुछ डिग्री के बहुपद के साथ अनुमानित कर सकते हैं।
  2. राज्य-अंतरिक्ष मॉडल को स्वाभाविक रूप से आपको अपनी प्रक्रिया के लिए कुछ उचित मॉडल लिखने की आवश्यकता होती है (जो कि अच्छा है - आप अनुमानों को बेहतर बनाने के लिए अपनी प्रक्रिया के अपने पूर्व ज्ञान का उपयोग करते हैं)। बेशक, अगर आपको अपनी प्रक्रिया का कोई अंदाजा नहीं है, तो आप हमेशा कुछ सार्वभौमिक राज्य-स्थान मॉडल का भी उपयोग कर सकते हैं - जैसे कि राज्य-स्थान के रूप में ARIMA का प्रतिनिधित्व करते हैं। लेकिन तब एआरआईएमए अपने मूल रूप में अधिक पारिश्रमिक तैयार करता है - अनावश्यक छिपे हुए राज्यों को शुरू किए बिना।
  3. क्योंकि राज्य-अंतरिक्ष मॉडल योगों की इतनी बड़ी विविधता है (ARIMA मॉडल के वर्ग की तुलना में अधिक समृद्ध), इन सभी संभावित मॉडलों के व्यवहार का अच्छी तरह से अध्ययन नहीं किया गया है और यदि आपके द्वारा तैयार किया गया मॉडल जटिल है - यह कहना मुश्किल है कि यह कैसे व्यवहार करेगा विभिन्न परिस्थितियों में। बेशक, यदि आपका राज्य-स्थान मॉडल सरल है या व्याख्या योग्य घटकों से बना है, तो ऐसी कोई समस्या नहीं है। लेकिन ARIMA हमेशा ARIMA का समान अध्ययन किया जाता है, इसलिए इसके व्यवहार का अनुमान लगाना आसान होना चाहिए, भले ही आप इसका उपयोग किसी भी जटिल प्रक्रिया के लिए करें।
  4. क्योंकि राज्य-अंतरिक्ष आपको सीधे और बिल्कुल मॉडल जटिल / गैर-मॉडल मॉडल की अनुमति देता है, तो इन जटिल / गैर-मॉडल मॉडल के लिए आपको फ़िल्टरिंग / भविष्यवाणी (EKF / UKF विचलन, कण फिल्टर गिरावट) की स्थिरता के साथ समस्या हो सकती है। आपको जटिल-मॉडल के मापदंडों को कैलिब्रेट करने में भी समस्या हो सकती है - यह एक कम्प्यूटेशनल रूप से कठिन अनुकूलन समस्या है। ARIMA सरल है, इसमें कम पैरामीटर हैं (2 शोर स्रोतों के बजाय 1 शोर स्रोत, कोई छिपा हुआ चर नहीं है) इसलिए इसका अंशांकन सरल है।
  5. राज्य-स्थान के लिए ARIMA की तुलना में सांख्यिकीय समुदाय में सामुदायिक ज्ञान और सॉफ्टवेयर कम है।

1
क्या आप किसी ऐसे वास्तविक उदाहरण / औद्योगिक अनुप्रयोगों के बारे में जानते हैं जिसमें एक कलमन फ़िल्टर एक सरल चलती औसत से बेहतर प्रदर्शन करता है या एक समय श्रृंखला का पूर्वानुमान लगाने में आसानी से समाप्त हो जाता है, बशर्ते कोई स्पष्ट अंतर्निहित मॉडल नहीं है (इसलिए भौतिकी के नियमों से उत्पन्न मॉडल को बाहर करें) ? अधिकांश कागजात में प्रदर्शन बहुत समान दिखता है (और शैक्षणिक कागजात में नए, मूल, जटिल मॉडल के लिए सकारात्मक प्रदर्शन पूर्वाग्रह है)। अधिकांश मामलों में एक उचित रेखीय राज्य प्रणाली मॉडल और सहसंयोजन, आदि का कोई ज्ञान नहीं होता है,
जिसे कल्मन

यह सच है। फिर भी मेरे व्यवहार में एक उदाहरण है। जब आपके पास कुछ सामान्य उद्देश्य मॉडल (जैसे रैखिक प्रतिगमन) होता है तो आप इसके मापदंडों को कलमन फ़िल्टर की स्थिति बना सकते हैं और उन्हें गतिशील रूप से अनुमान लगा सकते हैं। बेशक, आप प्रत्येक टाइम-स्टेप पर अपने मॉडल को सिर्फ रिफ़ाइंड कर सकते हैं, लेकिन एकल एफएफ़ अपडेट की तुलना में यह अधिक कम्प्यूटेशनल रूप से महंगा है। यदि वास्तव में पैरामीटर वास्तव में समय के साथ बदलते हैं या यदि आप मॉडल बिल्कुल वास्तविक प्रक्रिया से मेल नहीं खाते हैं - तो यह आपके मॉडल को बेहतर ढंग से फिट करने और इसके प्रदर्शन को बेहतर बनाने में मदद कर सकता है।
कोकडे

1
मुझे ARIMA के लिए आपकी पोस्ट के अलावा किसी अन्य सार्वभौमिक यूनिवर्सल सन्निकट होने का कोई संदर्भ नहीं मिल रहा है। क्या आप मुझे एक की ओर इशारा कर सकते हैं?
स्कैंडल एच।

2
@ एलेक्स का यह वॉल्ड के अपघटन प्रमेय से होता है, उदाहरण के लिए यहां देखें phdeconomics.sssup.it/documents/Lesson11.pdf
Kochede

1
क्या मैं कह सकता हूं कि राज्य के अंतरिक्ष मॉडल में अधिक सामान्य रूप है और ARIMA केवल इसका सबसेट कवर करता है?
विक्की जयंती

3

धन्यवाद @IrishStat टिप्पणियों में कई बहुत अच्छे सवालों के लिए, आपके सवालों का जवाब टिप्पणी के रूप में पोस्ट करने के लिए बहुत लंबा है, इसलिए मैं इसे उत्तर के रूप में पोस्ट करता हूं (दुर्भाग्य से, विषय के मूल प्रश्न के लिए नहीं)।

प्रश्न थे: " क्या यह स्पष्ट रूप से समय की प्रवृत्ति में बदलाव की पहचान करता है और उन बिंदुओं की रिपोर्ट करता है जहां प्रवृत्ति में परिवर्तन होता है? क्या यह पैरामीटर परिवर्तन और त्रुटि परिवर्तन के बीच अंतर करता है और इस पर रिपोर्ट करता है? क्या यह उपयोगकर्ता के चारों ओर विशिष्ट लीड और अंतराल प्रभावों का पता लगाता है और रिपोर्ट करता है?" निर्दिष्ट भविष्यवाणियां? क्या कोई समूह में किसी मान की न्यूनतम संख्या निर्दिष्ट कर सकता है इससे पहले कि वह किसी स्तर की शिफ्ट / स्थानीय समय की प्रवृत्ति घोषित हो? क्या यह उस समय के सत्ता परिवर्तन बनाम निर्धारक बिंदुओं की आवश्यकता के बीच अंतर करता है जहां त्रुटि परिवर्तन होता है? "

  1. प्रवृत्ति परिवर्तनों को पहचानें - हाँ, सबसे स्वाभाविक रूप से, आप ट्रेंड-स्लोप को राज्य-चर में से एक बना सकते हैं और केएफ लगातार वर्तमान ढलान का अनुमान लगाएंगे। फिर आप तय कर सकते हैं कि ढलान-परिवर्तन आपके लिए कितना बड़ा है। वैकल्पिक रूप से, यदि ढलान आपके राज्य-अंतरिक्ष मॉडल में समय-भिन्न नहीं है, तो आप मानक तरीके से फ़िल्टर करने के दौरान अवशेषों का परीक्षण कर सकते हैं कि यह देखने के लिए कि आपके मॉडल का कुछ विराम कब है।
  2. मापदंडों में परिवर्तन और त्रुटि परिवर्तन के बीच अंतर - परिवर्तन, हाँ, भिन्नता मापदंडों (राज्यों) में से एक हो सकती है, फिर सबसे अधिक संभावना है कि किस पैरामीटर में परिवर्तन आपके मॉडल की संभावना पर निर्भर करता है और विशेष रूप से डेटा कैसे बदल गया है।
  3. लीड / लैग संबंधों का पता लगाएं - इस बारे में सुनिश्चित नहीं हैं, आप निश्चित रूप से किसी भी अंतराल वाले वेरिएंट को राज्य-स्थान मॉडल में शामिल कर सकते हैं; लैग्स के चयन के लिए , आप या तो अलग-अलग लैग के साथ मॉडल के अवशेषों का परीक्षण कर सकते हैं या, एक साधारण मामले में, बस एक मॉडल बनाने से पहले क्रॉस-कोरलोग्राम का उपयोग करें।
  4. प्रवृत्ति परिवर्तन तय करने के लिए टिप्पणियों की दहलीज संख्या निर्दिष्ट करें - हाँ, 1 के रूप में) क्योंकि फ़िल्टरिंग को पुनरावर्ती रूप से किया जाता है, आप न केवल थ्रेशोल्ड ढलान परिवर्तन कर सकते हैं जो आपके लिए बहुत बड़ा है, बल्कि आत्मविश्वास के लिए # अवलोकन भी है। लेकिन बेहतर - केएफ न केवल ढलान का अनुमान पैदा करता है, बल्कि इस अनुमान के लिए आत्मविश्वास बैंड भी है , इसलिए आप यह तय कर सकते हैं कि ढलान में काफी बदलाव आया जब इसका आत्मविश्वास कुछ सीमा से गुजर गया।
  5. शक्ति-परिवर्तन की आवश्यकता और बड़े विचरण की आवश्यकता के बीच अंतर - निश्चित नहीं कि मैं सही समझता हूं, लेकिन मुझे लगता है कि आप फ़िल्टरिंग के दौरान अवशेषों का परीक्षण कर सकते हैं यह देखने के लिए कि क्या वे अभी भी बड़े विचरण के साथ सामान्य हैं या उन्हें कुछ तिरछा मिला है ताकि आपको बदलने की आवश्यकता हो आपका मॉडल बेहतर - आप इसे अपने मॉडल की एक बाइनरी स्विचिंग स्थिति बना सकते हैं, फिर केएफ इसकी संभावना का अनुमान लगाएगा। इस मामले में मॉडल गैर-रैखिक होगा ताकि आपको फ़िल्टर करने के लिए यूकेएफ की आवश्यकता होगी।

1

कलमन फ़िल्टर इष्टतम रैखिक द्विघात अनुमानक है जब राज्य गतिशीलता और माप त्रुटियां तथाकथित रैखिक गॉसियन मान्यताओं का पालन करती हैं ( http://wp.me/p491t5-PS )। इसलिए, जब तक आप अपने गतिशीलता और माप मॉडल को जानते हैं और वे रैखिक गाऊसी मान्यताओं का पालन करते हैं, रैखिक द्विघात अनुमानकों की कक्षा में कोई बेहतर अनुमानक नहीं है। हालांकि, "असफल" कलमन फ़िल्टर अनुप्रयोगों के लिए सबसे आम कारण हैं:

  1. राज्य की गतिशीलता और माप मॉडल का गलत / गलत ज्ञान।

  2. फ़िल्टर की गलत गणना (एक प्रारंभिक राज्य अनुमान और सहूलियत प्रदान करना जो वास्तविक सिस्टम स्थिति के साथ असंगत है)। यह एक भारित कम से कम वर्ग (डब्ल्यूएलएस) आरंभीकरण प्रक्रिया का उपयोग करके आसानी से दूर हो जाता है।

  3. सिस्टम डायनामिक्स मॉडल के संबंध में सांख्यिकीय "आउटलेयर" के माप को शामिल करना। इससे कलमन गेन में नकारात्मक तत्व हो सकते हैं, जो अपडेट के बाद एक गैर-सकारात्मक अर्ध-निश्चित सहसंयोजक मैट्रिक्स का कारण बन सकता है। यह उस माप के साथ कलमन फ़िल्टर को अपडेट करने से पहले माप को मान्य करने के लिए "गेटिंग" एल्गोरिदम, जैसे दीर्घवृत्तीय गेटिंग का उपयोग करने से बचा जा सकता है।

ये कुछ सबसे सामान्य गलतियाँ / मुद्दे हैं जिन्हें मैंने कलमन फ़िल्टर के साथ काम करते हुए देखा है। अन्यथा, यदि आपके मॉडल की मान्यताएं वैध हैं, तो कलमन फ़िल्टर एक इष्टतम अनुमानक है।


1

आप उत्कृष्ट पुस्तक बायेसियन पूर्वानुमान और गतिशील मॉडल (हैरिसन और वेस्ट, 1997) का उल्लेख कर सकते हैं । लेखक बताते हैं कि लगभग सभी पारंपरिक समय श्रृंखला मॉडल सामान्य गतिशील मॉडल के विशेष मामले हैं। वे फायदे पर भी जोर देते हैं। शायद प्रमुख लाभों में से एक वह सहजता है जिसके साथ आप केवल राज्य वेक्टर को उन्नत करके कई राज्य अंतरिक्ष मॉडल को एकीकृत कर सकते हैं। उदाहरण के लिए, आप एकल मॉडल में regressors, मौसमी कारकों और एक autoregressive घटक को एकीकृत कर सकते हैं।


नमस्ते, क्या आप "आप कर सकते हैं, उदाहरण के लिए, समेकित रूप से regressors, मौसमी कारकों, और एक एकल मॉडल में एक autoregressive घटक को एकीकृत कर सकते हैं"। मुझे सही करें अगर मैं गलत हूं, तो एआरआईएमए के लिए इसका मतलब है कि आपको समय श्रृंखला को स्थिर बनाने की आवश्यकता है लेकिन राज्य के अंतरिक्ष मॉडल के लिए आपको केवल राज्य चर की संख्या को ट्विस्ट करने की आवश्यकता है?
विक्की जयंती

@Vyyyy ARIMA के विपरीत, राज्य अंतरिक्ष मॉडल स्थिरता नहीं मानते हैं। आप बस इसमें कई घटक जोड़ सकते हैं और एकल राज्य वेक्टर में उनका प्रतिनिधित्व कर सकते हैं।
अंसलमो

1

मुझे लगता है कि यदि आप सीधे एक राज्य अंतरिक्ष समारोह का उपयोग करते हैं, तो आप शायद कई मेट्रिक्स को समझने जा रहे हैं जो एक मॉडल बनाते हैं, और वे कैसे बातचीत करते हैं और काम करते हैं। यह एक ARIMA मॉडल को परिभाषित करने की तुलना में एक कार्यक्रम को परिभाषित करने की तरह बहुत अधिक है। यदि आप एक गतिशील स्टेट स्पेस मॉडल के साथ काम कर रहे हैं, तो यह और भी जटिल हो जाता है।

यदि आप किसी ऐसे सॉफ़्टवेयर पैकेज का उपयोग करते हैं, जिसमें वास्तव में अच्छा स्टेट स्पेस फंक्शन है, तो आप इससे बच सकते हैं, लेकिन आर पैकेजों में इस तरह के अधिकांश कार्यों में आपको किसी बिंदु पर विवरण में कूदने की आवश्यकता होती है।

मेरी राय में, यह सामान्य रूप से बायेसियन आंकड़ों की तरह है, जिनमें से मशीनरी अधिक बारवादी कार्यों की तुलना में उपयोग करने के लिए अधिक समझ, देखभाल और खिलाती है।

दोनों मामलों में, यह अतिरिक्त विवरण / ज्ञान के लायक है, लेकिन यह गोद लेने में बाधा बन सकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.