समय श्रृंखला और प्रतिगमन के बीच संबंध और अंतर?


12

समय श्रृंखला और प्रतिगमन के बीच क्या संबंध और अंतर हैं?

के लिए मॉडल और मान्यताओं , यह सही है कि प्रतिगमन मॉडल इनपुट चर के विभिन्न मानों के लिए उत्पादन चर के बीच स्वतंत्रता मान है, जबकि समय श्रृंखला मॉडल नहीं है? कुछ अन्य अंतर क्या हैं?

के लिए तरीकों , से Darlington द्वारा एक वेबसाइट

समय श्रृंखला विश्लेषण के लिए कई दृष्टिकोण हैं, लेकिन दो सबसे अच्छी तरह से जाना जाता है प्रतिगमन विधि और बॉक्स-जेनकिंस (1976) या एआरआईएमए (ऑटोरेजिव इंटीग्रेटेड मूविंग एवरेज) विधि है। यह दस्तावेज़ प्रतिगमन विधि का परिचय देता है। मैं तीन प्रमुख कारणों से प्रतिगमन विधि को ARIMA से बेहतर मानता हूं

मुझे समझ में नहीं आया कि वेबसाइट पर टाइम सीरीज़ के लिए "रिग्रेशन मेथड" क्या है, और यह बॉक्स-जेनकिन्स या एआरआईएमए विधि से कैसे भिन्न है। मैं सराहना करता हूं कि क्या कोई उन सवालों पर कुछ अंतर्दृष्टि दे सकता है।

सादर धन्यवाद!


2
यहां अधिकांश उत्तर और टिप्पणियां अंत की ओर अधिक विशिष्ट प्रश्न पर ध्यान केंद्रित करती हैं। यह सिर्फ एक ध्वज है जो समय श्रृंखला विश्लेषण बॉक्स-जेनकिंस या एआरआईएमए की तुलना में बहुत अधिक है। समय श्रृंखला विश्लेषण के संपूर्ण क्षेत्रों में काफी अलग (या कम से कम अधिक सामान्य) फ़ोकस है। गैर-घटक घटक मॉडल कई उदाहरणों में से एक हैं।
निक कॉक्स

जवाबों:


17

मुझे वास्तव में लगता है कि यह एक अच्छा सवाल है और इसका जवाब चाहिए। प्रदान किया गया लिंक एक मनोवैज्ञानिक द्वारा लिखा गया है जो दावा कर रहा है कि कुछ घरेलू काढ़ा विधि बॉक्स-जेनकिंस की तुलना में समय श्रृंखला विश्लेषण करने का एक बेहतर तरीका है। मुझे उम्मीद है कि एक उत्तर में मेरी कोशिश दूसरों को प्रोत्साहित करेगी, जो योगदान देने के लिए समय श्रृंखला के बारे में अधिक जानकार हैं।

zटी=α1zटी-1++αzटी-+εटी
zटीzटी12arसमारोह। मैंने इसका परीक्षण किया, और यह आर मॉडल को आर में फिट करने के लिए डिफ़ॉल्ट विधि के समान उत्तर देने के लिए जाता है।

zटीटीटी

लेकिन ऐसा लगता है कि वह ओवर-फिटिंग की भी वकालत कर रहा है और फिर फिट की गई श्रृंखला और डेटा के बीच माध्य-चुकता त्रुटि में कमी का उपयोग करते हुए सबूत के रूप में बताता है कि उसका तरीका बेहतर है। उदाहरण के लिए:

मुझे लगता है कि correlograms अब अश्लील हैं। उनका प्राथमिक उद्देश्य श्रमिकों को यह अनुमान लगाने की अनुमति देना था कि कौन से मॉडल डेटा को सबसे अच्छा फिट करेंगे, लेकिन आधुनिक कंप्यूटर की गति (कम से कम प्रतिगमन में यदि समय-श्रृंखला मॉडल-फिटिंग में नहीं) तो एक कार्यकर्ता को बस कई मॉडल फिट करने और ठीक से देखने की अनुमति मिलती है हर एक मतलब चुकता त्रुटि से मापा जाता है। [संयोग पर पूंजीकरण का मुद्दा इस विकल्प के लिए प्रासंगिक नहीं है, क्योंकि दो तरीके इस समस्या के लिए समान रूप से अतिसंवेदनशील हैं।]

यह एक अच्छा विचार नहीं है क्योंकि एक मॉडल का परीक्षण माना जाता है कि यह कितनी अच्छी तरह से पूर्वानुमान लगा सकता है, न कि यह मौजूदा डेटा को कितनी अच्छी तरह से फिट करता है। अपने तीन उदाहरणों में, वह फिट की गुणवत्ता के लिए उनकी कसौटी के रूप में "समायोजित रूट माध्य-चुकता त्रुटि" का उपयोग करता है। बेशक, ओवर-फिटिंग एक मॉडल त्रुटि का इन-सैंपल अनुमान बनाने जा रहा है, इसलिए उसका दावा है कि उसके मॉडल "बेहतर" हैं क्योंकि उनके पास छोटा आरएमएसई गलत है।

संक्षेप में, चूंकि वह यह आकलन करने के लिए गलत मानदंड का उपयोग कर रहा है कि मॉडल कितना अच्छा है, इसलिए वह प्रतिगमन बनाम एआरआईएमए के बारे में गलत निष्कर्ष पर पहुंचता है। मैं चाहता हूँ कि, अगर वह इसके बजाय मॉडल की भविष्य कहनेवाला क्षमता का परीक्षण करता , तो ARIMA शीर्ष पर आ जाता। शायद कोई इसे आजमा सकता है यदि उनके पास उन किताबों तक पहुंच है जिसका वह यहां उल्लेख करता है

[पूरक: प्रतिगमन विचार पर अधिक के लिए, आप पुराने समय की श्रृंखला की पुस्तकों की जांच करना चाह सकते हैं जो ARIMA के सबसे लोकप्रिय होने से पहले लिखी गई थीं। उदाहरण के लिए, केंडल, टाइम-सीरीज़ , 1973, अध्याय 11 में इस पद्धति पर एक पूरा अध्याय है और ARIMA की तुलना है।]


सवाल यह है कि (अंतर्निहित) अंतर क्या हैं?
हागिषानी

जहाँ तक मैं बता सकता हूँ कि लेखक ने अपने होम-ब्रुव मेथड को पीयर-रिव्यू प्रकाशन में कभी वर्णित नहीं किया है और सांख्यिकीय साहित्य के संदर्भ में और 70 के दशक की तारीखों के लिए पद्धति संबंधी विषयों पर उनके मुख्य प्रकाशन न्यूनतम दिखाई देते हैं। कड़ाई से बोलना, इसमें से कोई भी कुछ भी "साबित" नहीं करता है, लेकिन खुद को दावों का मूल्यांकन करने के लिए पर्याप्त समय या विशेषज्ञता के बिना, मैं इसमें से किसी का उपयोग करने के लिए बेहद अनिच्छुक हूं।
गाला

@ ह्गभिषानी का मूल अंतर यह है कि प्रत्येक श्रृंखला के भीतर आटोक्लेरेटेड डेटा यानी क्रॉस-सहसंबंधी व्याख्या को विकृत करता है। इसके अलावा गॉसियन उल्लंघन उदाहरण के लिए एरोस का निरंतर मतलब, समय के साथ निरंतर विचरण, समय के साथ निरंतर मापदंडों को माना या सुधारा जाना चाहिए।
आइरिशस्टैट

@flounder लोग उन्हें बेचने के लिए पाठ्यपुस्तक लिखते हैं और पुरस्कार पाते हैं। वे कभी-कभी एनाक्रोनॉस्टिक तरीके शामिल करते हैं जिन्हें गलत तरीके से सिखाया जा रहा है क्योंकि कुछ पहले की तारीख में उन्हें सही माना जाता था। बिक्री बढ़ाने के लिए प्रकाशक अक्सर (मेरे व्यक्तिगत अनुभव से) पुरानी लेकिन गलत कार्यप्रणाली की माँग करता है क्योंकि ये विधियाँ पाठ्यक्रम में हैं।
आयरिशस्टैट

@IrishStat मॉडलिंग स्वतःसंबंधित डेटा गतिशील प्रतिगमन मॉडल द्वारा किया जा सकता है। इसके अलावा, अन्य मॉडल, जैसे मिश्रित मॉडल, ऐसे डेटा के लिए उपयोग किए जा सकते हैं। इसलिए, मुझे नहीं लगता कि यह विशेषता पर्याप्त अंतर है।
हागिषानी

7

प्रो। ई। परजन, शायद कुछ हद तक स्पष्ट है कि उन्होंने बॉक्स और जेनकिंस के अभिनव तरीकों का प्रस्ताव नहीं किया था, उन्होंने ओवर-फिटिंग के इस दृष्टिकोण का सुझाव दिया और फिर कदम बढ़ाया। यह कई कारणों से विफल हो जाता है (जिनमें से कई फ़ाउंडरर ने अच्छी तरह से संक्षेपित किया है), जिसमें पल्स, लेवल शिफ्ट्स, सीज़नल पल्स और लोकल टाइम ट्रेंड्स की पहचान और रीमेकिंग शामिल नहीं है। इसके अतिरिक्त, समय के साथ मापदंडों में बदलाव या समय के साथ त्रुटि विचरण में परिवर्तन पर विचार किया जाना चाहिए।

मैंने एक टुकड़ा लिखा था, जिसमें आपकी रुचि हो सकती है। इसे "प्रतिगमन बनाम बॉक्स-जेनकिंस" कहा जाता है और यह http://www.autobox.com/cms/index.php/afs-university/intro-to-forecasting से उपलब्ध है / doc_download / 24-प्रतिगमन-बनाम-बॉक्स जेनकींस

डार्लिंगटन की प्रक्रिया के बारे में एक टिप्पणी समय, समय * समय, समय * समय * समय * समय * भविष्यवक्ताओं के रूप में दर्शाती है। बहिर्गमन प्रभाव के अलगाव की ओर ले जाने वाले इंटरवेंशन डिटेक्शन की अनुपस्थिति में, समय की उच्च शक्तियों के लिए निष्कर्ष निकालना काफी संभव (और गलत!) है। सांख्यिकीय विश्लेषण करने वाले गैर-सांख्यिकीविदों से सावधान रहें क्योंकि आप मस्तिष्क की सर्जरी करने वाले सांख्यिकीविदों से सावधान रहेंगे। निष्पक्षता में कोई भी समय श्रृंखला विश्लेषण में सीमित प्रशिक्षण के साथ समय श्रृंखला विश्लेषण करने की कोशिश कर रहे गैर-समय श्रृंखला सांख्यिकीविदों / गणितज्ञों से सावधान रह सकता है।

इस सूची के अन्य पोस्टर (विशेष रूप से व्हीबर) ने इस "फिटिंग दृष्टिकोण" का उपयोग करने के खिलाफ बार-बार चेतावनी दी है, ज्यादातर एकतरफा सेटिंग में। यह चेतावनी कारण मॉडल पर भी लागू होती है।

उम्मीद है की यह मदद करेगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.