अरिमा से पहले या अरिमा के भीतर अंतर समय श्रृंखला


13

क्या अरिमा का उपयोग करने से पहले सीरीज़ को अंतर करना बेहतर है (यह इसकी ज़रूरत है) या अरिमा के भीतर डी पैरामीटर का उपयोग करना बेहतर है?

मैं आश्चर्यचकित था कि अलग-अलग फिट किए गए मान किस मार्ग पर समान मॉडल और डेटा के साथ लिए गए हैं। या मैं कुछ गलत कर रहा हूं?

install.packages("forecast")
library(forecast)

wineindT<-window(wineind, start=c(1987,1), end=c(1994,8))
wineindT_diff <-diff(wineindT)

#coefficients and other measures are similar
modA<-Arima(wineindT,order=c(1,1,0))
summary(modA)
modB<-Arima(wineindT_diff,order=c(1,0,0))
summary(modB)

#fitted values from modA
A<-forecast.Arima(modA,1)$fitted

#fitted from modB, setting initial value to the first value in the original series
B<-diffinv(forecast.Arima(modB,1)$fitted,xi=wineindT[1])


plot(A, col="red")
lines(B, col="blue")

जोड़ें:

कृपया ध्यान दें कि मैं एक बार श्रृंखला को अलग कर रहा हूं और अरिमा (1,0,0) को फिट कर रहा हूं, फिर मैं मूल श्रृंखला के लिए अरिमा (1,1,0) फिटिंग कर रहा हूं। मैं (मुझे लगता है) विभक्त फ़ाइल पर अरिमा (1,0,0) के लिए फिट किए गए मूल्यों पर भिन्नता को उलट रहा है।

मैं फिट किए गए मूल्यों की तुलना कर रहा हूं - भविष्यवाणियां नहीं।

यहाँ साजिश है (लाल arima है (1,1,0) और नीला मूल पैमाने पर वापस बदलने के बाद अलग श्रृंखला पर arima (1,0,0) है):

यहाँ छवि विवरण दर्ज करें

डॉ। हैन्डमैन के उत्तर का उत्तर:

1) क्या आप आर कोड में यह स्पष्ट कर सकते हैं कि अरिमा (1,1, के बीच दो बिंदुओं को मानने के लिए आपको क्या करना होगा (और संभवतः आपके उत्तर में आपके पहले बिंदु के कारण छोटे अंतर की अनुमति देने के लिए)। 0) और Arima (1,0,0) मैन्युअल रूप से विभेदित श्रृंखला पर? मुझे लगता है कि इसका मतलब मॉडा में शामिल नहीं होने के साथ करना है, लेकिन मुझे पूरी तरह से यकीन नहीं है कि कैसे आगे बढ़ना है।

2) अपने # 3 के बारे में। मुझे पता है कि मैं स्पष्ट याद कर रहा हूं, लेकिन और वही जब को रूप में परिभाषित किया जाता है ? क्या आप कह रहे हैं मैं गलत तरीके से "उदासीन" हूं? वाई टी=φ(एक्सटी-1-एक्सटी-2) वाई टी एक्स टी-एक्सटी-1X^t=Xt1+ϕ(Xt1Xt2)Y^t=ϕ(Xt1Xt2)Y^टीएक्स^टी-एक्सटी-1


1
अपने अपडेट के बारे में। 1) मैं ऐसा करने का कोई मतलब नहीं देख सकता। Arima () फिट किए गए मूल्यों और पूर्वानुमान का उत्पादन करेगा। मुझे अरिमा () पहले से ही काम करने के लिए अतिरिक्त आर कोड क्यों उत्पन्न करना चाहिए? 2) हां, लेकिन अलग-अलग एक्स-हैट आपको वाई-हैट नहीं देता है। तो उदासीनता वाई-हैट आपको एक्स-हैट नहीं देती है।
Rob Hyndman

2
धन्यवाद। 1) मेरे लिए सीखने का अभ्यास था। 2) मेरे मूल प्रश्न (diffinv का उपयोग करते हुए) में गणना में मेरी त्रुटि फिट किए गए मूल्यों का उपयोग करने में थी और मूल नहीं कि मुझे क्या लगता है कि मैं इससे (?)? डेटा को उदासीन करें। मुझे पता है कि अरिमा ऐसा करेगी, बस समीकरणों का उपयोग करके एक पुस्तक उदाहरण का पालन करने की कोशिश कर रही है।
B_Miner

जवाबों:


14

यहां कई मुद्दे हैं।

  1. यदि आप पहले अंतर करते हैं, तो Arima()एक मॉडल को विभेदित डेटा में फिट करेंगे। यदि आप Arima()अनुमान प्रक्रिया के भाग के रूप में अलग-अलग करते हैं, तो यह आरंभीकरण से पहले एक फैलाना का उपयोग करेगा। इसके लिए मदद फ़ाइल में समझाया गया है arima()। इसलिए परिणाम अलग-अलग तरीकों से होंगे क्योंकि प्रारंभिक अवलोकन को नियंत्रित किया जाता है। मुझे नहीं लगता कि यह अनुमान की गुणवत्ता के मामले में बहुत अंतर करता है। हालाँकि, Arima()यदि आप पूर्वानुमान (मूल) डेटा पर पूर्वानुमान या फ़िट किए गए मान चाहते हैं, तो अंतर को संभालने देना बहुत आसान है ।

  2. modBmodAArima()=0>0include.mean

  3. एक्स^टी=एक्सटी-1+φ(एक्सटी-1-एक्सटी-2)
    Y^टी=φ(एक्सटी-1-एक्सटी-2)
    {एक्सटी}{Yटी}
    एक्स^टी-एक्स^टी-1Y^टी

1
+1, मैं 2 अंक के उत्तर के रूप में देने जा रहा था। अन्य 2 को शामिल करने के लिए कुडोस
mpiktas

डॉ। Hyndman, प्रतिक्रिया के लिए धन्यवाद! मुझे समय श्रृंखला विश्लेषण के बारे में जानने के लिए बहुत कुछ है। क्या मैं एक अनुवर्ती पूछ सकता हूँ? मुझे यकीन नहीं है कि मुझे वास्तव में पता है कि इस जानकारी के साथ क्या करना है इसलिए मैं अपने मूल प्रश्न में एक ऐड पोस्ट कर रहा हूं।
B_Miner

2

कभी-कभी आपको श्रृंखला को स्थिर बनाने के लिए स्थानीय साधनों को हटाने की आवश्यकता होती है। यदि मूल श्रृंखला में एक एसीएफ है जो बाहर नहीं मरता है तो यह श्रृंखला में एक स्तर / चरण बदलाव के कारण हो सकता है। उपाय श्रृंखला को डी-मतलब करना है।

बाउंटी के लिए जवाब:

समान परिणाम / फिट किए गए मूल्यों को प्राप्त करने का तरीका शारीरिक रूप से ऑरिजिनल (Y (t) श्रृंखला में अंतर करने के बाद है पहला अंतर (dely) प्राप्त करने के लिए, एक स्थिरांक के बिना AR (1) का अनुमान लगाएं। यह एक ओएलटी मॉडल के फिटिंग के लिए टैंटामाउंट है प्रपत्र dely (t) = B1 * dely (t-1) + a (t) एक अवरोधन के बिना। इस मॉडल से फिट किए गए मान, क्रम 1 की इच्छा से एकीकृत (मेरा मानना ​​है) आपको एक मॉडल के फिट किए गए मान देते हैं ;; 1-बी] [एआर (1)] वाई (टी) = ए (टी)। सॉफ्टवेयर के अधिकांश टुकड़े, AUTOBOX के विख्यात अपवाद के साथ आपको एआर (1) मॉडल को बिना किसी स्थिरांक के अनुमान लगाने की अनुमति नहीं देंगे। समीकरण के लिए dely = + [(1- .675B * 1)] ** - 1 [A (T)] जबकि समीकरण समीकरण 1 था

[(1-बी * 1)] वाई (टी) = + [(1- .676 बी * 1)] ** - 1 [ए (टी)]। वाई। के भौतिक विभेदन के कारण होने वाली राउंडिंग त्रुटि पर ध्यान दें। जब विभेद प्रभाव में (मॉडल में) हो या न हो तो उपयोगकर्ता चयन कर सकता है कि इसमें स्थिरांक को शामिल किया जाए या नहीं। सामान्य प्रक्रिया एक स्थिर (यानी उदासीन) ARIMA मॉडल के लिए एक स्थिरांक को शामिल करना है और मॉडल में भिन्नता होने पर वैकल्पिक रूप से एक स्थिरांक को शामिल करना है। ऐसा प्रतीत होता है कि वैकल्पिक दृष्टिकोण (अरिमा) एक स्थिर मॉडल में एक निरंतरता को बल देता है जो मेरी राय में आपकी दुविधा का कारण बना है।


क्या इस मामले में फिट किए गए मानों का प्रभाव डेल्टा (y) पर arima (1,0,0) और y पर arima (1,1,0) के बीच होना चाहिए?
B_Miner

दोनों मामलों में आप सही समय श्रृंखला के पहले अंतर पर एआर (1) फिट कर रहे हैं? अगर ऐसा है और फिट होने के तरीके समान हैं तो उन्हें बिल्कुल वही काम करना चाहिए। संचालन के क्रम में भी कोई अंतर नहीं है।
माइकल आर। चेर्निक

यहाँ मामला नहीं लगता है। शायद @Rob_Hyndman चेक करेगा।
B_Miner

1

मुझे नहीं पता कि परिणामों में अंतर क्यों होगा जब तक कि किसी तरह आप दूसरे की तुलना में अधिक बार अलग-अलग तरीके से भिन्न नहीं होते हैं। ARIMA (p, d, q) के लिए d अंतर किसी भी मॉडल फिटिंग से पहले किया जाता है। तब स्थिर ARMA (p, q) मॉडल विभेदित श्रृंखला के लिए फिट है। धारणा यह है कि श्रृंखला में बहुपद रुझानों को हटाने के बाद शेष श्रृंखला स्थिर है। मतभेदों की संख्या तेह बहुपद के क्रम से मेल खाती है जिसे आप निकालना चाहते हैं। तो एक रैखिक प्रवृत्ति के लिए आप सिर्फ एक अंतर लेते हैं, द्विघात प्रवृत्ति के लिए आप दो अंतर लेते हैं। मैं जॉन के जवाब में कही गई बातों से सहमत नहीं हूं।


0

I (1) श्रृंखला में अंतर करने का एक कारण इसे स्थिर बनाना है। मान लें कि आपके पास ARIMA मॉडल के लिए सही विनिर्देश हैं, तो मॉडल के अवशिष्टों को हटाए गए ऑटोरोग्रेसिव और मूविंग औसत घटक होंगे। उस संबंध में यह अलग-अलग होने के बजाय मॉडल के अवशेषों का उपयोग करने के लिए समझ में आता है। हालांकि, ऐसी परिस्थितियों में जहां आपके पास बहुत अधिक डेटा है जो आपको लगता है कि लगभग I (1) है, कुछ लोग ARIMA मॉडल को पूरी तरह से अनुमान लगाने के बजाय डेटा में अंतर करेंगे। ARIMA मॉडल समय श्रृंखला समस्याओं की एक पूरी मेजबानी को फिट कर सकता है जहां यह अंतर के लिए समझ में नहीं आता है। उदाहरण के लिए, यदि डेटा का अर्थ उलट-पलट होता है, तो यह हमेशा अंतर के लिए उपयुक्त नहीं हो सकता है क्योंकि यह I (1) नहीं हो सकता है।


क्या आप इस बड़े अंतर की उम्मीद करेंगे? इससे मुझे लगता है कि मैं कुछ गलत तरीके से कर रहा था कि मैं मूल से मतभेदों पर कैसे भरोसा कर रहा था।
B_Miner

क्या आप वास्तव में बता सकते हैं कि आपने क्या किया? मैं आर कोड पढ़ने में अच्छा नहीं हूं। यदि आप दोनों तरीकों से समान अंतर लेते हैं और अलग-अलग ARMA मॉडल को फिट करते हैं, तो अलग-अलग होने के बाद आपको उसी परिणाम प्राप्त करने चाहिए जब तक कि फिटिंग तकनीक समान हो (आमतौर पर सशर्त कम से कम वर्गों का उपयोग किया जाता है)।
माइकल आर। चेर्निक

वह कुछ डेटा लेता है, एक ARIMA (1,1,0) फिट बैठता है, फिर अंतर लेता है और एक ARIMA (1,0,0) फिट बैठता है। अंत में, वह एक अवधि के नमूने के पूर्वानुमान की एक दूसरे से तुलना करता है। संभवतः वे अलग-अलग हैं, लेकिन हम पोस्ट में रेखांकन नहीं देख सकते हैं।
जॉन

yटी=βyटी-1+εटीyटी=(β-1)yटी-1+εटीεटीyटी=βyटी-1+εटी

1
अंत में सही है। मैं 5 मिनट में LaTex नहीं कर सकता! जैसा कि सबसे अच्छा मैं बता सकता हूं कि उपरोक्त समीकरण दोनों तरीकों से सामने आता है।
माइकल आर। चेरिक जूल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.