ARMA का उपयोग करते हुए एक गैर-स्थिर प्रक्रिया के मॉडलिंग के परिणाम?

मैं समझता हूं कि हमें गैर-स्थिर समय श्रृंखला मॉडलिंग के लिए ARIMA का उपयोग करना चाहिए। इसके अलावा, मैं जो कुछ भी पढ़ता हूं वह कहता है कि एआरएमए को केवल स्थिर समय श्रृंखला के लिए उपयोग किया जाना चाहिए।

मैं जो समझने की कोशिश कर रहा हूं, वह यह है कि किसी मॉडल को मिसकॉलिफ़ाइज़ करते समय, और d = 0गैर-स्थिर होने वाली समय श्रृंखला के लिए क्या होता है ? उदाहरण के लिए:

controlData <- arima.sim(list(order = c(1,1,1), ar = .5, ma = .5), n = 44)

नियंत्रण डेटा इस तरह दिखता है:

 [1]   0.0000000   0.1240838  -1.4544087  -3.1943094  -5.6205257
 [6]  -8.5636126 -10.1573548  -9.2822666 -10.0174493 -11.0105225
[11] -11.4726127 -13.8827001 -16.6040541 -19.1966633 -22.0543414
[16] -24.8542959 -25.2883155 -23.6519271 -21.8270981 -21.4351267
[21] -22.6155812 -21.9189036 -20.2064343 -18.2516852 -15.5822178
[26] -13.2248230 -13.4220158 -13.8823855 -14.6122867 -16.4143756
[31] -16.8726071 -15.8499558 -14.0805114 -11.4016515  -9.3330560
[36]  -7.5676563  -6.3691600  -6.8471371  -7.5982880  -8.9692152
[41] -10.6733419 -11.6865440 -12.2503202 -13.5314306 -13.4654890

यह मानते हुए कि मुझे पता नहीं था कि डेटा पर ARIMA(1,1,1)मेरी नज़र हो सकती है pacf(controlData)।

pacf (controlData)

तब मैं डिक्की-फुलर का उपयोग यह देखने के लिए करता हूं कि क्या डेटा गैर-स्थिर है:

require('tseries')
adf.test(controlData)

# Augmented Dickey-Fuller Test
#
# data:  controlData
# Dickey-Fuller = -2.4133, Lag order = 3, p-value = 0.4099
# alternative hypothesis: stationary

adf.test(controlData, k = 1)

# Augmented Dickey-Fuller Test
#
#data:  controlData
# Dickey-Fuller = -3.1469, Lag order = 1, p-value = 0.1188
# alternative hypothesis: stationary

इसलिए, मैं मान सकता हूं कि डेटा एआरआईएमए (2,0, *) है तो फिर auto.arima(controlData)सबसे अच्छा फिट पाने के लिए प्रयास करें?

require('forecast')
naiveFit <- auto.arima(controlData)
naiveFit
# Series: controlData 
# ARIMA(2,0,1) with non-zero mean 
# 
# Coefficients:
#          ar1      ar2     ma1  intercept
#      1.4985  -0.5637  0.6427   -11.8690
# s.e.  0.1508   0.1546  0.1912     3.2647
#
# sigma^2 estimated as 0.8936:  log likelihood=-64.01
# AIC=138.02   AICc=139.56   BIC=147.05

इसलिए, भले ही अतीत और भविष्य का डेटा ARIMA (1,1,1) हो, लेकिन मुझे ARIMA (2,0,1) के रूप में वर्गीकृत करने के लिए लुभाया जा सकता है। tsdata(auto.arima(controlData))अच्छा भी लग रहा है।

यहाँ एक सूचित मॉडलर क्या मिलेगा:

informedFit <- arima(controlData, order = c(1,1,1))
# informedFit
# Series: controlData 
# ARIMA(1,1,1)                    
#
# Coefficients:
#          ar1     ma1
#       0.4936  0.6859
# s.e.  0.1564  0.1764
#
# sigma^2 estimated as 0.9571:  log likelihood=-62.22
# AIC=130.44   AICc=131.04   BIC=135.79

1) इन सूचना मानदंडों को मॉडल द्वारा चयनित से बेहतर क्यों माना जाता है auto.arima(controlData)?

अब, मैं वास्तविक रूप से वास्तविक डेटा और 2 मॉडल की तुलना करता हूं:

plot(controlData)
lines(fitted(naiveFit), col = "red")
lines(fitted(informedFit), col = "blue")

tsPlots

2) शैतान के वकील की भूमिका निभाते हुए, एक मॉडल के रूप में ARIMA (2, 0, 1) का उपयोग करके मैं किस तरह के परिणाम दूंगा? इस त्रुटि के जोखिम क्या हैं?

3) मैं ज्यादातर मल्टी-पीरियड फॉरवर्ड भविष्यवाणियों के किसी भी निहितार्थ के बारे में चिंतित हूं। मुझे लगता है कि वे कम सटीक होंगे? मैं बस कुछ सबूत की तलाश में हूं।

4) क्या आप मॉडल चयन के लिए एक वैकल्पिक तरीका सुझाएंगे? क्या "तर्कहीन" मॉडलर के रूप में मेरे तर्क के साथ कोई समस्या है?

मैं वास्तव में उत्सुक हूं कि इस तरह के गर्भपात के अन्य परिणाम क्या हैं। मैं कुछ स्रोतों की तलाश में हूँ और अभी कुछ भी नहीं पा सका हूँ। सभी साहित्य जिन्हें मैं केवल इस विषय पर छू सकता था, इसके बजाय ARMA प्रदर्शन करने से पहले केवल डेटा को स्थिर होना चाहिए, और यदि यह गैर-स्थिर है, तो इसे अलग-अलग समय पर अलग करने की आवश्यकता है।

धन्यवाद!

r time-series arima stationarity

— क्लार्क हेनरी
स्रोत

मेरी धारणा यह है कि यह "ऑर्थोगोनल त्रुटियों" के क्रॉस-सेक्शनल रिग्रेशन में धारणा के अनुरूप है (अर्थात यह मानक त्रुटियों को सहता है लेकिन गुणांक नहीं), लेकिन मैं वास्तविक उत्तर सुनने में दिलचस्पी रखता हूं।

— छायाकार

जवाबों:

मेरी धारणा यह है कि इस प्रश्न का एक अद्वितीय, पूरी तरह से सामान्य उत्तर नहीं है, इसलिए मैं केवल सबसे सरल मामले का पता लगाऊंगा, और थोड़ा अनौपचारिक तरीके से।

\begin{matrix} (1) & y_{टी} = y_{टी - 1} + {यू}_{टी}, टी = 1, । । ।, टी, y_{0} = 0 \end{matrix}

$y_t = y_{t-1} + u_t,\;\; t=1,...,T,\;\; y_0 =0 \tag{1}$

u_{t}

$u_t$

E (u_{t}^{2}) = σ_{u}^{2}

$E(u_t^2)= \sigma^2_u$

\begin{matrix} (2) & y_{टी} = Σ_{मैं = 1}^{टी} {यू}_{मैं} \end{matrix}

$y_t = \sum_{i=1}^tu_i \tag{2}$

$A$

\begin{matrix} (3) & y_{टी} = β y_{टी - 1} + {यू}_{टी}, टी = 1, । । ।, टी, y_{0} = 0 \end{matrix}

$y_t = \beta y_{t-1} + u_t,\;\; t=1,...,T,\;\; y_0 =0 \tag{3}$

$\hat \beta$ $\beta$

$k$

\begin{matrix} (4) & {\hat{y}}_{टी + कश्मीर} = {\hat{β}}^{कश्मीर} y_{टी} \end{matrix}

$\hat y_{T+k} = \hat \beta^k y_T \tag{4}$

और इसका एमएसई होगा

एम एस ए_{ए} [{\hat{y}}_{टी + कश्मीर}] = ए {({\hat{β}}^{कश्मीर} y_{टी} - y_{टी + कश्मीर})}^{2}

$MSE_A[\hat y_{T+k}] = E\left(\hat \beta^k y_T-y_{T+k}\right)^2$

\begin{matrix} (5) & = ए {[({\hat{β}}^{कश्मीर} - 1) y_{टी} - Σ_{मैं = टी + 1}^{टी + कश्मीर} {यू}_{मैं}]}^{2} = ए [({\hat{β}}^{कश्मीर} - 1)^{2} y_{टी}^{2}] + कश्मीर σ_{यू}^{2} \end{matrix}

$=E\left[(\hat \beta^k-1) y_T -\sum_{i=T+1}^{T+k}u_i \right]^2 = E\big[(\hat\beta^k-1)^2 y_T^2\big]+ k\sigma^2_u \tag{5}$

(वर्ग का मध्य पद लुप्त हो जाता है, साथ ही भविष्य की त्रुटियों के क्रॉस-उत्पाद भी)।

आइए अब कहते हैं कि हमने अपने डेटा को अलग किया है, और एक मॉडल निर्दिष्ट किया है $B$

\begin{matrix} (6) & Δ y_{टी} = γ Δ y_{टी - 1} + {यू}_{टी} \end{matrix}

$\Delta y_t = \gamma \Delta y_{t-1} + u_t \tag{6}$

$\hat \gamma$

\begin{matrix} (7) & y_{टी} = y_{टी - 1} + γ (y_{टी - 1} - y_{टी - 2}) + {यू}_{टी} \end{matrix}

$y_t = y_{t-1} + \gamma (y_{t-1}-y_{t-2}) + u_t \tag{7}$

इसलिए प्रक्रिया के स्तर का पूर्वानुमान, हमारे पास होगा

{\hat{y}}_{टी + 1} = y_{टी} + \hat{γ} (y_{टी} - y_{टी - 1})

$\hat y_{T+1} = y_{T} + \hat \gamma (y_{T}-y_{T-1})$

जो वास्तव में, सही DGP को देखते हुए होगा

\begin{matrix} (8) & {\hat{y}}_{टी + 1} = y_{टी} + \hat{γ} {यू}_{टी} \end{matrix}

$\hat y_{T+1} = y_{T} + \hat \gamma u_T \tag {8}$

$B$

{\hat{y}}_{टी + कश्मीर} = y_{टी} + (\hat{γ} + {\hat{γ}}^{2} + । । । + {\hat{γ}}^{कश्मीर}) {यू}_{टी}

$\hat y_{T+k} = y_{T} + \big(\hat \gamma + \hat \gamma^2+...+\hat \gamma^k)u_T$

$|\hat \gamma|<1$ $0$

\begin{matrix} (9) & {\hat{y}}_{टी + कश्मीर} = y_{टी} + \frac{\hat{γ} - {\hat{γ}}^{कश्मीर + 1}}{1 - \hat{γ}} {यू}_{टी} \end{matrix}

$\hat y_{T+k} = y_{T} + \frac {\hat \gamma - \hat \gamma ^{k+1}}{1-\hat \gamma}u_T \tag{9}$

इसलिए

\begin{matrix} (10) & एम एस ए_{बी} [{\hat{y}}_{टी + कश्मीर}] = ए [{(\frac{\hat{γ} - {\hat{γ}}^{कश्मीर + 1}}{1 - \hat{γ}})}^{2} {यू}_{टी}^{2}] + कश्मीर σ_{यू}^{2} \end{matrix}

$MSE_B[\hat y_{T+k}] = E\left[\left(\frac {\hat \gamma - \hat \gamma ^{k+1}}{1-\hat \gamma}\right)^2u_T^2\right] + k\sigma^2_u \tag{10}$

जब मैं सुविधा के लिए दोहराता हूं

\begin{matrix} (5) & एम एस ए_{ए} [{\hat{y}}_{टी + कश्मीर}] = ए [({\hat{β}}^{कश्मीर} - 1)^{2} y_{टी}^{2}] + कश्मीर σ_{यू}^{2} \end{matrix}

$MSE_A[\hat y_{T+k} ] = E\big[(\hat\beta^k-1)^2 y_T^2\big]+ k\sigma^2_u \tag{5}$

तो, विभेदित मॉडल के लिए भविष्यवाणी MSE के संदर्भ में बेहतर प्रदर्शन करने के लिए, हम चाहते हैं

एम एस ए_{बी} [{\hat{y}}_{टी + कश्मीर}] \leq एम एस ए_{ए} [{\hat{y}}_{टी + कश्मीर}]

$MSE_B[\hat y_{T+k}] \leq MSE_A[\hat y_{T+k}]$

\Rightarrow ए [{(\frac{\hat{γ} - {\hat{γ}}^{कश्मीर + 1}}{1 - \hat{γ}})}^{2} {यू}_{टी}^{2}] \leq ए [({\hat{β}}^{कश्मीर} - 1)^{2} y_{टी}^{2}]

$\Rightarrow E\left[\left(\frac {\hat \gamma - \hat \gamma ^{k+1}}{1-\hat \gamma}\right)^2u_T^2\right] \leq E\big[(\hat\beta^k-1)^2 y_T^2\big]$

$B$ $A$ $\hat \beta$

$\hat \beta >1$ $k$ $k$ $B$ $A$

$A$ $\hat \beta <1$ $k \rightarrow \infty$

ए [{(\frac{\hat{γ}}{1 - \hat{γ}})}^{2} {यू}_{टी}^{2}] \leq ए [y_{टी}^{2}] = टी σ_{यू}^{2} ? ?

$E\left[\left(\frac {\hat \gamma}{1-\hat \gamma}\right)^2u_T^2\right] \leq E\big[y_T^2\big]= T\sigma^2_u\;\; ??$

$k \rightarrow \infty$ $k$

$\left(\frac {\hat \gamma }{1-\hat \gamma}\right)^2$ $0$ $B$

$\hat \gamma$ $u_T$

cov [{(\frac{\hat{γ}}{1 - \hat{γ}})}^{2}, {यू}_{टी}^{2}] + ए [{(\frac{\hat{γ}}{1 - \hat{γ}})}^{2}] \cdot σ_{यू}^{2} \leq टी σ_{यू}^{2} ? ?

$\operatorname{Cov}\left[\left(\frac {\hat \gamma}{1-\hat \gamma}\right)^2,\,u_T^2\right] + E\left[\left(\frac {\hat \gamma}{1-\hat \gamma}\right)^2\right]\cdot \sigma^2_u \leq T\sigma^2_u\;\; ??$

\Rightarrow cov [{(\frac{\hat{γ}}{1 - \hat{γ}})}^{2}, {यू}_{टी}^{2}] \leq (टी - ए [{(\frac{\hat{γ}}{1 - \hat{γ}})}^{2}]) \cdot σ_{यू}^{2} ? ?

$\Rightarrow \operatorname{Cov}\left[\left(\frac {\hat \gamma}{1-\hat \gamma}\right)^2,\,u_T^2\right] \leq \left (T-E\left[\left(\frac {\hat \gamma}{1-\hat \gamma}\right)^2\right]\right)\cdot \sigma^2_u \;\; ??$

$\hat \gamma$ $T$ $\hat \gamma$ $(0,1)$

इसलिए सभी में, किसी भी विशिष्ट अनुमान पद्धति पर चर्चा किए बिना, मेरा मानना है कि हम अनौपचारिक रूप से यह दिखाने में सक्षम थे कि विभेदित मॉडल से भविष्यवाणी एमएसई के संदर्भ में बेहतर प्रदर्शन करने की उम्मीद की जानी चाहिए।

— एलेकोस पापाडोपोलोस
स्रोत

यह अच्छा सवाल है।

जैसा कि मैंने महसूस किया है, आपने सिर्फ pacf पर विचार किया है लेकिन यह पर्याप्त नहीं है। सर्वश्रेष्ठ मॉडल का चयन करने के लिए ACF और PACF दोनों आवश्यक हैं।

दूसरी ओर, स्थिर परीक्षण कमजोर और संवेदनशील होते हैं और परीक्षण करने के लिए बड़ी मात्रा में लैग्स की आवश्यकता होती है।

इसके अलावा, किसी भी मॉडल को लागू करने से पहले समय श्रृंखला को स्थिर बनाना पसंद किया जाता है। मोटे तौर पर, ARIMA मॉडल केवल गैर-स्थिर होने के एक विशेष मामले पर विचार करते हैं (अधिमानतः प्रवृत्ति में)।

आपके प्रश्नों के बारे में, मैं auto.arima फ़ंक्शन के बारे में निश्चित नहीं हूं लेकिन मुझे यकीन है कि आपके उदाहरण में डेटा बिंदुओं की संख्या कम है। अधिक संख्या में डेटा बिंदुओं का उपयोग करके मॉडल का अनुकरण करना आपके प्रश्नों का अच्छी तरह से उत्तर देगा। साथ ही, मैं आपको सलाह देता हूं कि आप ACF के साथ-साथ PACF की समय श्रृंखला पर भी विचार करें। मॉडल चयन के बारे में अंगूठे का नियम सबसे सरल मॉडल चुन रहा है (ध्यान दें कि समय श्रृंखला स्थिर बनाने के बाद सबसे सरल मॉडल)।

मैं आपको इस संदर्भ में बताता हूं । यह पुस्तक आपके सभी सवालों का जवाब नहीं देती है लेकिन आपको कुछ सुराग देती है।

----- पूरक अनुभाग ------- @ आपके डेटा में एक प्रवृत्ति पर विचार कर रहा है। यदि आप एक स्थिर मॉडल पर विचार करते हैं, तो यह एक ऊर्ध्वगामी / नीचे की ओर की भविष्यवाणी के परिणामस्वरूप होता है लेकिन वास्तव में ARMA मॉडल को फ्लैट डेटा की भविष्यवाणी करने के लिए डिज़ाइन किया गया है। इस अंतर को दर्शाने के लिए मैंने आपका कोड बदल दिया है:

( 'पूर्वानुमान') की आवश्यकता होती है

( 'टी-सीरीज़') की आवश्यकता होती है

controlData <- arima.sim (सूची (क्रम = c (1,1,1), ar = .5, ma = .5), n = 1000 )।

एसीएफ़ (controlData)

ts.plot (controlData)

naiveFit <- अरिमा (controlData, ऑर्डर = c (2,0,1))

सचफिट <- अरिमा (कंट्रोलडाटा, ऑर्डर = सी (1,1,1))

PrnaiveFit <-forecast.Arima (naiveFit, 10)

PrtrueFit <- पूर्वानुमान। अरिमा (सच्चा, 10)

matplot (cbind (PrnaiveFit $ माध्य, PrtrueFit $ माध्य), टाइप = 'b', col = c ('लाल', 'हरा'), ylab = c ('आयन का अनुमान'), pch = c ('n') 't'))

— TPArrow
स्रोत

सवाल पूछता है कि "समय श्रृंखला स्थिर बनाने के लिए" क्यों पसंद किया जाता है। यह वास्तव में उस सवाल का जवाब नहीं है।

— छायाकार

@ssdecontrol आप सामान्य रूप से सही हैं। मैं वास्तव में प्रक्षेपीकरण के बाद भविष्यवाणी पर निहित परिणामों के बारे में अधिक चिंतित हूं। लेकिन मैं बहुत अधिक Hamed.HM पर हरा नहीं करना चाहता। उन्होंने अभी भी मेरे आखिरी सवाल के बारे में कहा, "क्या यह एक मॉडल चुनने का सही तरीका है?" लेकिन सिर्फ दोहराने के लिए, यह मेरी चिंता का कम से कम यहाँ है।

— क्लार्क हेनरी