मुझे 1993 से 2015 तक मासिक डेटा मिला है और मैं इन आंकड़ों पर पूर्वानुमान लगाना चाहूंगा। मैंने आउटलेर्स का पता लगाने के लिए tsoutliers पैकेज का उपयोग किया, लेकिन मुझे नहीं पता कि मैं अपने डेटा के सेट के साथ पूर्वानुमान कैसे जारी रखूं।
यह मेरा कोड है:
product.outlier<-tso(product,types=c("AO","LS","TC"))
plot(product.outlier)
यह tsoutliers पैकेज से मेरा आउटपुट है
ARIMA(0,1,0)(0,0,1)[12]
Coefficients:
sma1 LS46 LS51 LS61 TC133 LS181 AO183 AO184 LS185 TC186 TC193 TC200
0.1700 0.4316 0.6166 0.5793 -0.5127 0.5422 0.5138 0.9264 3.0762 0.5688 -0.4775 -0.4386
s.e. 0.0768 0.1109 0.1105 0.1106 0.1021 0.1120 0.1119 0.1567 0.1918 0.1037 0.1033 0.1040
LS207 AO237 TC248 AO260 AO266
0.4228 -0.3815 -0.4082 -0.4830 -0.5183
s.e. 0.1129 0.0782 0.1030 0.0801 0.0805
sigma^2 estimated as 0.01258: log likelihood=205.91
AIC=-375.83 AICc=-373.08 BIC=-311.19
Outliers:
type ind time coefhat tstat
1 LS 46 1996:10 0.4316 3.891
2 LS 51 1997:03 0.6166 5.579
3 LS 61 1998:01 0.5793 5.236
4 TC 133 2004:01 -0.5127 -5.019
5 LS 181 2008:01 0.5422 4.841
6 AO 183 2008:03 0.5138 4.592
7 AO 184 2008:04 0.9264 5.911
8 LS 185 2008:05 3.0762 16.038
9 TC 186 2008:06 0.5688 5.483
10 TC 193 2009:01 -0.4775 -4.624
11 TC 200 2009:08 -0.4386 -4.217
12 LS 207 2010:03 0.4228 3.746
13 AO 237 2012:09 -0.3815 -4.877
14 TC 248 2013:08 -0.4082 -3.965
15 AO 260 2014:08 -0.4830 -6.027
16 AO 266 2015:02 -0.5183 -6.442
मेरे पास ये चेतावनी संदेश भी हैं।
Warning messages:
1: In locate.outliers.iloop(resid = resid, pars = pars, cval = cval, :
stopped when ‘maxit’ was reached
2: In locate.outliers.iloop(resid = resid, pars = pars, cval = cval, :
stopped when ‘maxit’ was reached
3: In locate.outliers.oloop(y = y, fit = fit, types = types, cval = cval, :
stopped when ‘maxit’ was reached
4: In arima(x, order = c(1, d, 0), xreg = xreg) :
possible convergence problem: optim gave code = 1
5: In auto.arima(x = c(5.77, 5.79, 5.79, 5.79, 5.79, 5.79, 5.78, 5.78, :
Unable to fit final model using maximum likelihood. AIC value approximated
संदेह:
- अगर मैं गलत नहीं हूं, तो tsoutliers पैकेज आउटलेर्स को हटा देगा और यह पता लगाए गए डेटासेट के साथ डेटासेट के उपयोग के माध्यम से निकाल देगा, यह हमें डेटा सेट के लिए सबसे अच्छा arima मॉडल देगा, क्या यह सही है?
- स्तर परिवर्तन, आदि को हटाने के कारण समायोजन श्रृंखला डेटा सेट को बहुत नीचे स्थानांतरित किया जा रहा है। क्या इसका मतलब यह नहीं है कि अगर समायोजित श्रृंखला पर पूर्वानुमान लगाया जाता है, तो पूर्वानुमान का आउटपुट बहुत ही गलत होगा, क्योंकि हाल ही के डेटा 12 से अधिक हैं, जबकि समायोजित डेटा इसे 7-8 के आसपास स्थानांतरित कर देता है।
- चेतावनी संदेश 4 और 5 का क्या अर्थ है? इसका मतलब यह है कि यह समायोजित श्रृंखला का उपयोग करके auto.arima नहीं कर सकता है?
- ARIMA में [12] (0,1,0) (0,0,1) [12] का क्या अर्थ है? क्या यह मेरे डेटासेट की मेरी आवृत्ति / आवधिकता है, जिसे मैंने इसे मासिक पर सेट किया है? और क्या इसका मतलब यह भी है कि मेरी डेटा सीरीज़ मौसमी भी है?
- मैं अपने डेटा सेट में मौसम का पता कैसे लगाऊं? जैसा कि टाइम सीरीज़ प्लॉट के विज़ुअलाइज़ेशन से, मुझे कोई स्पष्ट रुझान नहीं दिख रहा है, और अगर मैं विघटित फ़ंक्शन का उपयोग करता हूं, तो यह माना जाएगा कि एक मौसमी प्रवृत्ति है? तो क्या मुझे विश्वास है कि tsoutliers ने मुझे बताया, जहां मौसमी प्रवृत्ति है, क्योंकि ऑर्डर 1 का एमए है?
- इन आउटलेर्स की पहचान करने के बाद मैं इस डेटा के साथ अपना पूर्वानुमान कैसे जारी रखूंगा?
- इन पूर्वानुमानों को अन्य पूर्वानुमान मॉडल में कैसे शामिल किया जाए - एक्सपोनेंशियल स्मूथिंग, ARIMA, स्ट्रटुरल मॉडल, रैंडम वॉक, थीटा? मुझे यकीन है कि मैं स्तर की पाली के बाद से आउटलेर्स को हटा नहीं सकता हूं, और अगर मैं केवल समायोजित श्रृंखला डेटा लेता हूं, तो मान बहुत छोटा होगा, इसलिए मैं क्या करूं?
क्या मुझे पूर्वानुमान के लिए auto.arima में इन outliers को regressor के रूप में जोड़ना होगा? फिर यह कैसे काम करता है?