मेरे पास एक समय श्रृंखला है जिसका मैं पूर्वानुमान लगाने की कोशिश कर रहा हूं, जिसके लिए मैंने मौसमी ARIMA (0,0,0) (0,1,0) [12] मॉडल (= fit2) का उपयोग किया है। यह अलग है कि आर ने ऑटो के साथ क्या सुझाव दिया है। आरिमा (आर गणना की एआरआईएमए (0,1,1) (0,1,0) [12] एक बेहतर फिट होगी, मैंने इसे फिट 1 नाम दिया है)। हालांकि, मेरी समय श्रृंखला के पिछले 12 महीनों में मेरा मॉडल (फिट 2) समायोजित होने पर एक बेहतर फिट प्रतीत होता है (यह कालानुक्रमिक पक्षपाती था, मैंने अवशिष्ट माध्य जोड़ दिया है और नया फिट मूल समय श्रृंखला के आसपास अधिक सुकून से बैठने लगता है यहां दोनों फिट के लिए 12 सबसे हाल के महीनों के लिए पिछले 12 महीनों और एमएपीई का उदाहरण है:
समय श्रृंखला इस तरह दिखती है:
अब तक सब ठीक है। मैंने दोनों मॉडलों के लिए अवशिष्ट विश्लेषण किया है, और यहाँ भ्रम है।
अकफ (रेसिड (फिट 1)) बहुत अच्छा दिखता है, बहुत सफेद-नोइसी:
हालाँकि, Ljung-Box परीक्षण अच्छा नहीं लगता है, उदाहरण के लिए, 20 lags:
Box.test(resid(fit1),type="Ljung",lag=20,fitdf=1)
मुझे निम्नलिखित परिणाम मिले:
X-squared = 26.8511, df = 19, p-value = 0.1082
मेरी समझ से, यह पुष्टि है कि अवशिष्ट स्वतंत्र नहीं हैं (स्वतंत्रता मूल्य परिकल्पना के साथ रहने के लिए पी-मूल्य बहुत बड़ा है)।
हालांकि, अंतराल 1 के लिए सब कुछ बहुत अच्छा है:
Box.test(resid(fit1),type="Ljung",lag=1,fitdf=1)
मुझे परिणाम देता है:
X-squared = 0.3512, df = 0, p-value < 2.2e-16
या तो मैं परीक्षण को नहीं समझ रहा हूं, या यह थोड़ा सा विरोधाभासी है कि मैं एक्यूफ प्लॉट पर क्या देख रहा हूं। स्वायत्तता की हँसी कम होती है।
तब मैंने फिट 2 की जाँच की। स्वायत्तता समारोह इस तरह दिखता है:
कई प्रथम लैग्स में इस तरह के स्पष्ट निरंकुशता के बावजूद, Ljung-Box परीक्षण ने मुझे फिट के मुकाबले 20 लैग्स पर बहुत बेहतर परिणाम दिए:
Box.test(resid(fit2),type="Ljung",lag=20,fitdf=0)
का परिणाम :
X-squared = 147.4062, df = 20, p-value < 2.2e-16
जबकि lag1 पर सिर्फ autocorrelation की जाँच करना, मुझे अशक्त-परिकल्पना की पुष्टि भी देता है!
Box.test(resid(arima2.fit),type="Ljung",lag=1,fitdf=0)
X-squared = 30.8958, df = 1, p-value = 2.723e-08
क्या मैं परीक्षण को सही ढंग से समझ रहा हूं? अवशिष्ट स्वतंत्रता की शून्य परिकल्पना की पुष्टि करने के लिए पी-मान 0.05 से कम होना चाहिए। पूर्वानुमान के लिए उपयोग करने के लिए कौन सा फिट बेहतर है, fit1 या fit2?
अतिरिक्त जानकारी: fit1 के अवशेष सामान्य वितरण प्रदर्शित करते हैं, जो fit2 के नहीं हैं।
X-squared
) बड़ा हो जाता है क्योंकि अवशिष्ट के नमूना ऑटो-सहसंबंध बड़े हो जाते हैं (इसकी परिभाषा देखें), और इसका p- मान एक मान प्राप्त करने की संभावना है जितना कि शून्य से नीचे या उससे अधिक बड़ा। परिकल्पना है कि असली नवाचार स्वतंत्र हैं। इसलिए एक छोटा पी-मूल्य स्वतंत्रता के खिलाफ सबूत है ।
fitdf
) तो आप शून्य डिग्री के साथ चि-स्क्वेर वितरण के खिलाफ परीक्षण कर रहे थे।