ARIMA मौसम और प्रवृत्ति के साथ पूर्वानुमान, अजीब परिणाम


9

जैसा कि मैं ARIMA मॉडल के साथ पूर्वानुमान लगा रहा हूं, मैं यह समझने की कोशिश कर रहा हूं कि मैं ARIMA पर आधारित पूर्वानुमान को कैसे बेहतर बना सकता हूं ताकि सीज़न और ड्रिफ्ट के साथ फिट हो।

मेरा डेटा निम्नलिखित समय श्रृंखला है (3 वर्ष से अधिक, स्पष्ट प्रवृत्ति ऊपर की ओर और दृश्यमान मौसमीता के साथ, जो कि 12, 24, 36 ??) में ऑटोकॉरेलेशन द्वारा समर्थित नहीं लगती है।

    > bal2sum3years.ts
             Jan     Feb     Mar     Apr     May     Jun     Jul     Aug          
    2010 2540346 2139440 2218652 2176167 2287778 1861061 2000102 2560729 
    2011 3119573 2704986 2594432 2362869 2509506 2434504 2680088 2689888 
    2012 3619060 3204588 2800260 2973428 2737696 2744716 3043868 2867416 
             Sep     Oct     Nov     Dec
    2010 2232261 2394644 2468479 2816287
    2011 2480940 2699780 2760268 3206372
    2012 2951516 3119176 3032960 3738256

auto.arima(bal2sum3years.ts)मेरे द्वारा सुझाए गए मॉडल ने निम्नलिखित मॉडल दिया:

    Series: bal2sum3years.ts 
    ARIMA(0,0,0)(0,1,0)[12] with drift         

    Coefficients:
              drift
          31725.567
    s.e.   2651.693

    sigma^2 estimated as 2.43e+10:  log likelihood=-321.02
    AIC=646.04   AICc=646.61   BIC=648.39

हालांकि, acf(bal2sum3years.ts,max.lag=35)एसईएफ गुणांक 0.3 से अधिक नहीं दिखाता है। डेटा की मौसमीता, हालांकि, बहुत स्पष्ट है - हर साल की शुरुआत में स्पाइक। यह वही है जो श्रृंखला ग्राफ पर दिखता है: मूल समय श्रृंखला

पूर्वानुमान का उपयोग करके fit=Arima(bal2sum3years.ts,seasonal=list(order=c(0,1,0),period=12),include.drift=TRUE), फ़ंक्शन द्वारा बुलाया जाता है forecast(fit), परिणाम अगले 12 महीने के डेटा के पिछले 12 महीनों के बराबर होने के साथ-साथ स्थिर होता है। इसे कॉल करके देखा जा सकता है plot(forecast(fit)),

वास्तविक और पूर्वानुमानित डेटा

मैंने अवशिष्टों की भी जाँच की है, जो कि स्वतःसंबंधित नहीं हैं, लेकिन सकारात्मक माध्य (गैर शून्य) हैं।

फिट मूल समय श्रृंखला को ठीक से मॉडल नहीं करता है, मेरी राय में (नीला मूल समय श्रृंखला, लाल है fitted(fit):

मूल बनाम फिट

अतिथि है, क्या मॉडल गलत है? क्या मैं कुछ भूल रहा हूँ? मैं मॉडल को कैसे सुधार सकता हूं? ऐसा लगता है कि मॉडल का शाब्दिक रूप से पिछले 12 महीनों का समय है और अगले 12 महीनों को प्राप्त करने के लिए एक निरंतरता जोड़ता है।

मैं समय श्रृंखला के पूर्वानुमान मॉडल और सांख्यिकी में एक रिश्तेदार शुरुआत कर रहा हूं।


" फिट ने मूल समय श्रृंखला को ठीक से मॉडल नहीं किया, मेरी राय में " - आप इसकी अपेक्षा क्यों करेंगे ??
Glen_b -Reinstate मोनिका

@Glen_b, यह राय उन मतभेदों पर आधारित थी, जो मुझे तब दिखाई देते हैं, जब मैं कथानक को देखता हूं। अगर मैं पूर्वानुमान के लिए प्रयास कर रहा हूँ, उदाहरण के लिए, लेखांकन उद्देश्यों के लिए मासिक बिक्री, तो त्रुटि महत्वपूर्ण हो सकती है ...
zima

" जब मैं साजिश को देखता हूं, तो जो अंतर दिखाई देता है " यह कहने का एक और तरीका है " समय श्रृंखला को ठीक से मॉडल नहीं करता है "। यह विवाद में नहीं है। एक बेहतर पूर्वानुमान के लिए आपकी इच्छा की अभिव्यक्ति वही इच्छा है जो हर भविष्यवक्ता की होती है। कई मामलों में यह बहुत महत्वपूर्ण हो सकता है। फिर भी, यह इच्छा डेटा में अधिक जानकारी नहीं डालती है। प्रत्येक ARIMA मॉडल - वास्तव में, इस कार्य के लिए प्रासंगिकता का कोई भी समय श्रृंखला मॉडल - एक गैर-त्रुटि त्रुटि है। डेटा और फिट के बीच हमेशा बेमेल संबंध रहेगा । क्या ऐसा कुछ है जो आपको लगता है कि आपके मॉडल से कुछ छूट गया है जिसे मॉडल किया जा सकता है?
Glen_b -Reinstate मोनिका

मैंने केवल कुछ के बारे में सोचा है .. हो सकता है कि ARIMA मॉडल वास्तव में डेटा की प्रकृति को ध्यान में न रखने के कारण डेटा को प्रतिबिंबित करने में सक्षम न हो - वेबसाइट पर उपयोगकर्ता गतिविधि। मुझे लगता है कि संख्याओं को प्रभावित करने वाली अन्य घटनाएं हो सकती हैं, न केवल मौसमीता - जैसे कि विशेष कार्यक्रम, प्रचार .. शायद अन्य भविष्यवाणी विधियां (एआरआईएमए नहीं), लेकिन मशीन लर्निंग तकनीकों से जुड़े अधिक जटिल, मूल्यों का बेहतर अनुमान लगाने में सक्षम हैं। मुझे इस पर गौर करना होगा।
जिमा

काफी प्रशंसनीय। यदि हां, तो आपको अवशिष्टों में ऐसी विफलता की पहचान करने में सक्षम होना चाहिए। ध्यान दें कि ARIMA मॉडल और संरचनात्मक समय श्रृंखला मॉडल दोनों प्रतिगमन शर्तों के माध्यम से विशेष घटनाओं और प्रचार जैसी चीजों को शामिल कर सकते हैं; समय श्रृंखला प्रतिगमन मॉडल काफी सामान्य हैं।
Glen_b -Reinstate मोनिका

जवाबों:


9

आपके डेटा की उपस्थिति से, मौसमी भिन्नता के बाद, अच्छी तरह से मौसमी शेष नहीं हो सकता है। प्रत्येक वर्ष की शुरुआत में वह शिखर, और शेष वर्ष के माध्यम से बाद के पैटर्न एक मॉडल द्वारा काफी अच्छी तरह से उठाए गए हैंI[12] ; मॉडल में "स्पष्ट मौसम" को शामिल किया गया है

हां, वास्तव में, सुझाया गया मॉडल "यह जून = अंतिम जून + निरंतर + त्रुटि" है, और इसी तरह अन्य महीनों के लिए भी है।

इसमें गलत क्या है? यह आपके डेटा का एक उत्कृष्ट विवरण लगता है।

आपको एक समय-श्रृंखला अपघटन अधिक सहज और समझाने में आसान हो सकता है, शायद एक बेसिक स्ट्रक्चरल मॉडल के आधार पर भी कुछ - एक मौसमी के साथ - लेकिन यह जरूरी नहीं कि एक मॉडल है जो आपके पास बेहतर कार्य करता है। अभी भी एक या अधिक मानक अपघटन तकनीक की कोशिश करने लायक हो सकती है - एक मॉडल के लिए बहुत कुछ कहा जा सकता है जिसे आप अच्छी तरह से समझ लेते हैं।


1

मेरा मानना ​​है कि हमारी समस्या यह है कि हम पारंपरिक मॉडल की कोशिश किए बिना सीधे ARIMA मॉडल पर कूद रहे हैं। इस कारण से, आप पा सकते हैं कि मॉडल आवश्यक परिणाम नहीं दे रहा है। आपके मामले में, मैंने आपके डेटा का परीक्षण किया, मैंने पाया कि हर 12 महीने में एक मौसमी है जो आपके लिए स्पष्ट है, लेकिन मैंने यह भी पाया कि 3 शब्दों का एक सरल मूविंग औसत मौसमी समायोजन: गुणक सबसे अच्छा मॉडल है। मेरी राय में, हमें किसी भी उन्नत तकनीक पर कूदने से पहले पारंपरिक पूर्वानुमान एल्गोरिदम की कोशिश करनी होगी। प्रश्न डेटा के लिए 12 महीने का पूर्वानुमान


1
आप जिस मॉडल का सुझाव दे रहे हैं, वह फॉर्म (3,0,0) (0,0,0) का एक ARIMA मॉडल है, जहां आप तीन गुणांक को .333, .333 और .333 और 0.0 के एक स्थिर के लिए हार्डकोडिंग कर रहे हैं। इस प्रकार न केवल arima मॉडल के रूप में मान रहे हैं लेकिन BUT आप गुणांक के मान मान रहे हैं और न ही कोई आउटलेयर श्रृंखला में मौजूद हैं। मॉडल के रूप और मापदंडों के लिए इष्टतम मूल्यों के संदर्भ में डेटा को खुद के लिए बोलने की अनुमति दें ... आपके पास खोने के लिए और बहुत कुछ हासिल करने के लिए कुछ भी नहीं है। यदि वास्तव में आपका मॉडल सही है तो यह मिल जाएगा .. सभी अरिमा मॉडल अतीत के भारित कार्य हैं।
आयरिशस्टैट

1
आँकड़े.स्टैकएक्सचेंज.com/questions/40905/… यह पता लगाता है कि मॉडलिंग और अरिमा किस तरह से संबंधित हैं। इस तरह से एआरआईएमए मॉडल को प्रश्न के उत्तर के रूप में समझाया जा सकता है कि मुझे कितने ऐतिहासिक मूल्यों का उपयोग करना चाहिए ताकि एक भारित योग की गणना की जा सके। अतीत? संक्षेप में वे मूल्य क्या हैं?
आयरिशस्टैट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.