auto.arima std त्रुटि पर निर्मित NaNs को चेतावनी देता है


9

मेरा डेटा नियोजित जनसंख्या, L और समय अवधि, वर्ष की एक समय श्रृंखला है।

n.auto=auto.arima(log(L),xreg=year)
summary(n.auto)
Series: log(L) 
ARIMA(2,0,2) with non-zero mean 

Coefficients:
         ar1      ar2      ma1     ma2  intercept    year
      1.9122  -0.9567  -0.3082  0.0254    -3.5904  0.0074
s.e.     NaN      NaN      NaN     NaN     1.6058  0.0008

sigma^2 estimated as 1.503e-06:  log likelihood=107.55
AIC=-201.1   AICc=-192.49   BIC=-193.79

In-sample error measures:
           ME          RMSE           MAE           MPE          MAPE 
-7.285102e-06  1.225907e-03  9.234378e-04 -6.836173e-05  8.277295e-03 
         MASE 
 1.142899e-01 
Warning message:
In sqrt(diag(x$var.coef)) : NaNs produced

ऐसा क्यों होता है? क्यों Auto.arima इन ar * ma * गुणांक संख्या की संख्या में त्रुटि के साथ सबसे अच्छा मॉडल का चयन करता है एक संख्या नहीं? क्या यह चयनित मॉडल सब के बाद वैध है?

मेरा लक्ष्य मॉडल L = L_0 * exp (n * year) में पैरामीटर n का अनुमान लगाना है। बेहतर दृष्टिकोण का कोई सुझाव?

TIA।

डेटा:

L <- structure(c(64749, 65491, 66152, 66808, 67455, 68065, 68950, 
69820, 70637, 71394, 72085, 72797, 73280, 73736, 74264, 74647, 
74978, 75321, 75564, 75828, 76105), .Tsp = c(1990, 2010, 1), class = "ts")
year <- structure(1990:2010, .Tsp = c(1990, 2010, 1), class = "ts")
L
Time Series:
Start = 1990 
End = 2010 
Frequency = 1 
 [1] 64749 65491 66152 66808 67455 68065 68950 69820 70637 71394 72085 72797
[13] 73280 73736 74264 74647 74978 75321 75564 75828 76105

क्या आप कुछ डेटा पोस्ट कर सकते हैं ताकि हम समस्या को दोहरा सकें?
रॉब हयंडमैन

@ रॉबाइंडमैन ने डेटा को अपडेट किया
आइवी ली

कृपया dput(L)आउटपुट टाइप करें और पेस्ट करें। यह प्रतिकृति को बहुत आसान बनाता है।
Zach

जवाबों:


11

AR गुणांक का योग 1 के करीब है जो दर्शाता है कि पैरामीटर स्थिर क्षेत्र के किनारे के पास हैं। जो मानक त्रुटियों की गणना करने में कठिनाइयों का कारण बनेगा। हालांकि, अनुमानों में कुछ भी गलत नहीं है, इसलिए यदि आपको आवश्यकता है तो इसका मूल्य हैएल0, तुम्हें यह मिल गया है।

auto.arima()गणना में तेजी लाने की कोशिश करने के लिए कुछ शॉर्ट-कट लेता है, और जब यह एक मॉडल देता है जो संदिग्ध दिखता है, तो उन शॉर्ट-कट को बंद करना और जो आपको मिलता है उसे देखना एक अच्छा विचार है। इस मामले में:

> n.auto <- auto.arima(log(L),xreg=year,stepwise=FALSE,approx=FALSE)
> 
> n.auto
Series: log(L) 
ARIMA(2,0,0) with non-zero mean 

Coefficients:
         ar1      ar2  intercept    year
      1.8544  -0.9061    11.0776  0.0081
s.e.  0.0721   0.0714     0.0102  0.0008

sigma^2 estimated as 1.594e-06:  log likelihood=107.19
AIC=-204.38   AICc=-200.38   BIC=-199.15

यह मॉडल थोड़ा बेहतर है (उदाहरण के लिए एक छोटा एआईसी)।


1
क्या होगा यदि मानक त्रुटियों की गणना नहीं की जा सकती है और पूर्वानुमान के लिए मॉडल का उपयोग करने की आवश्यकता है? क्या यह एक पूर्वानुमान में अमान्य, अनुचित रूप से छोटे आत्मविश्वास के अंतराल का कारण होगा? मेरे मामले में (लंबाई 35 की एक समय-श्रृंखला), एसई के लिए गुणांक के उपयोग approximation=FALSEऔर stepwise=FALSEअभी भी NaN का उत्पादन करता है।
मिहेल

4

आपकी समस्या एक ओवर-स्पेसिफिकेशन से उत्पन्न होती है। एआर (1) के साथ एक सरल पहला अंतर मॉडल काफी पर्याप्त है। कोई एमए संरचना या शक्ति परिवर्तन की आवश्यकता नहीं है। आप इसे भी एक दूसरे अंतर मॉडल के रूप में मॉडल कर सकते हैं क्योंकि ar (1) गुणांक 1.0 के करीब है। वास्तविक / फिट / पूर्वानुमान का यहाँ छवि विवरण दर्ज करेंएक प्लॉट  समय अवधि 7 पर संभव बाह्य / अकुशलताऔर समीकरण के साथ एक अवशिष्ट प्लॉट है! यहाँ छवि विवरण दर्ज करेंयहाँ छवि विवरण दर्ज करें। सारांश सारांश मॉडल विनिर्देशन के अधीन है जो इस मामले में वांछित है "[mene mene tekel upharsin"]। गंभीरता से, मेरा सुझाव है कि आप मॉडल पहचान रणनीतियों के साथ खुद को परिचित करें और गैर-संरचना वाले अपने मॉडल को रसोई-सिंक करने का प्रयास न करें। कभी - कभी थोड़ा ही बहुत होता है ! पारसीमोनी एक उद्देश्य है! उम्मीद है की यह मदद करेगा ! अपने सवालों के जवाब देने के लिए "क्यों Auto.arima इन ar * ma * गुणांक संख्या के std त्रुटि के साथ सबसे अच्छा मॉडल का चयन करता है? एक संख्या नहीं? संभावित जवाब यह है कि राज्य-स्थान समाधान यह सब इसलिए नहीं है क्योंकि यह हो सकता है? अनुमान लगाने वाले मॉडल जो इसे आज़माते हैं। लेकिन यह सिर्फ मेरा अनुमान है। असफलता का असली कारण आपके लॉग xform की धारणा हो सकती है। रूपांतरण ड्रग्स की तरह हैं ..... कुछ आपके लिए अच्छे हैं और कुछ आपके लिए अच्छे नहीं हैं। बिजली परिवर्तन केवल अवशिष्ट के मानक विचलन से अपेक्षित मूल्य को कम करने के लिए उपयोग किया जाना चाहिए। यदि लिंकेज है तो एक बॉक्स-कॉक्स ट्रांसफ़ॉर्म (जिसमें लॉग शामिल हैं) तब उपयुक्त हो सकता है। हो सकता है कि आपके कानों के पीछे से कोई परिवर्तन करना एक अच्छा विचार न हो।

क्या यह चयनित मॉडल सब के बाद वैध है? निश्चित रूप से नहीं !


0

मैंने ऐसे ही मुद्दों का सामना किया है। कृपया, optim.control और optim.method के साथ खेलने का प्रयास करें। ये NaN हेस मैट्रिक्स के विकर्ण तत्वों के नकारात्मक मूल्यों के वर्गम हैं। ARIMA (2,0,2) की फिटिंग अस्वास्थ्यकर समस्या है और आशा है कि एक काठी बिंदु (जहां ढाल शून्य है, लेकिन हेसे मैट्रिक्स सकारात्मक-परिभाषित नहीं है) के बजाय अधिकतम संभावना के रूप में परिवर्तित हो गया है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.