एआईसी को कम करके मॉडल का चयन करना कब उचित है?


12

यह अच्छी तरह से स्थापित है, कम से कम कुछ उच्च कैलिबर के सांख्यिकीविदों के बीच, कि न्यूनतम मूल्य की एक निश्चित सीमा के भीतर एआईसी सांख्यिकी के मूल्यों के साथ मॉडल को एआईसी सांख्यिकी को न्यूनतम करने वाले मॉडल के रूप में उपयुक्त माना जाना चाहिए। उदाहरण के लिए, [१, पृष्ठ २२] में हम पाते हैं

तब छोटे जीसीवी या एआईसी वाले मॉडल सबसे अच्छे माने जाएंगे। बेशक किसी को जीसीवी या एआईसी को केवल नेत्रहीन रूप से कम नहीं करना चाहिए। बल्कि, यथोचित छोटे जीसीवी या एआईसी मूल्यों वाले सभी मॉडलों को उनकी सादगी और वैज्ञानिक महत्व के अनुसार संभावित रूप से उपयुक्त और मूल्यांकन किया जाना चाहिए।

इसी तरह, [२, पृष्ठ १४४] में हमारे पास है

यह सुझाव दिया गया है (डुओंग, 1984) कि न्यूनतम मूल्य के सी के भीतर एआईसी मूल्यों वाले मॉडल को प्रतिस्पर्धी माना जाना चाहिए (एक विशिष्ट मूल्य के रूप में सी = 2 के साथ)। प्रतिस्पर्धी मॉडलों में से चयन तब अवशिष्टों की सफेदी (धारा 5.3) और मॉडल सादगी जैसे कारकों पर आधारित हो सकता है।

संदर्भ:

  1. रूपर्ट, डी।; वांड, एमपी एंड कारोल, आरजे सेमीप्रेमेट्रिक रिग्रेशन , कैम्ब्रिज यूनिवर्सिटी प्रेस, 2003
  2. ब्रॉकवेल, पीजे एंड डेविस, आरए परिचय टू टाइम-सीरीज़ एंड फोरकास्टिंग , जॉन विली एंड संस, 1996

तो ऊपर दिए गए, नीचे दिए गए दो मॉडलों में से किसे प्राथमिकता दी जानी चाहिए?

print( lh300 <- arima(lh, order=c(3,0,0)) )
# ... sigma^2 estimated as 0.1787:  log likelihood = -27.09,  aic = 64.18
print( lh100 <- arima(lh, order=c(1,0,0)) )
# ... sigma^2 estimated as 0.1975:  log likelihood = -29.38,  aic = 64.76

आम तौर पर, जब एआईसी या संबंधित सांख्यिकी को आँख बंद करके मॉडल का चयन करना उचित होता है?


आपने मॉडल के लिए AIC नहीं दिया है।
पीटर Flom

मैंने दिखाया है कि इसे आर के साथ कैसे प्राप्त करें
हाइबरनेटिंग

1
ARIMA मॉडल में +1 समस्याएँ नीचे दी गई हैं। लेकिन अन्यथा: "एक पूर्वानुमान मॉडल को सरल बनाना: नैदानिक ​​डेटा पर आधारित एक सिमुलेशन अध्ययन।" अम्बलर 2002 इस पर सबसे अधिक उद्धृत संदर्भ है।
charles

जवाबों:


4

रैखिक प्रतिगमन के बारे में सच्चाई पर कॉस्मा शालिज़ी के व्याख्यान नोट्स से पैराफ्रेसिंग , आप कभी भी एक मॉडल का चयन नहीं करेंगे , क्योंकि यह एआईसी जैसे सांख्यिकीय को कम करने के लिए हुआ था , के लिए

Every time someone solely uses an AIC statistic for model selection, an angel loses its
wings. Every time someone thoughtlessly minimises it, an angel not only loses its wings,
but is cast out of Heaven and falls in most extreme agony into the everlasting fire.

1
जैसा कि एक प्रसिद्ध यहूदी ने कहा: "कल्पना ज्ञान से बेहतर है" :)
हाइबरनेटिंग

और, जैसा कि एक प्रसिद्ध गैर-यहूदी ने कहा था कि "आप देख कर बहुत कुछ देख सकते हैं" (योगी बर्रा)।
पीटर Flom

और हम जो देखते हैं, निश्चित रूप से, मुख्य रूप से इस बात पर निर्भर करता है कि हम क्या खोजते हैं।
हाइबरनेटिंग

12

मैं कहूंगा कि मॉडल चयन में एआईसी का उपयोग करना अक्सर उपयुक्त होता है, लेकिन मॉडल चयन के लिए एकमात्र आधार के रूप में इसका उपयोग करने के लिए शायद ही कभी सही हो। हमें ठोस ज्ञान का भी उपयोग करना चाहिए।

आपके विशेष मामले में, आप किसी मॉडल की तुलना 3 क्रम वाले एआर बनाम एक के साथ कर रहे हैं। एआईसी (या कुछ इसी तरह) के अलावा मैं ऑटोकैरेलेशन और आंशिक ऑटोकॉरेलेशन प्लॉट्स को देखूंगा। मैं इस बात पर भी विचार करूंगा कि तीसरे क्रम के मॉडल का क्या अर्थ होगा । क्या इस का कोई मतलब निकलता है? क्या यह मूल ज्ञान में इजाफा करता है? (या, यदि आप भविष्यवाणी में पूरी तरह से रुचि रखते हैं, तो क्या यह भविष्यवाणी करने में मदद करता है?)

आमतौर पर, यह कभी-कभी ऐसा होता है कि बहुत छोटे प्रभाव का आकार खोजना दिलचस्प होता है।


क्या आपने सिर्फ इतना कहा है कि एक अरिमा मॉडल का चयन करने के लिए कोई भी अच्छा एल्गोरिथ्म केवल एआईसी (या इस तरह) की कसौटी पर आधारित नहीं होना चाहिए?
हाइबरनेटिंग

हां मैंने ऐसा कहा था।
पीटर Flom

और इस अंत में मैंने इसे अलविदा ऑटो के रूप में सुना। मेरी प्राथमिकता Bisgaard, S. & Kulahci के अध्याय 6 में उल्लिखित दृष्टिकोण का अनुसरण करना होगा। उदाहरण के लिए जॉन विले एंड संस, इंक। 2011 द्वारा एम। टाइम सीरीज़ विश्लेषण और पूर्वानुमान, और भी अधिक सटीक 6.5 खंड में अध्ययन के लिए महत्वपूर्ण परिणाम मॉडल में भिन्न
हाइबरनेटिंग

1
@Hibernating: के लेखकों auto.arima, Hyndman और Khandakar (2008) , का कहना है: -। "Univariate समय श्रृंखला की बड़ी संख्या के स्वचालित पूर्वानुमान अक्सर व्यापार में की जरूरत है ऐसा नहीं है कि जरूरत की भविष्यवाणी कम से कम मासिक एक हजार उत्पाद लाइनों पर है करने के लिए आम बात है। यहां तक ​​कि जब पूर्वानुमानों की एक छोटी संख्या की आवश्यकता होती है, तब भी कोई भी समय श्रृंखला मॉडल के उपयोग में उन्हें प्रशिक्षित करने के लिए उपयुक्त रूप से प्रशिक्षित नहीं हो सकता है। इन परिस्थितियों में, एक स्वचालित पूर्वानुमान एल्गोरिथ्म एक आवश्यक उपकरण है। " इन परिस्थितियों पर ध्यान दें ।
Scortchi - को पुनः स्थापित मोनिका

2
धन्यवाद लेकिन मैंने पहले भी पढ़ा था। यहां तक ​​कि अगर हम अभी के लिए "ऑटो" भाग के साथ स्पष्ट मुद्दों की उपेक्षा करते हैं, तो "अरीमा" भाग के साथ मुद्दे हैं, खासकर जब यह मौसमी मॉडल शामिल करने के लिए बढ़ाया जाता है। पीजे हैरिसन, सी चैटफील्ड और कुछ अन्य हस्तियों द्वारा मौसमी ARIMA मॉडल की कड़ी आलोचना की गई, जिनसे मुझे सीखने में आनंद आया। मेरे पास स्वत: पूर्वानुमान के खिलाफ कुछ भी नहीं है जब यह है) मैं बिल्कुल आवश्यक है और ii) एल्गोरिदम के आधार पर मैं ध्वनि पा सकता हूं - अन्यथा मैं कुछ साल पहले स्टैट साइंस में लियो ब्रेमेन के "दो संस्कृतियों" पेपर पर उनकी टिप्पणी में डीआर कॉक्स सलाह का पालन करता हूं।
हाइबरनेटिंग

8

PP


2
आपका अंतिम वाक्य दिलचस्प है। मुझे याद है कि मैंने पढ़ा है कि प्रतिगमन में भी महत्वपूर्ण भविष्यवक्ताओं को जोड़ना अच्छी तरह से उचित हो सकता है यदि अंतिम उद्देश्य भविष्यवाणी है। मैंने उस समय इस पर ज्यादा ध्यान नहीं दिया था, लेकिन अब मैं उस संदर्भ को खोजने की कोशिश करूंगा।
हाइबरनेटिंग

3
जोड़ने के बजाय मैं कहूंगा कि हटाने से बचें । और यह सिर्फ भविष्यवाणी नहीं है, लेकिन चर चयन को निर्देशित करने के लिए सांख्यिकीय एसोसिएशन आकलन का उपयोग करने से पक्षपात और अमान्य मानक त्रुटियां और विश्वास सीमाएं होती हैं।
फ्रैंक हरेल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.