AIC, BIC, CIC, DIC, EIC, FIC, GIC, HIC, IIC - क्या मैं इनका उपयोग कर सकता हूं?


47

पी पर। उनके 34 PRNN ब्रायन रिप्ले टिप्पणी करते हैं कि "AIC को Aikeike (1974) ने 'एक सूचना मानदंड' के रूप में नामित किया था, हालांकि आमतौर पर ऐसा माना जाता है कि A का अर्थ Akaike है"। दरअसल, जब AIC स्टेटिस्टिक्स की शुरुआत करते हैं, Akaike (1974, p.719) बताते हैं कि

"IC stands for information criterion and A is added so that similar statistics, BIC, DIC
etc may follow".

इस उद्धरण को 1974 में की गई भविष्यवाणी के रूप में देखते हुए, यह ध्यान रखना दिलचस्प है कि केवल चार वर्षों में दो प्रकार के बीआईसी स्टेटिस्टिक (बायेसियन आईसी) Aikeike (1977, 1978) और श्वार्ज (1978) द्वारा प्रस्तावित किए गए थे। इसने स्पीगलगलटर एट अल। (2002) डीआईसी (डीवियनस आईसी) के साथ आने के लिए बहुत लंबा है। जबकि सीआईसी मानदंड की उपस्थिति का अनुमान आकाइक (1974) द्वारा नहीं लगाया गया था, यह मानना ​​भोला होगा कि यह कभी भी चिंतन नहीं किया गया था। यह 2005 में कार्लोस सी। रोड्रिग्ज द्वारा प्रस्तावित किया गया था। (ध्यान दें कि आर। तिब्शिरानी और के। नाइट के CIC (कोवरियनस इन्फ्लेशन क्राइटियन) एक अलग बात है।)

मुझे पता था कि ईआईसी (एम्पिरिकल आईसी) मोनाश विश्वविद्यालय के लोगों द्वारा 2003 के आसपास प्रस्तावित किया गया था। मैंने अभी-अभी फोकस्ड इंफॉर्मेशन क्रैप्शन (एफआईसी) की खोज की है। कुछ किताबें हन्नान और क्विन आईसी को एचआईसी के रूप में संदर्भित करती हैं, उदाहरण के लिए इसे देखें )। मुझे पता है कि जीआईसी (सामान्यीकृत आईसी) होना चाहिए और मैंने सिर्फ सूचना निवेश मानदंड (आईआईसी) की खोज की है। एनआईसी, टीआईसी और बहुत कुछ है।

मुझे लगता है कि मैं संभवतः वर्णमाला के बाकी हिस्सों को कवर कर सकता हूं, इसलिए मैं यह नहीं पूछ रहा हूं कि अनुक्रम एआईसी, बीआईसी, सीआईसी, डीआईसी, ईआईसी, एफआईसी, जीआईसी, एचआईसी, आईआईसी, ... या वर्णमाला के कौन से अक्षर हैं। उपयोग नहीं किया गया है या कम से कम दो बार उपयोग किया गया है (जैसे ईआईसी में ई विस्तारित या अनुभवजन्य के लिए खड़ा हो सकता है)। मेरा प्रश्न सरल है और मुझे अधिक व्यावहारिक रूप से उपयोगी होने की उम्मीद है। क्या मैं उन आंकड़ों का परस्पर उपयोग कर सकता हूं, वे उन विशिष्ट मान्यताओं की अनदेखी कर रहे हैं, जिनके तहत वे विशिष्ट परिस्थितियों में लागू होने वाले थे, और इसी तरह?

यह सवाल बर्नहैम एंडरसन (2001) द्वारा आंशिक रूप से प्रेरित है:

...the comparison of AIC and BIC model selection ought to be based on their performance 
properties such as mean square error for parameter estimation (includes prediction) and 
confidence interval coverage: tapering effects or not, goodness-of-fit issues, 
derivation of theory is irrelevant as it can be frequentist or Bayes. 

एक्सपोनेंशियल स्मूथिंग पर Hyndman et al. के मोनोग्राफ का अध्याय 7 बीए सलाह का पालन करता हुआ प्रतीत होता है जब मॉडल के चयन के दौरान पांच वैकल्पिक IC (AIC, BIC, AICc, HQIC, LEIC) कितनी अच्छी तरह से प्रदर्शन करते हैं (जैसा कि मापा गया है) एक नए प्रस्तावित त्रुटि माप (जिसे एमएएसई कहा जाता है) से यह निष्कर्ष निकालना कि एआईसी एक बेहतर विकल्प था। (मुख्यालय को सिर्फ एक बार सर्वश्रेष्ठ मॉडल चयनकर्ता के रूप में रिपोर्ट किया गया था।)

मुझे यकीन नहीं है कि सभी आईसीसी का अनुमान लगाने वाले अनुसंधान अभ्यासों का उपयोगी उद्देश्य क्या है, क्योंकि वे मान्यताओं के समकक्ष सेट के तहत एक और एक ही प्रश्न का उत्तर देने के लिए व्युत्पन्न थे। विशेष रूप से, मुझे यकीन नहीं है कि गैर-स्थिर घातीय के संदर्भ में इसका उपयोग करके एक ऑटोरेजेशन के क्रम को निर्धारित करने के लिए सुसंगत कसौटी के पूर्वानुमान की जांच करना उपयोगी है (कि हर्गन और क्विन एरोगोडिक स्थिर अनुक्रम के लिए व्युत्पन्न)। हंडमैन एट अल द्वारा मोनोग्राफ में वर्णित स्मूथिंग मॉडल का विश्लेषण और विश्लेषण किया गया। क्या मुझसे कोई चूक हो रही है?

संदर्भ:

एकैके, एच। (1974), सांख्यिकीय मॉडल पहचान पर एक नया रूप, स्वचालित नियंत्रण 19 (6), 716-723 पर IEEE लेन-देन

एकैके, एच। (1977), एन्ट्रापी अधिकतमकरण सिद्धांत पर, पीआर कृष्णैया में, एड।, सांख्यिकी के अनुप्रयोग , वॉल्यूम। 27, एम्स्टर्डम: उत्तर हॉलैंड, पीपी। 27-41।

एकैके, एच। (1978), न्यूनतम एआईसी प्रक्रिया का एक बायेसियन विश्लेषण, सांख्यिकीय गणित के संस्थान 30 (1), 9-14।

बर्नहैम, केपी एंडरसन, डीआर (2001) कुल्लबैक-लिबलर की जानकारी के रूप में पारिस्थितिक अध्ययन में मजबूत निष्कर्ष, वन्यजीव अनुसंधान 28, 111-119

Hyndman, RJ, Koehler, AB, Ord, JK & Snyder, RD को एक्सपोनेंशियल स्मूथिंग के साथ पूर्वानुमान: राज्य अंतरिक्ष दृष्टिकोण। न्यूयॉर्क: स्प्रिंगर, 2008

रिप्ले, बीडी पैटर्न मान्यता और तंत्रिका नेटवर्क । कैम्ब्रिज: कैम्ब्रिज यूनिवर्सिटी प्रेस, 1996

श्वार्ज़, जी (1978), एक मॉडल के आयाम का अनुमान लगाते हुए , एनल्स ऑफ स्टैटिस्टिक्स 6 (2), 461-464।

स्पीगलहेल्टर, डीजे, बेस्ट, एनजी, कारलिन, बीपी और वैन डेर लिंडे, ए (2002), मॉडल जटिलता और टी के बायेसियन उपाय (चर्चा के साथ), जर्नल ऑफ द रॉयल स्टैटिस्टिकल सोसायटी। श्रृंखला बी (सांख्यिकीय पद्धति) 64 (4), 583-639।


9
फाइंडली और परजेन के साथ बातचीत में ( projecteuclid.org/download/pdf_1/euclid.ss/1177010133 ) आकाइक ने खुलासा किया कि एआईसी का उपयोग उसके फोरट्रान कार्यक्रम में एक सहायक द्वारा किया गया था। डिफ़ॉल्ट रूप से निहित पूर्णांक मात्रा के रूप में परिवर्तनीय नाम आईसी; एक उपसर्ग जैसे कि ए कंपाइलर को निर्देश देने के लिए पर्याप्त था कि मात्रा वास्तविक थी। यद्यपि "आकेइक" का इरादा नहीं था, उन्होंने महसूस किया कि इसका मतलब भी बस "ए" था। (संयोग से, जबकि यह संदर्भ है, जैसा कि यह था, एक गलत कहानी के लिए एक मारक है, यह मल्लो 'के रूप में मल्लो की गलत वर्तनी को समाप्त कर देता है।)
निक कॉक्स

यह प्रश्न "अल्फाबेटिक प्रायोगिक डिज़ाइन" के बारे में सोचने के लिए बनाता है: doe.soton.ac.uk/elearning/section3.6.jsp
kjetil b halvorsen

जवाबों:


36

मेरी समझ यह है कि AIC, DIC और WAIC सभी एक ही चीज़ का अनुमान लगा रहे हैं: एक मॉडल के साथ जुड़े आउट-ऑफ-सैंपल डिविज़न। यह भी वही बात है जो क्रॉस-वैलिडेशन का अनुमान लगाती है। जेलमैन एट अल में। (2013), वे स्पष्ट रूप से कहते हैं:

आउट ऑफ-द-नमूना भविष्यवाणी त्रुटि का अनुमान लगाने का एक प्राकृतिक तरीका क्रॉस-वैलिडेशन है (बायेसियन परिप्रेक्ष्य के लिए व्हीटसारी और लैम्पिनन, 2002 देखें), लेकिन शोधकर्ताओं ने हमेशा वैकल्पिक एमए-सुर की मांग की है, क्योंकि क्रॉस-वैलिडेशन के लिए आवश्यक मॉडल फिट और कर सकते हैं विरल डेटा के साथ मुसीबत में चला गया। अकेले व्यावहारिक कारणों के लिए, AIC (Akaike, 1973), DIC (Spiegelhalter, Best, Carlin, and van der Linde, 2002, van der Linde, 2005), और अधिक हाल ही में, WAIC जैसे साधारण पूर्वाग्रह सुधार के लिए एक जगह बनी हुई है। (वातानाबे, 2010), और इन सभी को क्रॉस-वैलिडेशन (स्टोन, 1977) के विभिन्न संस्करणों के सन्निकटन के रूप में देखा जा सकता है।

बीआईसी कुछ अलग अनुमान लगाता है, जो न्यूनतम विवरण लंबाई से संबंधित है। जेलमैन एट अल। कहते हैं:

BIC और इसके वेरिएंट di ff भविष्यवाणियक goal t के अनुमान से प्रेरित नहीं होने पर यहाँ पर विचार किए गए अन्य सूचना मानदंडों से आते हैं, लेकिन मॉडल के तहत डेटा, p (y) के सीमांत संभाव्यता घनत्व का अनुमान लगाने के लक्ष्य से, जिसका उपयोग किया जा सकता है। असतत मॉडल तुलना की सेटिंग में सापेक्ष पीछे की संभावनाओं का अनुमान लगाएं।

मुझे आपके द्वारा सूचीबद्ध अन्य सूचना मानदंडों के बारे में कुछ भी पता नहीं है, दुर्भाग्य से।

क्या आप AIC जैसी सूचना मानदंड का उपयोग परस्पर विनिमय कर सकते हैं? मत भिन्न हो सकते हैं, लेकिन यह देखते हुए कि AIC, DIC, WAIC और क्रॉस-वैरिफिकेशन सभी एक ही चीज़ का अनुमान लगाते हैं, तो हाँ, वे अधिक-या-कम विनिमेय हैं। बीआईसी अलग है, जैसा कि ऊपर उल्लेख किया गया है। मैं दूसरों के बारे में नहीं जानता।

एक से अधिक क्यों हैं?

  • जब आपके पास अधिकतम संभावना अनुमान और फ्लैट पुजारी होते हैं तो एआईसी अच्छी तरह से काम करता है, लेकिन वास्तव में अन्य परिदृश्यों के बारे में कहने के लिए कुछ भी नहीं है। पेनल्टी भी बहुत कम है जब मापदंडों की संख्या डेटा बिंदुओं की संख्या तक पहुंचती है। एआईसीसी इसके लिए अति-सुधार करता है, जो आपके दृष्टिकोण के आधार पर अच्छा या बुरा हो सकता है।

  • यदि मॉडल के कुछ हिस्सों को पुजारियों द्वारा भारी रूप से विवश किया जाता है (जैसे कुछ बहु-स्तरीय मॉडल में जहां विचरण घटकों का अनुमान लगाया जाता है) डीआईसी एक छोटे से दंड का उपयोग करता है। यह बहुत अच्छा है, क्योंकि भारी विवश पैरामीटर वास्तव में स्वतंत्रता की पूर्ण डिग्री का गठन नहीं करते हैं। दुर्भाग्य से, आमतौर पर डीआईसी के लिए उपयोग किए जाने वाले सूत्र यह मानते हैं कि पश्चगामी अनिवार्य रूप से गॉसियन है (अर्थात यह अपने अर्थ द्वारा अच्छी तरह से वर्णित है), और इसलिए कुछ स्थितियों में अजीब परिणाम (जैसे नकारात्मक दंड) प्राप्त कर सकते हैं।

  • WAIC पूरे पोस्टीरियर घनत्व का उपयोग DIC की तुलना में अधिक प्रभावी ढंग से करता है, इसलिए जेलमैन एट अल। इसे पसंद करें हालांकि यह कुछ मामलों में गणना करने के लिए दर्द हो सकता है।

  • क्रॉस-सत्यापन किसी विशेष सूत्र पर निर्भर नहीं करता है, लेकिन यह कई मॉडलों के लिए कम्प्यूटेशनल रूप से निषेधात्मक हो सकता है।

मेरे विचार में निर्णय जिसके बारे में AIC- जैसे मानदंड का उपयोग करने के लिए पूरी तरह से व्यावहारिक मुद्दों के इन प्रकारों पर निर्भर करता है, बजाय एक गणितीय प्रमाण के कि एक दूसरे से बेहतर करेगा।

संदर्भ :

जेलमैन एट अल। बायेसियन मॉडल के लिए भविष्य कहनेवाला सूचना मानदंड समझना। Http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.295.3501&rep=rep1&type=pdf से उपलब्ध


3
संदर्भ के अलावा गेलमैन एट अल। बायेसियन मॉडल के लिए भविष्य कहनेवाला सूचना मानदंड को और अधिक हाल के पेपर अकी वेत्सारी, एंड्रयू गेलमैन और जोना गेरी (2016) देखते हैं। प्रैक्टिकल बायेसियन मॉडल का मूल्यांकन लीव-वन-आउट क्रॉस-वैलिडेशन और WAIC का उपयोग करते हुए। सांख्यिकी और कम्प्यूटिंग में, doi: 10.1007 / s11222-016-9696-4। arXiv प्रीप्रिंट arXiv: 1507.04544। arxiv.org/abs/1507.04544 यह पत्र यह भी दर्शाता है कि विश्वसनीय क्रॉस-सत्यापन की गणना कई मॉडलों के लिए नगण्य समय में की जा सकती है।
अकी वाहनतारी

4

"बीच में" बहुत मजबूत शब्द है। वे सभी मानदंड हैं जो मॉडल की तुलना करना चाहते हैं और "सर्वश्रेष्ठ" मॉडल ढूंढते हैं, लेकिन प्रत्येक "सर्वश्रेष्ठ" को अलग ढंग से परिभाषित करता है और विभिन्न मॉडलों को "सर्वश्रेष्ठ" के रूप में पहचान सकता है।


0

"एक जनमत संग्रह का प्रस्ताव"। सिर्फ वोट देने के लिए! ;-) मुझे अपनी व्यक्तिगत प्रैक्टिस से विशुद्ध रूप से CAIC (Bozdogan, 1987) और BIC पसंद आया, क्योंकि ये मानदंड जटिलता के लिए एक गंभीर दंड देते हैं, हमें अधिक मार्मिकता मिली, लेकिन मैंने हमेशा अच्छे मॉडल की सूची प्रदर्शित की - 4-6 से डेल्टा के लिए -8 (2 के बजाय)। जांच मापदंडों के चरण में (क्योंकि हमारे पास "उम्मीदवारों के मॉडल की अच्छी स्ट्रेचिंग है"), एमएम औसत (बी एंड ए) अक्सर कुछ भी नहीं बदलता है। मैं शास्त्रीय एआईसी और एआईसीसी (एच एंड टी, बी एंड ए द्वारा लोकप्रिय) दोनों से थोड़ा संदेह करता हूं, क्योंकि वे अक्सर "क्रीम की मोटी परत" देते हैं। ;-)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.