क्या AIC विभिन्न प्रकार के मॉडल की तुलना कर सकता है?


27

मैं R में गैर-रेखीय मॉडल की तुलना करने के लिए AIC (Akaike's Information Criterion) का उपयोग कर रहा हूं। क्या AIC की तुलना विभिन्न प्रकार के मॉडल से करना मान्य है? विशेष रूप से, मैं glm द्वारा फिट किए गए एक मॉडल की तुलना कर रहा हूं, जिसमें ग्लैमर (lme4) द्वारा लगाए गए यादृच्छिक प्रभाव शब्द के साथ एक मॉडल है।

यदि नहीं, तो क्या इस तरह की तुलना की जा सकती है? या विचार पूरी तरह से अमान्य है?

जवाबों:


12

निर्भर करता है। AIC लॉग लाइबिलिटी का एक फंक्शन है। यदि दोनों प्रकार के मॉडल लॉग संभावना की गणना एक ही तरीके से करते हैं (जैसे कि एक ही स्थिर शामिल है) तो हाँ आप कर सकते हैं, यदि मॉडल नेस्टेड हैं

मैं यथोचित निश्चित हूं कि glm()और lmer()तुलनीय लॉग संभावना का उपयोग नहीं करते हैं।

नेस्टेड मॉडल के बारे में बात भी चर्चा के लिए है। कुछ का कहना है कि एआईसी केवल नेस्टेड मॉडल के लिए मान्य है क्योंकि इस सिद्धांत को कैसे प्रस्तुत किया जाता है / इसके माध्यम से काम किया जाता है। अन्य सभी प्रकार की तुलना के लिए इसका उपयोग करते हैं।


मेरी समझ यह है कि lme4, डिफ़ॉल्ट रूप से REML का उपयोग करता है जहाँ glm ML का उपयोग करता है। यदि आपने REML = FALSE सेट करके ML का उपयोग किया है तो वे तुलनीय हो सकते हैं।
रसेलपिएरेसी

आपके गेविन की टिप्पणी के अलावा, यह भी निर्भर करता है कि आप मॉडल के साथ क्या करना चाहते हैं। क्या भविष्यवाणी के लिए मॉडल या थॉमस पार्सिमनी की तलाश में है? (मुझे लगता है)
suncoolsu

3
@drnexus: मुझे नहीं लगता कि यह पर्याप्त है; आपको यह सुनिश्चित करना होगा कि लॉग लाइबिलिटी कैलकुलेशन में समान सामान्य स्थिरांक लागू किया जा रहा है।
मोनिका को बहाल करें - जी। सिम्पसन 20

2
@ थोमस: इसके लिए आपको कोड को देखना होगा या उस व्यक्ति से बात करनी होगी जिसने इसे लिखा है। सामान्य तौर पर, मान लें कि संभावना विभिन्न सॉफ़्टवेयर / पैकेज / फ़ंक्शन में तुलनीय नहीं हैं।
मोनिका की बहाली - जी। सिम्पसन

1
@ user3490 अनुमान प्राप्त करने के लिए उपयोग किए गए सॉफ़्टवेयर और एल्गोरिथ्म पर निर्भर करता है। सामान्य तौर पर मुझे लगता है कि वे समान नहीं थे जब तक कि मैं कुछ के लिए नहीं जानता था कि वे थे।
मोनिका - जी। सिम्पसन

4

यह एक महान प्रश्न है जिसके बारे में मुझे कुछ समय के लिए उत्सुकता हुई है।

एक ही परिवार में मॉडल के लिए (यानी ऑटो-रिग्रेसिव मॉडल ऑफ़ ऑर्डर k या पॉलीओनियम्स) AIC / BIC बहुत मायने रखता है। अन्य मामलों में यह कम स्पष्ट है। लॉग-लाइबिलिटी की गणना करना बिल्कुल (स्थिर शब्दों के साथ) काम करना चाहिए, लेकिन बेयस फैक्टर जैसे अधिक जटिल मॉडल तुलना का उपयोग करना शायद बेहतर है (http://www.jstor.org/stable/2291091)।

यदि मॉडल में समान हानि / त्रुटि-फ़ंक्शन है, तो एक विकल्प केवल क्रॉस-वैरिफाइड लॉग-लाइलेरहुड की तुलना करना है। यह आमतौर पर मैं क्या करने की कोशिश करता हूं जब मुझे यकीन नहीं होता कि एआईसी / बीआईसी एक निश्चित स्थिति में समझ में आता है।


0

ध्यान दें कि कुछ मामलों में AIC समान प्रकार के मॉडल की तुलना भी नहीं कर सकता है, जैसे ARIMA मॉडल अलग-अलग क्रम के साथ। का हवाला देते हुए पूर्वानुमान: सिद्धांत और व्यवहार रोब जम्मू Hyndman और जॉर्ज Athanasopoulos द्वारा:

यह ध्यान रखना महत्वपूर्ण है कि ये सूचना मानदंड किसी मॉडल के अलग-अलग ( ) के उचित क्रम का चयन करने के लिए अच्छे मार्गदर्शक नहीं हैं , लेकिन केवल और के मूल्यों का चयन करने के लिए हैं । ऐसा इसलिए है क्योंकि विभेदक डेटा को बदलता है, जिस पर संभावना की गणना की जाती है, जिससे भिन्न के अलग-अलग आदेशों वाले मॉडल के बीच AIC मानों की तुलना नहीं होती है। इसलिए हमें चुनने के लिए कुछ अन्य दृष्टिकोण का उपयोग करने की आवश्यकता है , और फिर हम और को चुनने के लिए AICc का उपयोग कर सकते हैं ।dpqdpq


वास्तव में, लेकिन एक महत्वपूर्ण बिंदु यह है कि यह मॉडल का प्रकार नहीं है जो तुलनात्मक समस्याग्रस्त बनाता है, यह वह डेटा है जिस पर संभावना परिभाषित की जाती है।
रिचर्ड हार्डी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.