AIC के आधार पर मॉडल की तुलना कैसे करें?


15

हमारे पास दो मॉडल हैं जो लॉग लाइबिलिटी की गणना करने के लिए एक ही विधि का उपयोग करते हैं और एक के लिए एआईसी दूसरे की तुलना में कम है। हालांकि, निचले एआईसी वाले व्यक्ति की व्याख्या करना अधिक कठिन है।

हमें यह तय करने में परेशानी हो रही है कि क्या यह कठिनाई को शुरू करने के लायक है और हमने एआईसी में प्रतिशत अंतर का उपयोग करके इसे आंका है। हमने पाया कि दोनों एआईसी के बीच अंतर केवल 0.7% था, जिसमें अधिक जटिल मॉडल में 0.7% कम एआईसी है।

  1. क्या निम्न एआईसी के साथ मॉडल का उपयोग करने से बचने के लिए दोनों के बीच कम प्रतिशत अंतर एक अच्छा कारण है?

  2. क्या अंतर का प्रतिशत बताता है कि 0.7% अधिक जानकारी कम जटिल मॉडल में खो गई है?

  3. क्या दो मॉडल के परिणाम बहुत भिन्न हो सकते हैं?



2
@ArunJose, यह एक डुप्लिकेट नहीं लगता है। यहां सवाल काफी अलग हैं।
रिचर्ड हार्डी

1
नहीं, यह सवाल मॉडलों की तुलना करने के बारे में नहीं है। हम पहले से ही जानते हैं कि मॉडल तुलनीय हैं। यह सवाल एआईसी में एक महत्वपूर्ण अंतर के रूप में क्या मायने रखता है और जटिलता बनाम मॉडल फिट के बीच व्यापार से संबंधित है।
अली तुरब लोटिया

जवाबों:


27

एक तुलना नहीं है शुद्ध मान दो AICs की (जो की तरह हो सकता है भी लेकिन ~ 1000000 ) है, लेकिन उनके विचार करता है अंतर : Δ मैं = एक मैं सी मैं - एक मैं सी मीटर मैं n , जहां एक मैं सी मैं है I -th मॉडल का AIC , और A I C m i n सबसे कम AIC है जो जांच किए गए मॉडल (यानी, पसंदीदा मॉडल) के सेट के बीच प्राप्त करता है। अंगूठे का नियम, उदाहरण के लिए उल्लिखित है~100~1000000

Δमैं=मैंसीमैं-मैंसीमैंn,
मैंसीमैंमैंमैंसीमैंnबर्नहैम एंडरसन 2004 , है:
  1. यदि , तब वहाँ के लिए पर्याप्त समर्थन है मैं मई के मॉडल (या सबूत के खिलाफ यह केवल एक नंगे उल्लेख के लायक है) प्रस्ताव कि यह एक उचित वर्णन है, और उच्च संभावित है;Δमैं<2मैं
  2. अगर , तब वहाँ के लिए मजबूत समर्थन है मैं मई के मॉडल;2<Δमैं<4मैं
  3. यदि , तो i -th मॉडल के लिए काफी कम समर्थन है ;4<Δमैं<7मैं
  4. मॉडल का अनिवार्य रूप से कोई समर्थन नहीं है।Δमैं>10

अब प्रश्न में उल्लिखित 0.7% के बारे में, दो स्थितियों पर विचार करें:

  1. मैंसी1=मैंसीमैंn=100मैंसी2मैंसी2=100.7Δ2=0.7<2
  2. मैंसी1=मैंसीमैंn=100000मैंसी2मैंसी2=100,700Δ2=700»10

इसलिए, यह कहना कि एआईसीएस के बीच का अंतर 0.7% है, कोई जानकारी प्रदान नहीं करता है ।

एलΔमैंΔमैं=मैंसीमैं-मैंसीमैंnमैंसीमैंn: =0

एआईसी का निर्माण अत्यधिक संख्या में मापदंडों के उपयोग को दंडित करता है, इसलिए ओवरफिटिंग को हतोत्साहित करता है। यह कम मापदंडों के साथ मॉडल पसंद करता है, जब तक कि अन्य पर्याप्त रूप से बेहतर फिट प्रदान नहीं करते हैं। AIC एक मॉडल का चयन करने की कोशिश करता है (परीक्षित लोगों के बीच) जो वास्तविकता का सबसे पर्याप्त रूप से वर्णन करता है (परीक्षा के तहत डेटा के रूप में)। इसका मतलब यह है कि वास्तव में मॉडल को डेटा का वास्तविक विवरण माना जाता है। ध्यान दें कि एआईसी आपको जानकारी देता है कि कौन सा मॉडल डेटा का बेहतर वर्णन करता है, यह कोई व्याख्या नहीं देता है

ΔमैंΔमैं<2Δमैं<5

इसके अलावा, आप के लिए एक संभावना लिख ​​सकते हैंमैं

पीमैं=exp(-Δमैं2),

मैंसीमैंnमैंΔमैं=1.5पीमैं=0.47Δमैं=15पीमैं=0.0005मैंमैंसीमैंn

अंत में, एआईसी के फार्मूले के बारे में:

मैंसी=2-2एल,

एलΔमैं2Δमैं2Δ<1

टी एल; डॉ

  1. यह एक बुरा कारण है; AIC के पूर्ण मूल्यों के बीच अंतर का उपयोग करें।
  2. प्रतिशत कुछ भी नहीं कहता है।
  3. मॉडल, डेटा पर कोई जानकारी नहीं होने के कारण इस प्रश्न का उत्तर देना संभव नहीं है और विभिन्न परिणामों का क्या मतलब है।

2
यह सबसे स्पष्ट स्पष्टीकरण है जो मैंने कभी इस रहस्यमय मामले के बारे में देखा है। मैंने आपके द्वारा संदर्भित लेख (पीपी। 270-272) को देखा और यहाँ आपका स्पष्टीकरण एक सरल और स्पष्ट लेकिन बहुत सटीक प्रतिनिधित्व है जो लेख बताता है।
त्रिपक्षीयियो

क्या आप शायद इस अनुवर्ती प्रश्न की मदद कर सकते हैं? stats.stackexchange.com/questions/349883/...
Tripartio
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.