आप दो मॉडलों की तुलना नहीं कर सकते क्योंकि वे एक ही चर को मॉडल नहीं करते हैं (जैसा कि आप अपने आप को सही ढंग से पहचानते हैं)। फिर भी एआईसी को नेस्टेड और नॉनस्टेड दोनों मॉडलों की तुलना करते समय काम करना चाहिए।
बस जारी रखने से पहले एक अनुस्मारक: एक गाऊसी लॉग-संभावना द्वारा दिया जाता है
log(L(θ))=−|D|2log(2π)−12log(|K|)−12(x−μ)TK−1(x−μ),
अपने मॉडल की सहसंयोजक संरचना होने के नाते, | डी | अपने डेटासेट में अंकों की संख्या, μ मतलब प्रतिक्रिया और x अपने आश्रित चर।K|D|μx
अधिक विशेष रूप से AIC की गणना बराबर की जाती है , जहाँ k आपके मॉडल में निश्चित प्रभावों की संख्या है और L आपके संभावना कार्य [1] है। यह व्यावहारिक रूप से आपकी मॉडलिंग मान्यताओं में विचरण ( 2 k ) और पूर्वाग्रह ( 2 log ( L ) ) के बीच व्यापार-बंद की तुलना करता है । जैसा कि आपके मामले में यह दो अलग-अलग लॉग-इन संरचना संरचनाओं की तुलना करेगा जब यह पूर्वाग्रह शब्द के लिए आया था। ऐसा इसलिए है क्योंकि जब आप अपने लॉग-लाइक की गणना व्यावहारिक रूप से करते हैं, तो आप दो शब्दों को देखते हैं: एक फिट शब्द, जिसे - 1 से दर्शाया जाता है2k−2log(L)kL2k2log(L), और एक जटिलता दंड शब्द,-1द्वारा निरूपित किया गया−12(x−μ)TK−1(x−μ)। इसलिए आप देखते हैं कि आपका फिट शब्द दो मॉडलों के बीच पूरी तरह से अलग है; पहले मामले में आप कच्चे डेटा से अवशेषों की तुलना करते हैं और दूसरे मामले में लॉग डेटा के अवशेष।−12log(|K|)
विकिपीडिया के अलावा, AIC को भी समान करने के लिए परिभाषित किया गया है: [3]; यह फ़ॉर्म यह और भी स्पष्ट करता है कि अलग-अलग निर्भर चर वाले विभिन्न मॉडल तुलनात्मक क्यों नहीं हैं। आरएसएस दो मामला है दोनों के बीच बस अतुलनीय है।|D|log(RSS|D|)+2k
आकाइक का मूल पेपर [4] वास्तव में समझ से काफी कठिन है (मुझे लगता है)। यह केएल डाइवर्जेंस (लगभग दो वितरणों के बीच अंतर) पर आधारित है और यह साबित करने पर अपना काम करता है कि आप अपने डेटा के अज्ञात सच्चे वितरण को कैसे अनुमानित कर सकते हैं और तुलना करें कि डेटा के वितरण के लिए आपका मॉडल मानता है। इसलिए "छोटे एआईसी स्कोर बेहतर है" ; आप अपने डेटा के अनुमानित सच्चे वितरण के करीब हैं।
तो एआईसी का उपयोग करते समय याद रखने योग्य सभी चीजों को एक साथ लाना तीन [2,5] हैं:
आप इसका उपयोग विभिन्न डेटा सेट के मॉडल की तुलना करने के लिए नहीं कर सकते हैं।
आपको सभी उम्मीदवार मॉडल के लिए एक ही प्रतिक्रिया चर का उपयोग करना चाहिए।
आपके पास होना चाहिए , क्योंकि अन्यथा आप अच्छा asymptotic स्थिरता नहीं मिलता है।|D|>>k
आपके लिए बुरी खबर को तोड़ने के लिए क्षमा करें, लेकिन एआईसी का उपयोग करके यह दिखाने के लिए कि आप एक पर निर्भर आश्रित चर का चयन कर रहे हैं, ऐसा करना कोई सांख्यिकीय ध्वनि नहीं है। दोनों मॉडलों में अपने अवशेषों के वितरण की जांच करें, यदि लॉग डेटा मामले ने सामान्य रूप से अवशेषों को वितरित किया है और कच्चे डेटा का मामला नहीं है, तो आपके पास सभी औचित्य हैं जिनकी आपको कभी आवश्यकता हो सकती है। आप यह भी जांचना चाहते हैं कि क्या आपका कच्चा डेटा एक लॉगऑनॉर्मल के अनुरूप है, जो एक औचित्य के लिए पर्याप्त हो सकता है।
सख्त गणितीय मान्यताओं के लिए खेल केएल विचलन और सूचना सिद्धांत है ...
आह, और कुछ संदर्भ:
- http://en.wikipedia.org/wiki/Akaike_information_criterion
- एकाइक सूचना मानदंड, शुहुआ हू, (प्रस्तुति p.17-18)
- एप्लाइड मल्टीवीरेट स्टैटिस्टिकल एनालिसिस, जॉनसन एंड विचर्न, 6 वां एड। (पृष्ठ ३ 38६-३)))
- सांख्यिकीय मॉडल पहचान, H. Akaike, IEEE Transactions on Automatic Control 19 (6): 716–723 (1974) पर एक नया रूप
- मॉडल चयन ट्यूटोरियल # 1: एकैके की सूचना मानदंड, डी। श्मिट और ई। मकालिक, (प्रस्तुति 3.3)