मैं तर्क देता हूं कि कम से कम जब रैखिक मॉडल (जैसे एआर मॉडल) पर चर्चा की जाती है, तो समायोजित किया जाता है R2 और AIC अलग नहीं हैं।
इस सवाल पर विचार करें कि क्या X2 में शामिल किया जाना चाहिए
y=X1(n×K1)β1+X2(n×K2)β2+ϵ
यह मॉडल की तुलना करने के बराबर है
M1M2::y=X1β1+uy=X1β1+X2β2+u,
कहाँ पे
E(u|X1,X2)=0। हम कहते हैं कि
M2है
सच मॉडल अगर
β2≠0। नोटिस जो
M1⊂M2। इस प्रकार मॉडल
नेस्टेड होते हैं । एक मॉडल चयन प्रक्रिया
Mˆ एक डेटा-निर्भर नियम है जो कई मॉडलों के सबसे प्रशंसनीय का चयन करता है।
हम कहते है
Mˆहै संगत करता है, तो
limn→∞P(Mˆ=M1|M1)limn→∞P(Mˆ=M2|M2)==11
समायोजित पर विचार करें । अर्थात्, if । जैसा कि में नीरस रूप से घट रहा है , यह प्रक्रिया को कम करने के बराबर है । बदले में, यह न्यूनतम बराबर है । पर्याप्त रूप से बड़े , बाद वाले को रूप में लिखा जा सकता है।
जहांR2M1R¯21>R¯22R¯2s2s2log(s2)n
log(s2)==≈≈log(σˆ2nn−K)log(σˆ2)+log(1+Kn−K)log(σˆ2)+Kn−Klog(σˆ2)+Kn,
σˆ2त्रुटि विचरण के एमएल अनुमानक है। इसलिए आधार पर मॉडल चयन इसलिए सबसे छोटा साथ मॉडल चुनने के लिए समान रूप से समान है
। यह प्रक्रिया असंगत है।
R¯2log(σˆ2)+K/n
प्रस्ताव :
limn→∞P(R¯21>R¯22|M1)<1
सबूत :
जहां 2-से-अंतिम पंक्ति इस प्रकार है क्योंकि सांख्यिकीय रेखीय प्रतिगमन मामले में LR आँकड़ा है जो एक स्पर्शोन्मुख अनुसरण करता है अशक्त वितरण। QED
P(R¯21>R¯22|M1)≈=≈=→<P(log(s21)<log(s22)|M1)P(nlog(s21)<nlog(s22)|M1)P(nlog(σˆ21)+K1<nlog(σˆ22)+K1+K2|M1)P(n[log(σˆ21)−log(σˆ22)]<K2|M1)P(χ2K2<K2)1,
χ2K2
अब Akaike की कसौटी पर विचार करें,
इस प्रकार, AIC SSR की कटौती को बंद कर देता है, जो अतिरिक्त जुर्माना के लिए "जुर्माना" शब्द के विरुद्ध है। , “जो विपरीत दिशा में इंगित करता है। इस प्रकार, यदि , तो
चुनें, अन्यथा ।
AIC=log(σˆ2)+2Kn
M1AIC1<AIC2M2
यह देखा जा सकता है कि तीनों को साथ उपरोक्त प्रमाण को जारी रखकर भी असंगत है। । समायोजित और इस प्रकार सकारात्मक संभावना के साथ "बड़े" मॉडल चयन करते हैं , भले ही ही सही मॉडल हो।AICP(nlog(σˆ21)+2K1<nlog(σˆ22)+2(K1+K2)|M1)R2AICM2M1
चूंकि AIC में जटिलता के लिए दंड समायोजित तुलना में थोड़ा बड़ा है , हालांकि यह ओवरसाइज़ के लिए कम प्रवण हो सकता है, हालाँकि। और इसमें अन्य अच्छे गुण हैं (केएल विचलन को कम करने के लिए सही मॉडल अगर यह माना जाता है कि मॉडल के सेट में नहीं है) जो मेरे पोस्ट में संबोधित नहीं हैं।R2