विभिन्न एआईसी की परिभाषा


12

विकिपीडिया से Akaike की सूचना मानदंड (AIC) की परिभाषा , जहाँ मापदंडों की संख्या है और मॉडल की लॉग-लाइबिलिटी है।k k log LAIC=2k2logLklogL

हालाँकि, हमारे इकोनोमेट्रिक्स ने एक अच्छी तरह से सम्मानित विश्वविद्यालय में नोट किया है कि । यहाँ ARMA मॉडल में त्रुटियों के लिए अनुमानित विचरण है और समय श्रृंखला डेटासेट में टिप्पणियों की संख्या है।σ 2टीAIC=log(σ^2)+2kTσ^2T

क्या बाद की परिभाषा पहले के बराबर है, लेकिन केवल एआरएमए मॉडल के लिए तैयार है? या दोनों परिभाषाओं के बीच किसी तरह का संघर्ष है?


3
रिकॉर्ड के लिए: मानदंड एकवचन, मानदंड बहुवचन। (तदनुसार संपादित।)
निक कॉक्स

जवाबों:


15

आपके नोट्स से जो सूत्र आप उद्धृत करते हैं, वह वास्तव में एआईसी नहीं है।

AIC ।2logL+2k

यहाँ मैं एक अनुमानित व्युत्पत्ति की रूपरेखा दूंगा जो स्पष्ट करता है कि क्या चल रहा है।

यदि आपके पास निरंतर विचरण के साथ स्वतंत्र सामान्य त्रुटियों वाला मॉडल है,

Lσne12σ2εi2

जिसका अनुमान अधिकतम संभावना के तहत लगाया जा सकता है

(σ^2)n/2e12nσ^2/σ^2(σ^2)n/2e12n(σ^2)n/2

(अनुमान लगाना का एमएल अनुमान है)σ2

तो (एक स्थिर द्वारा स्थानांतरण करने के लिए)2logL+2k=nlogσ^2+2k

अब ARMA मॉडल में, यदि और की तुलना में वास्तव में बड़ा है , तो संभावना को इस तरह के एक गाऊसी ढांचे द्वारा अनुमानित किया जा सकता है (उदाहरण के लिए, आप ARMA को लिखने के लिए पर्याप्त शर्तों पर एक लंबे AR और स्थिति के रूप में लिख सकते हैं - AR) प्रतिगमन मॉडल के रूप में), इसलिए स्थान पर साथ :पी क्यू टी एनTpqTn

AICTlogσ^2+2k

इसलिये

AIC/Tlogσ^2+2k/T

अब यदि आप केवल AIC की तुलना कर रहे हैं , तो द्वारा उस विभाजन से कोई फर्क नहीं पड़ता, क्योंकि यह AIC मानों के क्रम को नहीं बदलता है।T

हालाँकि, यदि आप AIC का उपयोग किसी अन्य उद्देश्य के लिए कर रहे हैं जो AIC में अंतरों के वास्तविक मूल्य पर निर्भर करता है (जैसे कि बर्नहैम और एंडरसन द्वारा वर्णित मल्टीमॉडल इंट्रेंस के रूप में), तो यह मायने रखता है।

कई अर्थमिति ग्रंथ इस AIC / T फॉर्म का उपयोग करते हैं। अजीब तरह से, कुछ किताबें हर्विच और त्साई 1989 या उस रूप के लिए फाइंडली 1985 का संदर्भ देती हैं, लेकिन हुरिविच और त्सई और फाइंडली मूल रूप की चर्चा करते हुए प्रतीत होते हैं (हालांकि मेरे पास अभी इस बात का अप्रत्यक्ष संकेत है कि फाइंडली अभी क्या है, इसलिए शायद यही है) उस पर Findley में कुछ)।

इस तरह की स्केलिंग कई कारणों से की जा सकती है - उदाहरण के लिए, टाइम सीरीज़, विशेष रूप से हाई फ़्रीक्वेंसी टाइम सीरीज़, बहुत लंबी हो सकती है और साधारण AICs में अनचाहे बनने की प्रवृत्ति हो सकती है, खासकर अगर बहुत छोटा है। (कुछ अन्य संभावित कारण हैं, लेकिन चूंकि मुझे वास्तव में इसका कारण नहीं पता है इसलिए यह किया गया था कि मैं सभी संभावित कारणों की सूची नीचे नहीं जाऊंगा।)σ2

आप रॉब ह्यंडमैन की तथ्यों और एआईसी के पतन की सूची को देखना पसंद कर सकते हैं , - विशेष रूप से आइटम 3 से 7। उन बिंदुओं में से कुछ आपको कम से कम थोड़ा सतर्क होने के लिए प्रेरित कर सकते हैं क्योंकि कौशिक संभावना द्वारा सन्निकटन पर बहुत अधिक निर्भरता है, लेकिन हो सकता है कि मैं यहां पेश करने की तुलना में बेहतर औचित्य हूं।

मुझे यकीन नहीं है कि वास्तविक एआईसी के बजाय लॉग-लाइक के लिए इस सन्निकटन का उपयोग करने का एक अच्छा कारण है क्योंकि इन दिनों बहुत सारे श्रृंखला पैकेज पैकेज एआरएमए मॉडल के लिए वास्तविक लॉग-लाइबिलिटी की गणना (अधिकतम) करते हैं। इसका उपयोग नहीं करने के लिए बहुत कम कारण लगता है।


1
जल्दी या बाद में, किसी भी * आईसी के बारे में हर चर्चा "यह वह मानदंड है जो आपको उपयोग करना चाहिए, सिवाय इसके कि यह अक्सर ऐसी और ऐसी परिस्थितियों में गलत जवाब देता है"। बस विडंबना है, आम तौर पर उपयोगी उत्तर के सभी महत्वपूर्ण पर नहीं। यह वास्तविक जीवन की तरह ही है, जहां कुछ सामान्य कहावत जैसे कि "लव एवरीवन" आमतौर पर अन्य सलाह द्वारा अस्थायी रूप से ओवरराइड किया जाता है अगर कोई आपको मारने या चीरने की कोशिश कर रहा है।
निक कॉक्स

1
@ नहीं मैं एआईसी के बजाय एआईसी / उपयोग करने वाले ग्रंथों से परेशान नहीं हूं , लेकिन मुझे चिंता क्या है कि मैंने देखा है कि अर्थमिति की बहुत सी किताबें मैंने बिना किसी टिप्पणी के इसे "एआईसी" कहा है । मेरे लिए यह सिर्फ लापरवाह गैर जिम्मेदाराना है। जो पहले करना था, लेकिन यह नहीं कहा कि बार-बार नकल की गई है। n
Glen_b -Reinstate मोनिका

2

मेरा मानना ​​है कि यह सामान्य त्रुटियों की धारणा पर आधारित है। अर्थमिति में, आप विशेष रूप से एआईसी का उपयोग करके समय श्रृंखला अनुप्रयोगों में, एसिम्पोटिक्स का उपयोग कर काम करते हैं। नतीजतन, सामान्य धारणा को इस (असममित) मॉडल चयन योजना को सही ठहराने के लिए asymptotically पकड़ना चाहिए।

स्मरण करें कि सामान्य संभावना का लघुगणक , जहां हम और यदि आपका डेटा X से लिया गया है। इस प्रकार हम पहले कार्यकाल की उपेक्षा करते हैं, तो मनाया गया नमूना इसे प्रभावित नहीं करता है।ln(L)=(T/2)ln(2π)(T/2)ln(σ2)(1/2σ2)(xiμ)E(X)=μVar(X)=σ2x1,...,xT

सामान्य संभावना के लिए अधिक सामान्य (पहले) सूत्र का उपयोग करें और में प्लग करें । पहले शब्द को नजरअंदाज किया जा सकता है (यह प्रतिगामी पसंद की परवाह किए बिना एक स्थिर है)। दूसरा शब्द बन जाता है । तीसरा शब्द बनता है , जहां हमने । फिर, एक परिमित नमूना सुधार का उपयोग नहीं करना यहाँ उचित है क्योंकि यह अनुमानक केवल सामान्य रूप से मान्य है यदि त्रुटियां सामान्य नहीं हैं। चूँकि हम नहीं जानते हैं , इसलिए हमें तीसरे शब्द का अनुमान लगाना होगा = टी।टी एल एन ( σ 2 ) ( 1 / σ 2 ) ( टी σ 2 ) σ 2 = टी - 1 Σ ( एक्स मैं - ˉ एक्स ) σ 2LTln(σ2)(1/σ2)(Tσ^2)σ^2=T1(xix¯)σ2(1/σ2)(Tσ^2)=(1/σ^2)(Tσ^2)

सारांश में, इसका मतलब है कि हम सामान्य संभावना के लिए प्राप्त करते हैं कि । यह कहने की आवश्यकता नहीं है कि निरंतर अनदेखी से न्यूनतमकरण प्रभावित नहीं होता है । यह शब्द अब केवल द्वारा विभाजित है , क्योंकि यह द्वारा सभी एडिटिव घटकों को स्केल करने के लिए न्यूनतमकरण समस्या को नहीं बदलता है । यह आपको दूसरे परिणाम में , क्योंकि और न्यूनतमकरण के उद्देश्य के लिए समान हैं।1 टी टी मैं सी मैं सी / टीAIC=2k+Tln(σ2)+11TTAICAIC/T

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.