मैंने R में एक रेखीय प्रतिगमन के AIC की गणना करने की कोशिश की है, लेकिन AIC
इस तरह से फ़ंक्शन का उपयोग किए बिना :
lm_mtcars <- lm(mpg ~ drat, mtcars)
nrow(mtcars)*(log((sum(lm_mtcars$residuals^2)/nrow(mtcars))))+(length(lm_mtcars$coefficients)*2)
[1] 97.98786
हालाँकि, AIC
एक अलग मूल्य देता है:
AIC(lm_mtcars)
[1] 190.7999
क्या कोई मुझे बता सकता है कि मैं क्या गलत कर रहा हूं?
5
(अभी तक आपके उत्तर की जाँच के बिना): आप जरूरी कुछ गलत नहीं कर रहे हैं, क्योंकि संभावना वास्तव में केवल एक गुणक स्थिरांक तक परिभाषित है; दो लोग लॉग-लाइबिलिटी की गणना कर सकते हैं और अलग-अलग संख्या प्राप्त कर सकते हैं (लेकिन लॉग-लाइबिलिटी में अंतर समान है)।
—
Glen_b -Reinstate मोनिका
हाँग ओइस जवाब इस सवाल से संबंधित है, मुझे लगता है। फ़ंक्शन
—
COSSerdash
AIC
का उपयोग करने वाला सूत्र है -2*as.numeric(logLik(lm_mtcars))+2*(length(lm_mtcars$coefficients)+1)
।
लुसियानो: उस सूत्र @COOLSerdash में "+1" विचरण पैरामीटर शब्द से उत्पन्न होता है। यह भी ध्यान दें कि फ़ंक्शन का
—
Glen_b -Reinstate Monica
logLik
कहना है कि lm
मॉडलों के लिए इसमें 'सभी स्थिरांक' शामिल हैं ... इसलिए log(2*pi)
वहां कहीं एक होगा
@Glen_b: यह क्यों कहते हैं कि संभावना केवल एक गुणक स्थिरांक तक परिभाषित है? आखिरकार, जब वितरण के विभिन्न परिवारों (जैसे कि एआईसी, या कॉक्स परीक्षण के साथ) से गैर-नेस्टेड मॉडल की तुलना करते हैं, तो आपको उस निरंतर को याद रखना होगा।
—
Scortchi - को पुनः स्थापित मोनिका
@Scortchi परिभाषा मेरी नहीं है! आपको इसे RAFisher के साथ लेना होगा। यह शुरू से ही ऐसा रहा है, मुझे लगता है (1921)। यह अभी भी उस तरह से परिभाषित है, कम से कम निरंतर मामले में, उदाहरण के लिए, 'अधिक सटीक रूप से' वाक्य की शुरुआत में यहां देखें ।
—
Glen_b -Reinstate मोनिका