इस साइट पर कहीं और एक सवाल में , कई जवाबों में उल्लेख किया गया है कि एआईसी छुट्टी-एक-आउट (एलओयू) क्रॉस-मान्यता के बराबर है और बीआईसी के-फोल्ड क्रॉस सत्यापन के बराबर है। क्या R में इसे अनुभवजन्य रूप से प्रदर्शित करने का एक तरीका है कि LOO और K-fold में शामिल तकनीकों को स्पष्ट और AIC और BIC मानों के बराबर प्रदर्शित किया जाए? खैर टिप्पणी कोड इस संबंध में मददगार होगा। इसके अलावा, BIC को प्रदर्शित करने में कृपया lme4 पैकेज का उपयोग करें। एक नमूना डाटासेट के लिए नीचे देखें ...
library(lme4) #for the BIC function
generate.data <- function(seed)
{
set.seed(seed) #Set a seed so the results are consistent (I hope)
a <- rnorm(60) #predictor
b <- rnorm(60) #predictor
c <- rnorm(60) #predictor
y <- rnorm(60)*3.5+a+b #the outcome is really a function of predictor a and b but not predictor c
data <- data.frame(y,a,b,c)
return(data)
}
data <- generate.data(76)
good.model <- lm(y ~ a+b,data=data)
bad.model <- lm(y ~ a+b+c,data=data)
AIC(good.model)
BIC(logLik(good.model))
AIC(bad.model)
BIC(logLik(bad.model))
पहले की टिप्पणियों के अनुसार, नीचे मैंने 1 से 10000 तक के बीजों की एक सूची प्रदान की है जिसमें AIC और BIC असहमत हैं। यह उपलब्ध बीजों के माध्यम से एक सरल खोज के द्वारा किया गया था, लेकिन यदि कोई व्यक्ति डेटा उत्पन्न करने का एक तरीका प्रदान कर सकता है, जो इन दो सूचना मानदंडों से विशेष रूप से जानकारीपूर्ण हो सकता है, तो यह अलग-अलग उत्तर देगा।
notable.seeds <- read.csv("http://student.ucr.edu/~rpier001/res.csv")$seed
एक तरफ के रूप में, मैंने इन बीजों को ऑर्डर करने के बारे में सोचा कि किस हद तक एआईसी और बीआईसी असहमत हैं, जिसे मैंने एआईसी और बीआईसी के पूर्ण मतभेदों के योग के रूप में मात्रात्मक बनाने की कोशिश की है। उदाहरण के लिए,
AICDiff <- AIC(bad.model) - AIC(good.model)
BICDiff <- BIC(logLik(bad.model)) - BIC(logLik(good.model))
disagreement <- sum(abs(c(AICDiff,BICDiff)))
जहां मेरी असहमति मीट्रिक केवल तभी लागू होती है जब अवलोकन उल्लेखनीय होते हैं। उदाहरण के लिए,
are.diff <- sum(sign(c(AICDiff,BICDiff)))
notable <- ifelse(are.diff == 0 & AICDiff != 0,TRUE,FALSE)
हालांकि ऐसे मामलों में जहां एआईसी और बीआईसी असहमत थे, गणना की गई असहमति मूल्य हमेशा एक ही था (और नमूना का एक कार्य है)। यह देखते हुए कि एआईसी और बीआईसी की गणना कैसे की जाती है, मैं देख सकता हूं कि यह मामला कम्प्यूटेशनल रूप से क्यों हो सकता है, लेकिन मुझे यकीन नहीं है कि यह वैचारिक रूप से मामला क्यों होगा। अगर कोई उस मुद्दे को भी स्पष्ट कर सकता है, तो मैं इसकी सराहना करूंगा।