एक संभावित व्याख्या आपके परिणाम और भविष्यवक्ता के बीच संबंधों में गैर-समानताएं होगी।
यहाँ एक छोटा सा उदाहरण है। हम एक भविष्यवक्ता का उपयोग करते हैं जो [ - १ , १ ] पर समान है । परिणाम, तथापि, यह नहीं है कि रैखिक कारक पर निर्भर है, लेकिन पर वर्ग सही के लिए दोनों अधिक होने की संभावना है: भविष्यवक्ता की एक्स ≈ - 1 और x ≈ 1 के लिए है, लेकिन कम संभावना x ≈ 0 । इस मामले में, एक रैखिक मॉडल महत्वहीन होगा, लेकिन भविष्यवक्ता को अंतराल में काटने से यह महत्वपूर्ण हो जाता है।
> set.seed(1)
> nn <- 1e3
> xx <- runif(nn,-1,1)
> yy <- runif(nn)<1/(1+exp(-xx^2))
>
> library(lmtest)
>
> model_0 <- glm(yy~1,family="binomial")
> model_1 <- glm(yy~xx,family="binomial")
> lrtest(model_1,model_0)
Likelihood ratio test
Model 1: yy ~ xx
Model 2: yy ~ 1
#Df LogLik Df Chisq Pr(>Chisq)
1 2 -676.72
2 1 -677.22 -1 0.9914 0.3194
>
> xx_cut <- cut(xx,c(-1,-0.3,0.3,1))
> model_2 <- glm(yy~xx_cut,family="binomial")
> lrtest(model_2,model_0)
Likelihood ratio test
Model 1: yy ~ xx_cut
Model 2: yy ~ 1
#Df LogLik Df Chisq Pr(>Chisq)
1 3 -673.65
2 1 -677.22 -2 7.1362 0.02821 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
हालांकि, इसका मतलब यह नहीं है कि भविष्यवक्ता का विवेक सबसे अच्छा तरीका है। (यह लगभग कभी नहीं होता है।) बहुत बेहतर है कि बिना छींटे या समान का उपयोग करके अशुभता का मॉडल बनाया जाए ।