मैं ऑर्डिनल लॉजिस्टिक रिग्रेशन के लिए क्रॉस-वैलिडेशन को समझने की कोशिश कर रहा हूं। खेल का उद्देश्य एक विश्लेषण में इस्तेमाल किए गए मॉडल को मान्य करना है ...
मैं पहले एक खिलौना डेटा सेट का निर्माण करता हूं:
set.seed(1)
N <- 10000
# predictors
x1 <- runif(N)
x2 <- runif(N)
x3 <- runif(N)
# coeffs in the model
a <- c(-2,-1)
x <- -x1+2*x2+x3
# P( y ≤ i ) is given by logit^{-1} ( a[i]+x )
p <- outer(a,x, function(a,x) 1/(1+exp(-a-x)) )
# computing the probabilities of each category
q <- 1 - p[2,]
p[2,] <- p[2,] - p[1,];
p <- rbind(p,q);
# outcome
y <- ordered( apply( p, 2, function(p) which(rmultinom(1,1,p)>0) ) )
अब, मैं lrm
पैकेज में इसका उपयोग करके मॉडल फिट करता हूं rms
।
require("rms")
fit <- lrm(y~x1+x2+x3, x=TRUE,y=TRUE)
> fit
Logistic Regression Model
lrm(formula = y ~ x1 + x2 + x3, x = TRUE, y = TRUE)
Model Likelihood Discrimination Rank Discrim.
Ratio Test Indexes Indexes
Obs 10000 LR chi2 1165.46 R2 0.126 C 0.664
1 2837 d.f. 3 g 0.779 Dxy 0.328
2 2126 Pr(> chi2) <0.0001 gr 2.178 gamma 0.329
3 5037 gp 0.147 tau-a 0.203
max |deriv| 4e-10 Brier 0.187
Coef S.E. Wald Z Pr(>|Z|)
y>=2 2.1048 0.0656 32.06 <0.0001
y>=3 1.0997 0.0630 17.45 <0.0001
x1 0.8157 0.0675 12.09 <0.0001
x2 -1.9790 0.0701 -28.21 <0.0001
x3 -1.0095 0.0687 -14.68 <0.0001
मैं परिणाम के दूसरे भाग को समझता हूं: मॉडल में मेरे द्वारा लगाए गए गुणांक यहां हैं (यह लगभग पूर्ण है N = 100000
)। संकेत उलट है क्योंकि मेरे मॉडल में मैं coeffs इस्तेमाल किया जा रहा है की बाधाओं की गणना करने के , और ≤ 2 , यहाँ यह अन्य रास्ता नहीं है, मुझे लगता है कि बहुत मुद्दों नहीं है वहाँ।
हालाँकि मुझे भेदभाव और रैंक भेदभाव इंडेक्स की समझ नहीं है । क्या आप मेरी मदद कर सकते हैं?! कुछ संकेत?
हालात तब बदतर होते हैं जब हम मान्यता को पार कर जाते हैं ...
> validate(fit, method="cross")
index.orig training test optimism index.corrected n
Dxy 0.3278 0.3278 0.3290 -0.0012 0.3291 40
R2 0.1260 0.1260 0.1313 -0.0053 0.1313 40
Intercept 0.0000 0.0000 -0.0072 0.0072 -0.0072 40
Slope 1.0000 1.0000 1.0201 -0.0201 1.0201 40
Emax 0.0000 0.0000 0.0056 0.0056 0.0056 40
D 0.1164 0.1165 0.1186 -0.0021 0.1186 40
U -0.0002 -0.0002 -0.8323 0.8321 -0.8323 40
Q 0.1166 0.1167 0.9509 -0.8342 0.9509 40
B 0.1865 0.1865 0.1867 -0.0001 0.1867 40
g 0.7786 0.7786 0.7928 -0.0142 0.7928 40
gp 0.1472 0.1472 0.1478 -0.0007 0.1478 40
Mmffff? यह क्या है? मैं इसकी व्याख्या कैसे करूं? मैन पेज कुछ स्पष्टीकरण देता है, मेरे पास इस पेपर तक पहुंच नहीं है ... और मैं जटिलता के एक महासागर से अभिभूत महसूस करता हूं। कृपया सहायता कीजिए!