क्रॉस सत्यापन और क्रमिक लॉजिस्टिक प्रतिगमन


12

मैं ऑर्डिनल लॉजिस्टिक रिग्रेशन के लिए क्रॉस-वैलिडेशन को समझने की कोशिश कर रहा हूं। खेल का उद्देश्य एक विश्लेषण में इस्तेमाल किए गए मॉडल को मान्य करना है ...

मैं पहले एक खिलौना डेटा सेट का निर्माण करता हूं:

set.seed(1)
N <- 10000
# predictors
x1 <- runif(N)
x2 <- runif(N)
x3 <- runif(N)

# coeffs in the model
a <- c(-2,-1)
x <- -x1+2*x2+x3

# P( y ≤ i ) is given by logit^{-1} ( a[i]+x )
p <- outer(a,x, function(a,x) 1/(1+exp(-a-x)) )

# computing the probabilities of each category
q <- 1 - p[2,]
p[2,] <- p[2,] - p[1,];
p <- rbind(p,q);

# outcome
y <- ordered( apply( p, 2, function(p) which(rmultinom(1,1,p)>0) ) ) 

अब, मैं lrmपैकेज में इसका उपयोग करके मॉडल फिट करता हूं rms

require("rms")
fit <- lrm(y~x1+x2+x3, x=TRUE,y=TRUE)


> fit

Logistic Regression Model

lrm(formula = y ~ x1 + x2 + x3, x = TRUE, y = TRUE)

                      Model Likelihood     Discrimination    Rank Discrim.
                         Ratio Test            Indexes          Indexes   
Obs         10000    LR chi2    1165.46    R2       0.126    C       0.664
 1           2837    d.f.             3    g        0.779    Dxy     0.328
 2           2126    Pr(> chi2) <0.0001    gr       2.178    gamma   0.329
 3           5037                          gp       0.147    tau-a   0.203
max |deriv| 4e-10                          Brier    0.187                 

     Coef    S.E.   Wald Z Pr(>|Z|)
y>=2  2.1048 0.0656  32.06 <0.0001
y>=3  1.0997 0.0630  17.45 <0.0001
x1    0.8157 0.0675  12.09 <0.0001
x2   -1.9790 0.0701 -28.21 <0.0001
x3   -1.0095 0.0687 -14.68 <0.0001

मैं परिणाम के दूसरे भाग को समझता हूं: मॉडल में मेरे द्वारा लगाए गए गुणांक यहां हैं (यह लगभग पूर्ण है N = 100000)। संकेत उलट है क्योंकि मेरे मॉडल में मैं coeffs इस्तेमाल किया जा रहा है की बाधाओं की गणना करने के , और 2 , यहाँ यह अन्य रास्ता नहीं है, मुझे लगता है कि बहुत मुद्दों नहीं है वहाँ।12

हालाँकि मुझे भेदभाव और रैंक भेदभाव इंडेक्स की समझ नहीं है । क्या आप मेरी मदद कर सकते हैं?! कुछ संकेत?

हालात तब बदतर होते हैं जब हम मान्यता को पार कर जाते हैं ...

> validate(fit, method="cross")
          index.orig training    test optimism index.corrected  n
Dxy           0.3278   0.3278  0.3290  -0.0012          0.3291 40
R2            0.1260   0.1260  0.1313  -0.0053          0.1313 40
Intercept     0.0000   0.0000 -0.0072   0.0072         -0.0072 40
Slope         1.0000   1.0000  1.0201  -0.0201          1.0201 40
Emax          0.0000   0.0000  0.0056   0.0056          0.0056 40
D             0.1164   0.1165  0.1186  -0.0021          0.1186 40
U            -0.0002  -0.0002 -0.8323   0.8321         -0.8323 40
Q             0.1166   0.1167  0.9509  -0.8342          0.9509 40
B             0.1865   0.1865  0.1867  -0.0001          0.1867 40
g             0.7786   0.7786  0.7928  -0.0142          0.7928 40
gp            0.1472   0.1472  0.1478  -0.0007          0.1478 40

Mmffff? यह क्या है? मैं इसकी व्याख्या कैसे करूं? मैन पेज कुछ स्पष्टीकरण देता है, मेरे पास इस पेपर तक पहुंच नहीं है ... और मैं जटिलता के एक महासागर से अभिभूत महसूस करता हूं। कृपया सहायता कीजिए!

जवाबों:


11

index.origindex.correctedDxyडीएक्सyडीएक्सy=2(सी-12)सीInterceptSlopeEmaxB

तरीकों का वर्णन मेरी पुस्तक या पुस्तक की वेब साइट पर पाठ्यक्रम नोट्स में किया गया है: http://biostat.mc.vanderbilt.edu/rms


धन्यवाद, फ्रैंक। क्या आपकी पुस्तक पैकेज को संदर्भित करती है? क्या इसमें Dxy पर अधिक विवरण हैं?
एल्विस

1
Designrmsडीएक्सy

धन्यवाद। मैंने इसे घंटों तक देखा और मुझे वह नहीं मिला। मैं तुम्हारी किताब खरीदूंगा।
एल्विस

1

आपके पहले प्रश्न के लिए: वे विभिन्न मॉडल प्रदर्शन माप हैं। आप चाहते हैं कि उनमें से कुछ बड़े हों, दूसरे छोटे हों। वास्तव में वे किसी तरह से संबंधित हैं इसलिए सुझाव दें कि आप एक या दो पर ध्यान केंद्रित करें

आपके दूसरे प्रश्न के लिए: आपके पहले R आउटपुट में आपके पास क्या है, प्रशिक्षण नमूने पर आपका मॉडल प्रदर्शन है। जब आप क्रॉस-वैलिडेशन द्वारा सत्यापन करते हैं, तो आप उन मापों को कई परीक्षण नमूनों और उनके औसत पर प्राप्त करते हैं। यह आपको और अधिक यथार्थवादी अनुमान देता है कि आपका मॉडल कैसा प्रदर्शन करता है।

HTH

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.