ऑर्डिनल लॉजिस्टिक रिग्रेशन की व्याख्या


17

मैंने इस क्रमिक लॉजिस्टिक रिग्रेशन को R में चलाया:

mtcars_ordinal <- polr(as.factor(carb) ~ mpg, mtcars)

मुझे इस मॉडल का सारांश मिला:

summary(mtcars_ordinal)

Re-fitting to get Hessian

Call:
polr(formula = as.factor(carb) ~ mpg, data = mtcars)

Coefficients:
      Value Std. Error t value
mpg -0.2335    0.06855  -3.406

Intercepts:
    Value   Std. Error t value
1|2 -6.4706  1.6443    -3.9352
2|3 -4.4158  1.3634    -3.2388
3|4 -3.8508  1.3087    -2.9425
4|6 -1.2829  1.3254    -0.9679
6|8 -0.5544  1.5018    -0.3692

Residual Deviance: 81.36633 
AIC: 93.36633 

मैं mpgइस तरह के लिए गुणांक के लॉग बाधाओं प्राप्त कर सकते हैं :

exp(coef(mtcars_ordinal))
 mpg 
0.7917679 

और लॉग थ्रेसहोल्ड की सीमाएं जैसे:

exp(mtcars_ordinal$zeta)

       1|2         2|3         3|4         4|6         6|8 
0.001548286 0.012084834 0.021262900 0.277242397 0.574406353 

क्या कोई मुझे बता सकता है कि इस मॉडल की मेरी व्याख्या सही है:

जैसे-जैसे mpgएक इकाई बढ़ती जाती है, श्रेणी 5 से carbकिसी भी दूसरी श्रेणी में जाने की संभावना -0.23 तक कम हो जाती है। यदि लॉग ऑड्स 0.0015 की सीमा को पार करता है, तो एक कार के लिए अनुमानित मूल्य श्रेणी 2 का होगा carb। यदि लॉग ऑड्स 0.0121 की दहलीज को पार करता है, तो एक कार के लिए अनुमानित मूल्य श्रेणी 3 का होगा carb, और इसी तरह।

जवाबों:


10

आपने बाधाओं को पूरी तरह से भ्रमित किया है और बाधाओं को लॉग इन किया है। लॉग ऑड्स गुणांक हैं; बाधाओं को गुणांक गुणांक हैं। इसके अलावा, अंतर व्याख्या दूसरी तरह से गोल हो जाती है । (मैं सीमित आश्रित चर के बारे में अर्थमिति के साथ बड़ा हुआ, और क्रमिक प्रतिगमन की बाधाओं की व्याख्या है ... उह ... मेरे लिए मनोरंजक।) तो आपका पहला बयान पढ़ना चाहिए, "जैसा mpg कि एक इकाई, बाधाओं के रूप में बढ़ता है। बनाम 5 अन्य श्रेणियों की श्रेणी 1 के अवलोकन में carb 21% की वृद्धि हुई। "

जहां तक ​​थ्रेसहोल्ड की व्याख्या है, आपको वास्तव में सभी पूर्वानुमानित वक्रों को प्लॉट करना होगा ताकि यह कहा जा सके कि मोडल भविष्यवाणी क्या है:

mpg   <- seq(from=5, to=40, by=1)
xbeta <- mpg*(-0.2335)
logistic_cdf <- function(x) {
  return( 1/(1+exp(-x) ) )
}

p1 <- logistic_cdf( -6.4706 - xbeta )
p2 <- logistic_cdf( -4.4158 - xbeta ) - logistic_cdf( -6.4706 - xbeta )
p3 <- logistic_cdf( -3.8508 - xbeta ) - logistic_cdf( -4.4158 - xbeta )
p4 <- logistic_cdf( -1.2829 - xbeta ) - logistic_cdf( -3.8508 - xbeta )
p6 <- logistic_cdf( -0.5544 - xbeta ) - logistic_cdf( -1.2829 - xbeta )
p8 <- 1 - logistic_cdf( -0.5544 - xbeta )

plot(mpg, p1, type='l', ylab='Prob')
  lines(mpg, p2, col='red')
  lines(mpg, p3, col='blue')
  lines(mpg, p4, col='green')
  lines(mpg, p6, col='purple')
  lines(mpg, p8, col='brown')
  legend("topleft", lty=1, col=c("black", "red", "blue", "green", "purple", "brown"), 
         legend=c("carb 1", "carb 2", "carb 3", "carb 4", "carb 5", "carb 6"))

यहाँ छवि विवरण दर्ज करें

तीसरी श्रेणी के लिए नीला वक्र कभी नहीं उठा, और न ही 6 वीं श्रेणी के लिए बैंगनी वक्र। इसलिए अगर कुछ भी मैं कहूंगा कि mpg27 से ऊपर के मूल्यों के लिए , सबसे अधिक संभावना श्रेणी 1 है; 18 और 27 के बीच, श्रेणी 2; 4 और 18 के बीच, श्रेणी 4; और नीचे 4, श्रेणी 8. (मुझे आश्चर्य है कि यह क्या है कि आप अध्ययन कर रहे हैं - वाणिज्यिक ट्रक? अधिकांश यात्री कारों में इन दिनों mpg> 25) होना चाहिए। आप चौराहे के बिंदुओं को अधिक सटीक रूप से निर्धारित करने का प्रयास करना चाह सकते हैं।

मैंने यह भी देखा कि आपके पास ये अजीब श्रेणियां हैं जो 1, 2, 3, 4, फिर 6 (स्किपिंग 5), फिर 8 (स्किपिंग 7) जाती हैं। यदि 5 और 7 डिजाइन से गायब थे, तो यह ठीक है। यदि ये मान्य श्रेणियां हैं जो carbबस में नहीं आती हैं, तो यह अच्छा नहीं है।


ध्यान दें कि मैंने "कार्ब की श्रेणी 1 से अन्य 5 श्रेणियों में से किसी एक में स्थानांतरित" कैसे किया। क्या यह गलत है? मैं के साथ पकड़ पाने के लिए संघर्ष कर रहा हूँ "के रूप में mpg एक इकाई से बढ़ जाती है, कार्ब के अवलोकन 1 की श्रेणी बनाम अन्य 5 श्रेणियों में 21% की वृद्धि होती है।" इसका तात्पर्य यह है कि यदि mpg लगभग 5 इकाइयों से बढ़ता है, तो श्रेणी 1 के अवलोकन का 100% मौका होगा। लेकिन यदि mpg में 5 इकाइयों की वृद्धि हुई है, तो श्रेणी 8 का अवलोकन करने की अधिक संभावना होनी चाहिए, श्रेणी 1 की नहीं
लूसियानो

3
मैंने आंकड़ा जोड़ा; मुझे संदेह था कि इससे आपके उत्तर की व्याख्या करना आसान हो जाएगा - आशा है कि आप इसे पसंद करेंगे। (BTW, के लिए प्रलेखन ? Mtcars का कहना है कि डेटा मोटर ट्रेंड्स के 1974 के एक अंक से परीक्षण के परिणाम हैं ।)
गंग - मोनिका

क्या कोई व्यक्ति लुसियानो के अंतिम प्रश्न का उत्तर दे सकता है? मुझे यह बहुत दिलचस्प लगता है।
इरोसिनिन

1
mpg23134515

1
जैसा polrकि मॉडल को परिभाषित करता है logit P(Y <= k | x) = zeta_k - eta, @ StasK की व्याख्या को पढ़ना नहीं चाहिए, "जैसा mpg कि एक इकाई से बढ़ता है, carb बनाम 5 अन्य श्रेणियों exp(-(-0.2335)) = 1.26
मोरमो

3

ऑर्डर किए गए लॉगिट मॉडल में, ऑड्स किसी विशिष्ट सीमा से नीचे किसी भी श्रेणी में होने की संभावना का अनुपात बनाते हैं। संभावना एक ही सीमा से ऊपर की श्रेणी में होती है (जैसे, तीन श्रेणियों के साथ: श्रेणी ए या बी बनाम में होने की संभावना सी।, साथ ही श्रेणी ए बनाम बी या सी) में होने की संभावना।

यह logit P(Y <= k | x) = zeta_k - etaवर्णन के अनुसार मॉडल की ओर जाता है polr()। इसलिए, ऑड्स रेशियो का निर्माण अलग-अलग श्रेणियों के लिए या अलग-अलग रजिस्टरों के लिए किया जा सकता है। उत्तरार्द्ध, अधिक सामान्य एक ही श्रेणियों के लिए ऑड्स की तुलना करता है लेकिन विभिन्न रजिस्टरों और समान है

रों(y|एक्स)रों(y|एक्स) = exp(-(η-η))

विभिन्न श्रेणियों के लिए अंतर अनुपात के रूप में परिभाषित किया गया है

रों(yमैं|एक्समैं)रों(yमैं|एक्समैं) = exp(ζ-ζ),

जिससे अनुपात रेजिस्टर्स से स्वतंत्र होता है। यह गुण वैकल्पिक नाम आनुपातिक बाधाओं मॉडल की ओर जाता है

इस सरल, लेकिन शायद बहुत सहज उदाहरण में, आप तैयार कर सकते हैं: प्रतिगामी में एक इकाई की वृद्धि के लिए mpg, श्रेणी 1 के अवलोकन की संभावनाएं । किसी भी उच्च श्रेणी का अवलोकन (या किसी निश्चित सीमा से नीचे किसी भी श्रेणी का अवलोकन करने की संभावनाएं)। समान सीमा से ऊपर की किसी भी श्रेणी का अवलोकन) को 1.26 से गुणा किया जाता है या 26% ( exp(-(-0.233 - 0)) = 1.263) बढ़ाया जाता है । यदि आप विभिन्न श्रेणियों के अंतर अनुपात को तैयार करना चाहते हैं, तो आप कह सकते हैं, उदाहरण के लिए, श्रेणी 1 या किसी भी श्रेणी में होने की संभावनाएं श्रेणी 1 या 2 में होने की बाधाओं की तुलना में ऊपर किसी भी श्रेणी के बराबर होती हैं exp((-6.470) - (-4.415)) = 0.128। जिससे बाद की व्याख्या इस विशिष्ट सेटअप में बहुत मददगार नहीं है। विभिन्न श्रेणियों के लिए एक विषम अनुपात का एक उदाहरण हाईस्कूल में जाने की बाधाओं की तुलना में कॉलेज जाने का अंतर हो सकता है।

(ζ-ζ-1)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.