विस्तार (गुणांक) से लेकर विषम अनुपात और कारकों के साथ लॉजिस्टिक रिग्रेशन में उनकी व्याख्या


14

मैं सैट स्कोर और परिवार / जातीय पृष्ठभूमि के खिलाफ कॉलेज में स्वीकृति का एक रैखिक प्रतिगमन चला गया। डेटा काल्पनिक हैं। यह एक पूर्व प्रश्न पर अनुवर्ती है, पहले से ही उत्तर दिया गया है। सवाल यह है कि सादगी के लिए सैट स्कोर को छोड़ते समय बाधाओं और अनुपात को इकट्ठा करने पर ध्यान केंद्रित किया जाता है।

चर Accepted(0 या 1) और Background("लाल" या "नीला") हैं। मैंने डेटा सेट किया ताकि "लाल" पृष्ठभूमि के लोगों को इसमें आने की अधिक संभावना हो:

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_Ratio_RedvBlue=coef(fit), confint(fit)))

                        Odds_Ratio_RedvBlue             2.5 %       97.5 %
(Intercept)             0.7088608                     0.5553459   0.9017961
Backgroundred           2.4480042                     1.7397640   3.4595454

प्रशन:

  1. क्या 0.7% "नीले" पृष्ठभूमि के व्यक्ति का विषम अनुपात स्वीकार किया जा रहा है? मैं यह पूछ रहा हूं क्योंकि मुझे भी " Backgroundblue" के लिए 0.7 मिलता है अगर इसके बजाय मैं निम्नलिखित कोड चलाता हूं:

    fit <- glm(Accepted~Background-1, data=dat, family="binomial")
    exp(cbind(OR=coef(fit), confint(fit)))
    
  2. क्या "लाल" को स्वीकार नहीं किया जाना चाहिए ( ) केवल पारस्परिक : ( )?सीसीपीटी/आर:सीसीपीटी/बीएलयूहेरोंबीएलयू=1/हेरोंआर


1
क्या Rस्पष्ट रूप से कहता है गुणांक (समारोह के माध्यम से coef) आप "बाधाओं अनुपात" अपने उत्पादन में बुला रहे हैं। इससे पता चलता है कि आप दोनों के बीच अंतर की
whuber

मैंने आपके हाइपरलिंक पर पोस्ट पढ़ी।
एंटोनी परेला

गुणांक घातांक हैं: exp (coef (fit))।
एंटोनी पारेलाडा

हाँ: और के रूप में है कि सूत्र में मेरा उत्तर में बताया गया है, अवरोधन के घातांक आप देता है बाधाओं संदर्भ मामले की।
whuber

जवाबों:


13

मैं मैन्युअल रूप से बाधाओं और अनुपातों की गणना करके अपने प्रश्न का उत्तर देने पर काम कर रहा हूं:

Acceptance   blue            red            Grand Total
0            158             102                260
1            112             177                289
Total        270             279                549

तो रेड के ब्लू में स्कूल में आने का अजीब अनुपात है:

हेरों सीसीपीटी मैं आरहेरों सीसीसीपीटी मैं बीएलयू=177/102112/158=1.73530.7089=2.448

और यह Backgroundredवापसी है:

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_and_OR=coef(fit), confint(fit)))

                      Odds_and_OR                         2.5 %      97.5 %
(Intercept)             0.7088608                     0.5553459   0.9017961
Backgroundred           2.4480042                     1.7397640   3.4595454

(Intercept)112/158=0.7089

अगर इसके बजाय, मैं दौड़ता हूं:

fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(Odds=coef(fit2), confint(fit2)))

                        Odds            2.5 %      97.5 %
Backgroundblue     0.7088608        0.5553459   0.9017961
Backgroundred      1.7352941        1.3632702   2.2206569

रिटर्न ठीक हैं बाधाओं जा रहा है 'ब्लू' में होने का: Backgroundblue(0.7089) और बाधाओं जा रहा स्वीकार किए जाने के 'लाल': Backgroundred(1.7353)। वहाँ कोई अनुपात नहीं। इसलिए दो वापसी मूल्यों के पारस्परिक होने की उम्मीद नहीं है।

अंत में, कैसे परिणाम को पढ़ने के लिए है अगर श्रेणीबद्धता में 3 कारक हैं?

एक ही मैनुअल बनाम [आर] गणना:

मैंने एक ही आधार के साथ एक अलग काल्पनिक डेटा सेट बनाया, लेकिन इस बार तीन जातीय पृष्ठभूमि थीं: "लाल", "ब्लू" और "ऑरेंज", और एक ही क्रम चला:

सबसे पहले, आकस्मिकता तालिका:

Acceptance  blue    orange  red   Total
0             86        65  130     281
1             64        42  162     268
Total        150       107  292     549

और प्रत्येक जातीय समूह के लिए प्राप्त करने की बाधाओं की गणना :

  • ऑड्स स्वीकार अगर लाल = 1.246154;
  • ऑड्स स्वीकार अगर ब्लू = 0.744186;
  • ऑड्स स्वीकार अगर ऑरेंज = 0.646154

साथ ही साथ अलग अलग अनुपात :

  • या लाल वी नीला = 1.674519;
  • या लाल वी नारंगी = 1.928571;
  • या नीला वी लाल = 0.597186;
  • या नीला वी नारंगी = 1.151717;
  • ऑरेंज वी लाल = 0.518519; तथा
  • या नारंगी वी नीला = 0.868269

और अब नियमित लॉजिस्टिक प्रतिगमन के साथ आगे बढ़े जिसके बाद गुणांकों का प्रतिपादक:

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit), confint(fit)))

                      ODDS     2.5 %   97.5 %
(Intercept)      0.7441860 0.5367042 1.026588
Backgroundorange 0.8682692 0.5223358 1.437108
Backgroundred    1.6745192 1.1271430 2.497853

के रूप में "ब्लूज़" , और ऑरेंज बनाम ब्लू इन ब्लू और रेड ओ ब्लू के ओआरडी अनुपात के रूप में प्राप्त करने की बाधाओं को उपज ।(Intercept)BackgroundorangeBackgroundred

दूसरी ओर, अवरोधन के बिना प्रतिगमन अनुमान केवल तीन स्वतंत्र बाधाओं को लौटाता है :

fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit2), confint(fit2)))

                      ODDS     2.5 %    97.5 %
Backgroundblue   0.7441860 0.5367042 1.0265875
Backgroundorange 0.6461538 0.4354366 0.9484999
Backgroundred    1.2461538 0.9900426 1.5715814

बधाई हो, आपने यह पता लगाने का अच्छा काम किया है।
गंग - मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.