बहुराष्ट्रीय लॉजिस्टिक प्रतिगमन में एक्सप (बी) की व्याख्या करना


16

यह कुछ हद तक एक शुरुआत का सवाल है, लेकिन एक बहुराष्ट्रीय लॉजिस्टिक रिग्रेशन मॉडल में 6.012 के एक्सप (बी) परिणाम की व्याख्या कैसे की जाती है?

1) क्या यह 6.012-1.0 = 5.012 = 5012% जोखिम में वृद्धि है?

या

2) 6.012 / (1 + 6.012) = 0.857 = 85.7% जोखिम में वृद्धि?

यदि दोनों विकल्प गलत हैं, तो क्या कोई सही तरीके का उल्लेख कर सकता है?

Ive ने इंटरनेट पर कई संसाधनों को खोजा और मुझे इन दो विकल्पों की आवश्यकता है, और मुझे पूरी तरह से यकीन नहीं है कि कौन सा सही है।

जवाबों:


35

वहां पहुंचने में हमें थोड़ा समय लगेगा, लेकिन सारांश में, बी के अनुरूप चर में एक-इकाई परिवर्तन परिणाम के सापेक्ष जोखिम (आधार परिणाम की तुलना में) 6.012 से गुणा करेगा।

रिश्तेदार जोखिम में "5012%" वृद्धि के रूप में इसे व्यक्त कर सकते हैं , लेकिन यह एक भ्रामक और संभावित रूप से भ्रामक तरीका है, क्योंकि यह सुझाव देता है कि हमें बदलावों के बारे में सोचना चाहिए, जब वास्तव में बहुराष्ट्रीय लॉजिस्टिक मॉडल हमें प्रोत्साहित करते हैं गुणात्मक रूप से सोचें। संशोधक "सापेक्ष" आवश्यक है, क्योंकि एक परिवर्तनशील परिवर्तन एक साथ सभी परिणामों की अनुमानित संभावनाओं को बदल रहा है, न कि केवल एक प्रश्न में, इसलिए हमें संभावनाओं की तुलना करनी होगी ( अनुपात के माध्यम से , अंतर नहीं)।

इस उत्तर के बाकी हिस्सों में इन बयानों को सही ढंग से व्याख्या करने के लिए आवश्यक शब्दावली और अंतर्ज्ञान विकसित होता है।

पृष्ठभूमि

बहुराष्ट्रीय मामले पर आगे बढ़ने से पहले साधारण लॉजिस्टिक रिग्रेशन के साथ शुरू करते हैं।

आश्रित (बाइनरी) चर Y और स्वतंत्र चर Xi , मॉडल है

Pr[Y=1]=exp(β1X1++βmXm)1+exp(β1X1++βmXm);

समतुल्य रूप, यह मानते हुए 0Pr[Y=1]1 ,

log(ρ(X1,,Xm))=logPr[Y=1]Pr[Y=0]=β1X1++βmXm.

(यह बस को परिभाषित करता है , जो कि बाधाओं के एक समारोह के रूप में एक्स मैं ।)ρXi

व्यापकता, सूचकांक के किसी भी हानि के बिना इतना है कि एक्स मीटर चर रहा है और β मीटर "बी" सवाल में है (ताकि exp ( β मीटर ) = 6.012 )। के मूल्यों फिक्सिंग एक्स मैं , 1 मैं < मीटर है, और बदलती एक्स मीटर एक छोटी राशि से δ पैदावारXiXmβmexp(βm)=6.012Xi,1i<mXmδ

log(ρ(,Xm+δ))log(ρ(,Xm))=βmδ.

इस प्रकार, X मीटर के संबंध में लॉग ऑड्स में सीमांत परिवर्तन हैβm Xm

ठीक करने के लिए , जाहिर है हम सेट करना होगा δ = 1 और बाएं हाथ की ओर exponentiate:exp(βm)δ=1

exp(βm)=exp(βm×1)=exp(log(ρ(,Xm+1))log(ρ(,Xm)))=ρ(,Xm+1)ρ(,Xm).

यह दर्शाती के रूप में बाधाओं के अनुपात में एक एक इकाई वृद्धि के लिए एक्स मीटर । इसका क्या मतलब हो सकता है, इसके लिए एक अंतर्ज्ञान विकसित करने के लिए, बाधाओं को शुरू करने की एक सीमा के लिए कुछ मूल्यों को सारणीबद्ध करें, पैटर्न को खड़ा करने के लिए जोर से गोल करना:exp(βm)Xm

Starting odds  Ending odds  Starting Pr[Y=1]  Ending Pr[Y=1]
0.0001         0.0006       0.0001            0.0006
0.001          0.006        0.001             0.006
0.01           0.06         0.01              0.057
0.1            0.6          0.091             0.38
1.             6.           0.5               0.9
10.            60.          0.91              1.
100.           600.         0.99              1.

के लिए वास्तव में छोटे बाधाओं, जो के अनुरूप वास्तव में छोटे संभावनाओं, में एक एक इकाई असर यह है गुणा 6.012 के बारे में द्वारा बाधाओं या संभावना। गुणक कारक घटता है क्योंकि ऑड्स (और संभावना) बड़ा हो जाता है, और अनिवार्य रूप से 10 से अधिक हो जाने के बाद गायब हो गया है (संभावना 0.9 से अधिक हो जाती है)।Xm

Ratio change in probability

एक योजक परिवर्तन के रूप में, 0.0001 और 0.0006 की संभावना के बीच बहुत अंतर नहीं है (यह केवल 0.05% है), और न ही 0.99 और 1. (केवल 1%) के बीच बहुत अंतर है। सबसे बड़ा additive प्रभाव तब होता है जब बाधाओं के बराबर , जहां 29% से 71% करने के लिए संभावना परिवर्तन: + 42% का एक परिवर्तन।1/6.0120.408

Additive change in probability

हम देखते हैं, तो, कि अगर हम एक अंतर अनुपात के रूप में "जोखिम" व्यक्त करते हैं, = "बी" एक सरल व्याख्या है - बाधाओं अनुपात के बराबर होती है β मीटर में एक इकाई वृद्धि के लिए --but जब हम कुछ में जोखिम को व्यक्त अन्य फैशन, जैसे कि संभावनाओं में बदलाव, व्याख्या के लिए शुरुआती संभावना को निर्दिष्ट करने के लिए देखभाल की आवश्यकता होती है।βmβmXm

बहुराष्ट्रीय उपस्कर प्रतिगमन

(इसे बाद के संपादन के रूप में जोड़ा गया है।)

संभावना व्यक्त करने के लिए लॉग ऑड्स का उपयोग करने के मूल्य को मान्यता देते हुए, चलो बहुराष्ट्रीय मामले पर चलते हैं। अब निर्भर चर में से एक के बराबर कर सकते हैं कश्मीर 2 श्रेणियों, अनुक्रमित से मैं = 1 , 2 , ... , कश्मीररिश्तेदार संभावना है कि यह श्रेणी में है मैं हैYk2i=1,2,,ki

Pr[Yi]exp(β1(i)X1++βm(i)Xm)

साथ मापदंडों निर्धारित होता है और लिखित रूप होने के लिए वाई मैं के लिए पीआर [ Y = श्रेणी  मैं ] । एक संक्षिप्त नाम के रूप में, के रूप में दाएँ हाथ अभिव्यक्ति लिख जाने पी मैं ( एक्स , β ) या, जहां एक्स और β संदर्भ से स्पष्ट हैं, बस पी मैं । एकता के लिए इन सभी सापेक्ष संभावनाओं को सामान्य करने के लिए सामान्यीकरण देता हैβj(i)YiPr[Y=category i]pi(X,β)Xβpi

Pr[Yi]=pi(X,β)p1(X,β)++pm(X,β).

(मापदंडों में एक अस्पष्टता है: उनमें से बहुत सारे हैं। पारंपरिक रूप से, कोई तुलना के लिए "आधार" श्रेणी चुनता है और अपने सभी गुणांक को शून्य होने के लिए मजबूर करता है। हालांकि, यह दांव के अनूठे अनुमानों की रिपोर्ट करने के लिए आवश्यक है, इसे है नहीं गुणांकों की व्याख्या की जरूरत समरूपता बनाए रखने के लिए -। यह है कि, श्रेणियों में किसी भी कृत्रिम भेद से बचने के लिए - देना किसी भी तरह के बाधा को लागू नहीं कर रहा है जब तक कि हम करने के लिए है)।

इस मॉडल की व्याख्या करने का एक तरीका यह है कि स्वतंत्र चर में से किसी एक के संबंध में किसी भी श्रेणी ( मान श्रेणी ) के लिए लॉग ऑड के परिवर्तन की सीमांत दर पूछी जाए (जैसे कि x j )। यही है, जब हम X j को थोड़े से बदलते हैं, जो Y i के लॉग ऑड्स में बदलाव को प्रेरित करता है । हम इन दो परिवर्तनों से संबंधित आनुपातिकता के निरंतर में रुचि रखते हैं। कैलकुलस का चैन नियम, थोड़ा बीजगणित के साथ मिलकर हमें बताता है कि यह परिवर्तन की दर हैiXjXjYi

 log odds(Yi) Xj=βj(i)βj(1)p1++βj(i1)pi1+βj(i+1)pi+1++βj(k)pkp1++pi1+pi+1++pk.

यह गुणांक के रूप में एक अपेक्षाकृत सरल व्याख्या है के एक्स जे संभावना है कि के लिए सूत्र में वाई श्रेणी में है मैं शून्य से एक "समायोजन।" समायोजन अन्य सभी श्रेणियों में एक्स जे के गुणांक के संभाव्यता-भारित औसत है । वजन की गणना स्वतंत्र चर एक्स के वर्तमान मूल्यों से जुड़े संभावनाओं का उपयोग करके की जाती है । इस प्रकार, लॉग में सीमांत परिवर्तन आवश्यक रूप से स्थिर नहीं है: यह अन्य सभी श्रेणियों की संभावनाओं पर निर्भर करता है, न कि केवल प्रश्न में श्रेणी की संभावना (श्रेणी i)βj(i)XjYiXjXi)।

जब बस श्रेणियां होती हैं, तो यह साधारण लॉजिस्टिक प्रतिगमन को कम करना चाहिए। दरअसल, संभावना भार कुछ नहीं करता है और (चुनने मैं = 2 ) बस अंतर देता है β ( 2 ) जे - β ( 1 ) जे । श्रेणी दे मैं आधार मामला हो इस के लिए आगे कम कर देता है बीटा ( 2 ) जे , क्योंकि हम मजबूर β ( 1 ) j = 0 । इस प्रकार नई व्याख्या पुराने को सामान्य करती है।k=2i=2βj(2)βj(1)iβj(2)βj(1)=0

व्याख्या करने के लिए सीधे, तो, हम, पूर्ववर्ती सूत्र के एक तरफ यह अलग होगा करने के लिए अग्रणी:βj(i)

के गुणांक श्रेणी के लिए मैं श्रेणी का लॉग बाधाओं में सीमांत परिवर्तन के बराबर होती है मैं चर के संबंध में एक्स जे , के साथ साथ अन्य सभी के गुणांकों की संभावना-भारित औसत एक्स जे ' श्रेणी के लिए मैंXjiiXjXji

अन्य व्याख्या, एक छोटे से कम प्रत्यक्ष यद्यपि, (अस्थायी) श्रेणी की स्थापना द्वारा प्रदान किया जाता है आधार मामले के रूप में, इस प्रकार बनाने β ( मैं ) j = 0 सभी स्वतंत्र चर के लिए एक्स जे :iβj(i)=0Xj

वेरिएबल लिए बेस केस के लॉग ऑड्स में बदलाव की सीमांत दर अन्य सभी मामलों के लिए इसके गुणांकों की प्रायिकता-भारित औसत का नकारात्मक है।Xj

वास्तव में इन व्याख्याओं का उपयोग करने के लिए आमतौर पर सॉफ़्टवेयर आउटपुट से बिट्स और संभावनाओं को निकालने की आवश्यकता होती है और दिखाए गए अनुसार गणना करते हैं।

अंत में, exponentiated गुणांक के लिए, नोट दो परिणामों के बीच संभावनाओं के अनुपात (कभी कभी "रिश्तेदार जोखिम" का कहा जाता है कि की तुलना में मैं ' ) हैii

YiYi=pi(X,β)pi(X,β).

आइए वृद्धि करने के लिए एक इकाई द्वारा एक्स जे + 1 । यह पलता पी मैं द्वारा exp ( β ( मैं ) जे ) और पी मैं ' द्वारा exp ( β ( मैं ' ) जे ) , जिस कारण से रिश्तेदार जोखिम से गुणा किया जाता exp ( β ( मैं ) जे ) / exp ( β ( मैं ' ) जे )XjXj+1piexp(βj(i))piexp(βj(i))exp(βj(i))/exp(βj(i))= । श्रेणी लेते हुए मैं ' होने के लिए आधार मामला यह करने के लिए कम कर देता है विस्तार ( β ( मैं ) जे ) , हमें अग्रणी कहने के लिए,exp(βj(i)βj(i))iexp(βj(i))

exp(βj(i))Pr[Y=category i]/Pr[Y=base category]Xj


1
महान स्पष्टीकरण, लेकिन ओपी ने स्पष्ट रूप से बहुराष्ट्रीय मॉडल के लिए कहा । मैं ओपी के इरादे से अधिक प्रश्न में पढ़ सकता हूं, और बाइनरी केस के लिए स्पष्टीकरण पर्याप्त हो सकता है, लेकिन मुझे इस उत्तर को सामान्य बहुराष्ट्रीय मामले को भी कवर करना अच्छा लगेगा। भले ही पैरामीरीज़ेशन समान हो, "लॉग-ऑड्स" सामान्य रूप से एक (मनमानी) संदर्भ श्रेणी के संबंध में होते हैं, और वे वास्तव में लॉग-ऑड नहीं होते हैं, और एक इकाई में परिवर्तन होता हैएक्समैंइन "लॉग-ऑड्स" के संयुक्त परिवर्तन के परिणामस्वरूप, और "लॉग-ऑड्स" बढ़ने से संभावना नहीं बढ़ती है और संभावना बढ़ जाती है।
NRH

@ एनआरएच यह एक उत्कृष्ट बिंदु है। मैंने किसी तरह "बहुराष्ट्रीय" के बजाय "बहुभिन्नरूपी" पढ़ा था। अगर मुझे इस पर लौटने का मौका मिलता है, तो मैं उन विवरणों को बाहर करने की कोशिश करूंगा। सौभाग्य से विश्लेषण का वही तरीका सही व्याख्या खोजने में प्रभावी है।
व्हिबर

@ एनआरएच किया। मैं आपके सुझावों (या किसी और के) का स्वागत करता हूं कि व्याख्या को कैसे स्पष्ट किया जाए, या वैकल्पिक व्याख्याओं के लिए।
whuber

1
इसे लिखने के लिए धन्यवाद। पूर्ण उत्तर एक बहुत अच्छा संदर्भ है।
NRH

1

@Whuber ने पहले से ही इतनी अच्छी तरह से क्या लिखा है, इसके अलावा इस व्याख्या को समझने की कोशिश करें। यदि एक्सप (B) = 6 है, तो प्रश्न में पूर्वसूचक पर 1 की वृद्धि के साथ जुड़ा ऑड्स अनुपात 6. एक बहुपद संदर्भ में, "बाधाओं के अनुपात" से हमारा मतलब है कि इन दो मात्राओं का अनुपात: a) ऑड्स ( किसी मामले में आउटपुट तालिका में दर्शाए गए आश्रित चर का मान लेने वाले किसी मामले की संभावना नहीं, बल्कि p / [1-p]) और b) किसी मामले की आश्रित चर के संदर्भ मूल्य को लेते हुए।

You seem to be looking to quantify the probability--rather than odds-- of a case being in one or the other category. To do this you would need to know what probabilities the case "started with" -- i.e., before we assumed the increase of 1 on the predictor in question. Ratios of probabilities will vary case by case, while the ratio of odds connected with an increase of 1 on the predictor stays the same.


"If exp(B) = 6, then the odds ratio associated with an increase of 1 on the predictor in question is 6", if I read @whuber's answer correctly it says that the odds ratio will be multiplied by 6 with an increase of 1 on the predictor. That is, the new odds ratio will not be 6. Or am I intepreting things incorrectly?
rbm

Where you say "the new odds ratio will not be 6" I would say "the new odds will not be 6...but the ratio of the new to the old odds will be 6."
rolando2

हां, मैं इससे सहमत हूं! लेकिन मैंने सिर्फ यह सोचा कि "प्रश्न में पूर्वसूचक पर 1 की वृद्धि के साथ जुड़ा हुआ विषम अनुपात 6 है" वास्तव में ऐसा नहीं कहा गया है। लेकिन शायद मैं तब इसे गलत समझ रहा हूं। स्पष्टीकरण के लिए धन्यवाद!
rbm

1

मैं भी उसी उत्तर की तलाश में था, लेकिन एक बार ऊपर वाला मेरे लिए संतोषजनक नहीं था। यह वास्तव में क्या है, इसके लिए जटिल लग रहा था। इसलिए मैं अपनी व्याख्या दूंगा, अगर मैं गलत हूं तो कृपया मुझे सुधार दें।

हालांकि अंत तक पढ़ें, क्योंकि यह महत्वपूर्ण है।

सभी मूल्यों में से सबसे पहले बी और एक्सप (बी) एक बार आप की तलाश कर रहे हैं। यदि B ऋणात्मक है, तो आपका Exp (B) एक से कम होगा, जिसका अर्थ है कि अंतर कम हो जाएगा। यदि उच्च (1) एक्सप (बी) उच्चतर होगा, तो अर्थ में वृद्धि होती है। चूंकि आप कारक ऍक्स्प (B) से गुणा कर रहे हैं।

दुर्भाग्य से आप अभी तक वहां नहीं हैं। क्योंकि बहुराष्ट्रीय प्रतिगमन में आपके आश्रित चर में कई श्रेणियां होती हैं, तो आइए इन श्रेणियों को D1, D2 और D3 कहते हैं। जिनमें से आपका अंतिम संदर्भ श्रेणी है। और मान लें कि आपका पहला स्वतंत्र चर सेक्स है (पुरुष बनाम महिला)।

मान लीजिए कि डी 1 -> पुरुषों के लिए एक्सप (बी) = 1.21 है, इसका मतलब महिलाओं (संदर्भ श्रेणी) की तुलना में डी 3 (संदर्भ श्रेणी) के बजाय डी 1 श्रेणी में होने के लिए पुरुषों के लिए 1.21 की वृद्धि होती है।

इसलिए आप हमेशा आश्रित लेकिन स्वतंत्र चर के अपने संदर्भ श्रेणी के खिलाफ तुलना कर रहे हैं। यह सच नहीं है यदि आपके पास एक कोवरिएट चर है। उस मामले में इसका मतलब होगा; X में एक यूनिट वृद्धि से डी 3 के बजाय श्रेणी डी 1 में होने के 1.21 के कारक से बाधाओं में वृद्धि होती है।

एक अध्यादेश पर निर्भर चर वाले लोगों के लिए:

यदि आपके पास एक ऑर्डिनल निर्भर चर है और उदाहरण के लिए आनुपातिक बाधाओं की धारणा के कारण एक ऑर्डिनल रिग्रेशन नहीं किया। ध्यान रखें कि आपकी उच्चतम श्रेणी संदर्भ श्रेणी है। उपरोक्त के रूप में आपका परिणाम रिपोर्ट करने के लिए मान्य है। लेकिन ध्यान रखें कि वास्तव में बाधाओं की तुलना में वृद्धि का मतलब है उच्चतर के बजाय निम्न श्रेणी में होने की बाधाओं में वृद्धि! लेकिन ऐसा तभी है जब आपके पास एक ऑर्डिनल डिपेंडेंट वैरिएबल हो।

यदि आप प्रतिशत में वृद्धि जानना चाहते हैं, तो अच्छी तरह से एक काल्पनिक अंतर-संख्या लें, मान लें कि 100 और इसे 1.21 से गुणा करें जो 121 है? 100 की तुलना में प्रतिशत में कितना परिवर्तन हुआ?


0

Say that exp(b) in an mlogit is 1.04. if you multiply a number by 1.04, then it increases by 4%. That is the relative risk of being in category a instead of b. I suspect that part of the confusion here might have to do with by 4% (multiplicative meaning) and by 4 percent points (additive meaning). The % interpretation is correct if we talk about a percentage change not percentage point change. (The latter would not make sense anyhow as relative risks aren't expressed in terms of percentages.)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.