वहां पहुंचने में हमें थोड़ा समय लगेगा, लेकिन सारांश में, बी के अनुरूप चर में एक-इकाई परिवर्तन परिणाम के सापेक्ष जोखिम (आधार परिणाम की तुलना में) 6.012 से गुणा करेगा।
रिश्तेदार जोखिम में "5012%" वृद्धि के रूप में इसे व्यक्त कर सकते हैं , लेकिन यह एक भ्रामक और संभावित रूप से भ्रामक तरीका है, क्योंकि यह सुझाव देता है कि हमें बदलावों के बारे में सोचना चाहिए, जब वास्तव में बहुराष्ट्रीय लॉजिस्टिक मॉडल हमें प्रोत्साहित करते हैं गुणात्मक रूप से सोचें। संशोधक "सापेक्ष" आवश्यक है, क्योंकि एक परिवर्तनशील परिवर्तन एक साथ सभी परिणामों की अनुमानित संभावनाओं को बदल रहा है, न कि केवल एक प्रश्न में, इसलिए हमें संभावनाओं की तुलना करनी होगी ( अनुपात के माध्यम से , अंतर नहीं)।
इस उत्तर के बाकी हिस्सों में इन बयानों को सही ढंग से व्याख्या करने के लिए आवश्यक शब्दावली और अंतर्ज्ञान विकसित होता है।
पृष्ठभूमि
बहुराष्ट्रीय मामले पर आगे बढ़ने से पहले साधारण लॉजिस्टिक रिग्रेशन के साथ शुरू करते हैं।
आश्रित (बाइनरी) चर Y और स्वतंत्र चर Xi , मॉडल है
Pr[Y=1]=exp(β1X1+⋯+βmXm)1+exp(β1X1+⋯+βmXm);
समतुल्य रूप, यह मानते हुए 0≠Pr[Y=1]≠1 ,
log(ρ(X1,⋯,Xm))=logPr[Y=1]Pr[Y=0]=β1X1+⋯+βmXm.
(यह बस को परिभाषित करता है , जो कि बाधाओं के एक समारोह के रूप में एक्स मैं ।)ρXi
व्यापकता, सूचकांक के किसी भी हानि के बिना इतना है कि एक्स मीटर चर रहा है और β मीटर "बी" सवाल में है (ताकि exp ( β मीटर ) = 6.012 )। के मूल्यों फिक्सिंग एक्स मैं , 1 ≤ मैं < मीटर है, और बदलती एक्स मीटर एक छोटी राशि से δ पैदावारXiXmβmexp(βm)=6.012Xi,1≤i<mXmδ
log(ρ(⋯,Xm+δ))−log(ρ(⋯,Xm))=βmδ.
इस प्रकार, X मीटर के संबंध में लॉग ऑड्स में सीमांत परिवर्तन है ।βm Xm
ठीक करने के लिए , जाहिर है हम सेट करना होगा δ = 1 और बाएं हाथ की ओर exponentiate:exp(βm)δ=1
exp(βm)=exp(βm×1)=exp(log(ρ(⋯,Xm+1))−log(ρ(⋯,Xm)))=ρ(⋯,Xm+1)ρ(⋯,Xm).
यह दर्शाती के रूप में बाधाओं के अनुपात में एक एक इकाई वृद्धि के लिए एक्स मीटर । इसका क्या मतलब हो सकता है, इसके लिए एक अंतर्ज्ञान विकसित करने के लिए, बाधाओं को शुरू करने की एक सीमा के लिए कुछ मूल्यों को सारणीबद्ध करें, पैटर्न को खड़ा करने के लिए जोर से गोल करना:exp(βm)Xm
Starting odds Ending odds Starting Pr[Y=1] Ending Pr[Y=1]
0.0001 0.0006 0.0001 0.0006
0.001 0.006 0.001 0.006
0.01 0.06 0.01 0.057
0.1 0.6 0.091 0.38
1. 6. 0.5 0.9
10. 60. 0.91 1.
100. 600. 0.99 1.
के लिए वास्तव में छोटे बाधाओं, जो के अनुरूप वास्तव में छोटे संभावनाओं, में एक एक इकाई असर यह है गुणा 6.012 के बारे में द्वारा बाधाओं या संभावना। गुणक कारक घटता है क्योंकि ऑड्स (और संभावना) बड़ा हो जाता है, और अनिवार्य रूप से 10 से अधिक हो जाने के बाद गायब हो गया है (संभावना 0.9 से अधिक हो जाती है)।Xm
एक योजक परिवर्तन के रूप में, 0.0001 और 0.0006 की संभावना के बीच बहुत अंतर नहीं है (यह केवल 0.05% है), और न ही 0.99 और 1. (केवल 1%) के बीच बहुत अंतर है। सबसे बड़ा additive प्रभाव तब होता है जब बाधाओं के बराबर , जहां 29% से 71% करने के लिए संभावना परिवर्तन: + 42% का एक परिवर्तन।1/6.012−−−−√∼0.408
हम देखते हैं, तो, कि अगर हम एक अंतर अनुपात के रूप में "जोखिम" व्यक्त करते हैं, = "बी" एक सरल व्याख्या है - बाधाओं अनुपात के बराबर होती है β मीटर में एक इकाई वृद्धि के लिए --but जब हम कुछ में जोखिम को व्यक्त अन्य फैशन, जैसे कि संभावनाओं में बदलाव, व्याख्या के लिए शुरुआती संभावना को निर्दिष्ट करने के लिए देखभाल की आवश्यकता होती है।βmβmXm
बहुराष्ट्रीय उपस्कर प्रतिगमन
(इसे बाद के संपादन के रूप में जोड़ा गया है।)
संभावना व्यक्त करने के लिए लॉग ऑड्स का उपयोग करने के मूल्य को मान्यता देते हुए, चलो बहुराष्ट्रीय मामले पर चलते हैं। अब निर्भर चर में से एक के बराबर कर सकते हैं कश्मीर ≥ 2 श्रेणियों, अनुक्रमित से मैं = 1 , 2 , ... , कश्मीर । रिश्तेदार संभावना है कि यह श्रेणी में है मैं हैYk≥2i=1,2,…,ki
Pr[Yi]∼exp(β(i)1X1+⋯+β(i)mXm)
साथ मापदंडों निर्धारित होता है और लिखित रूप होने के लिए वाई मैं के लिए पीआर [ Y = श्रेणी मैं ] । एक संक्षिप्त नाम के रूप में, के रूप में दाएँ हाथ अभिव्यक्ति लिख जाने पी मैं ( एक्स , β ) या, जहां एक्स और β संदर्भ से स्पष्ट हैं, बस पी मैं । एकता के लिए इन सभी सापेक्ष संभावनाओं को सामान्य करने के लिए सामान्यीकरण देता हैβ(i)jYiPr[Y=category i]pi(X,β)Xβpi
Pr[Yi]=pi(X,β)p1(X,β)+⋯+pm(X,β).
(मापदंडों में एक अस्पष्टता है: उनमें से बहुत सारे हैं। पारंपरिक रूप से, कोई तुलना के लिए "आधार" श्रेणी चुनता है और अपने सभी गुणांक को शून्य होने के लिए मजबूर करता है। हालांकि, यह दांव के अनूठे अनुमानों की रिपोर्ट करने के लिए आवश्यक है, इसे है नहीं गुणांकों की व्याख्या की जरूरत समरूपता बनाए रखने के लिए -। यह है कि, श्रेणियों में किसी भी कृत्रिम भेद से बचने के लिए - देना किसी भी तरह के बाधा को लागू नहीं कर रहा है जब तक कि हम करने के लिए है)।
इस मॉडल की व्याख्या करने का एक तरीका यह है कि स्वतंत्र चर में से किसी एक के संबंध में किसी भी श्रेणी ( मान श्रेणी ) के लिए लॉग ऑड के परिवर्तन की सीमांत दर पूछी जाए (जैसे कि x j )। यही है, जब हम X j को थोड़े से बदलते हैं, जो Y i के लॉग ऑड्स में बदलाव को प्रेरित करता है । हम इन दो परिवर्तनों से संबंधित आनुपातिकता के निरंतर में रुचि रखते हैं। कैलकुलस का चैन नियम, थोड़ा बीजगणित के साथ मिलकर हमें बताता है कि यह परिवर्तन की दर हैiXjXjYi
∂ log odds(Yi)∂ Xj=β(i)j−β(1)jp1+⋯+β(i−1)jpi−1+β(i+1)jpi+1+⋯+β(k)jpkp1+⋯+pi−1+pi+1+⋯+pk.
यह गुणांक के रूप में एक अपेक्षाकृत सरल व्याख्या है के एक्स जे संभावना है कि के लिए सूत्र में वाई श्रेणी में है मैं शून्य से एक "समायोजन।" समायोजन अन्य सभी श्रेणियों में एक्स जे के गुणांक के संभाव्यता-भारित औसत है । वजन की गणना स्वतंत्र चर एक्स के वर्तमान मूल्यों से जुड़े संभावनाओं का उपयोग करके की जाती है । इस प्रकार, लॉग में सीमांत परिवर्तन आवश्यक रूप से स्थिर नहीं है: यह अन्य सभी श्रेणियों की संभावनाओं पर निर्भर करता है, न कि केवल प्रश्न में श्रेणी की संभावना (श्रेणी i)β(i)jXjYiXjXi)।
जब बस श्रेणियां होती हैं, तो यह साधारण लॉजिस्टिक प्रतिगमन को कम करना चाहिए। दरअसल, संभावना भार कुछ नहीं करता है और (चुनने मैं = 2 ) बस अंतर देता है β ( 2 ) जे - β ( 1 ) जे । श्रेणी दे मैं आधार मामला हो इस के लिए आगे कम कर देता है बीटा ( 2 ) जे , क्योंकि हम मजबूर β ( 1 ) j = 0 । इस प्रकार नई व्याख्या पुराने को सामान्य करती है।k=2i=2β(2)j−β(1)jiβ(2)jβ(1)j=0
व्याख्या करने के लिए सीधे, तो, हम, पूर्ववर्ती सूत्र के एक तरफ यह अलग होगा करने के लिए अग्रणी:β(i)j
के गुणांक श्रेणी के लिए मैं श्रेणी का लॉग बाधाओं में सीमांत परिवर्तन के बराबर होती है मैं चर के संबंध में एक्स जे , के साथ साथ अन्य सभी के गुणांकों की संभावना-भारित औसत एक्स जे ' श्रेणी के लिए मैं ।XjiiXjXj′i
अन्य व्याख्या, एक छोटे से कम प्रत्यक्ष यद्यपि, (अस्थायी) श्रेणी की स्थापना द्वारा प्रदान किया जाता है आधार मामले के रूप में, इस प्रकार बनाने β ( मैं ) j = 0 सभी स्वतंत्र चर के लिए एक्स जे :iβ(i)j=0Xj
वेरिएबल लिए बेस केस के लॉग ऑड्स में बदलाव की सीमांत दर अन्य सभी मामलों के लिए इसके गुणांकों की प्रायिकता-भारित औसत का नकारात्मक है।Xj
वास्तव में इन व्याख्याओं का उपयोग करने के लिए आमतौर पर सॉफ़्टवेयर आउटपुट से बिट्स और संभावनाओं को निकालने की आवश्यकता होती है और दिखाए गए अनुसार गणना करते हैं।
अंत में, exponentiated गुणांक के लिए, नोट दो परिणामों के बीच संभावनाओं के अनुपात (कभी कभी "रिश्तेदार जोखिम" का कहा जाता है कि की तुलना में मैं ' ) हैii′
YiYi′=pi(X,β)pi′(X,β).
आइए वृद्धि करने के लिए एक इकाई द्वारा एक्स जे + 1 । यह पलता पी मैं द्वारा exp ( β ( मैं ) जे ) और पी मैं ' द्वारा exp ( β ( मैं ' ) जे ) , जिस कारण से रिश्तेदार जोखिम से गुणा किया जाता exp ( β ( मैं ) जे ) / exp ( β ( मैं ' ) जे )XjXj+1piexp(β(i)j)pi′exp(β(i′)j)exp(β(i)j)/exp(β(i′)j)= । श्रेणी लेते हुए मैं ' होने के लिए आधार मामला यह करने के लिए कम कर देता है विस्तार ( β ( मैं ) जे ) , हमें अग्रणी कहने के लिए,exp(β(i)j−β(i′)j)i′exp(β(i)j)
exp(β(i)j)Pr[Y=category i]/Pr[Y=base category]Xj