लॉजिस्टिक रिग्रेशन में समायोजित बाधाओं के अनुपात को समझने में मेरी मदद करें


20

मुझे एक पेपर में लॉजिस्टिक रिग्रेशन के उपयोग को समझने का प्रयास करने में मुश्किल समय हो रहा है। यहां उपलब्ध कागज मोतियाबिंद सर्जरी के दौरान जटिलताओं की संभावना का अनुमान लगाने के लिए लॉजिस्टिक रिग्रेशन का उपयोग करता है।

जो मुझे भ्रमित कर रहा है वह यह है कि कागज एक मॉडल प्रस्तुत करता है जो निम्नानुसार वर्णित आधार रेखा के लिए 1 के अनुपात को निर्दिष्ट करता है:

एक रोगी जिसका जोखिम प्रोफ़ाइल सभी जोखिम संकेतकों के लिए संदर्भ समूह में था (यानी तालिका 1 में सभी के लिए समायोजित या = 1.00) को 'आधारभूत जोखिम प्रोफ़ाइल' माना जा सकता है, और लॉजिस्टिक रिग्रेशन मॉडल एक 'आधारभूत पूर्वानुमानित संभाव्यता' को दर्शाता है। पीसीआर या वीएल या दोनों के लिए = 0.736%।

तो ०.००७३६ की संभावना 1. की बाधाओं अनुपात संभावनाओं से बाधाओं अनुपात के परिवर्तन के आधार पर प्रदान की जाती है: o=p1p , यह 1:0.00741=0.00736 केबराबर नहीं हो सकता है 0.00741=0.0073610.00736

यह और भी भ्रामक हो जाता है। समग्र जोखिम अनुपात जो बेसलाइन से भिन्न मूल्यों वाले कई कोवरिअट्स का प्रतिनिधित्व करता है, का उपयोग अनुमानित जोखिम की गणना करने के लिए किया जाता है।

... तालिका 1 से कंपोज़िट OR या 1.28 X 1.58 X 2.99 X 2.46 X 1.45 X 1.60 = 34.5 होगा, और चित्र 1 में ग्राफ से, हम देखते हैं कि यह पीसीआर या वीएल और दोनों की अनुमानित संभावना के साथ मेल खाता है या दोनों लगभग 20%

कागजों के मूल्यों पर पहुंचने का एकमात्र तरीका उदाहरण के रूप में दे रहा है, इस तरह के समग्र बाधाओं के साथ आधारभूत संभावना को गुणा करना है: 0.2025=(34.50 × 0.00736)1 + (34.50 × 0.00736)

तो यहां पर क्या हो रहा है? आधार संख्या संभावना 1 के अनुपात 1 को निर्दिष्ट करने के लिए तर्क क्या है जो 0.5 नहीं है? अपडेट फॉर्मूला जो मैं ऊपर दे चुका हूं, वह कागज में उदाहरणों के लिए सही संभावनाओं के साथ आता है, लेकिन यह उन विषम अनुपातों का प्रत्यक्ष गुणा नहीं है जिनकी मुझे उम्मीद थी। तो यह क्या है?


8
आपको शब्दावली के बारे में एक सरल भ्रम हो सकता है: एक अंतर है , एक विषम अनुपात नहीं। एक विषम अनुपात दूसरे द्वारा एक ऐसी अभिव्यक्ति का विभाजन है। p/(1p)
whuber

जवाबों:


35

ऑड्स संभावना व्यक्त करने का एक तरीका है। बाधाओं अनुपात बस इतना है कि: एक दूसरे से विभाजित बाधाओं। इसका मतलब यह है कि एक ऑड्स अनुपात वह है जो आप एक ऑड्स को गुणा करके दूसरे का उत्पादन करते हैं। आइए देखें कि वे इस सामान्य स्थिति में कैसे काम करते हैं।

बाधाओं और संभावना के बीच रूपांतरण

एक द्विआधारी प्रतिक्रिया की संभावनाएं उसके होने के अवसर का अनुपात होती हैं ( 1 के साथ कोडित ), पीआर ( वाई = 1 ) लिखा जाता है, मौका यह नहीं करता है ( 0 के साथ कोडित ), लिखित पीआर ( वाई = 0 ) :Y1Pr(Y=1)0Pr(Y=0)

Odds(Y)=Pr(Y=1)Pr(Y=0)=Pr(Y=1)1Pr(Y=1).

दाईं ओर समतुल्य अभिव्यक्ति यह दिखाती है कि ऑड्स को खोजने के लिए यह मॉडल पर निर्भर करता है । इसके विपरीत, ध्यान दें कि हम हल कर सकते हैंPr(Y=1)

Pr(Y=1)=Odds(Y)1+Odds(Y)=111+Odds(Y).

रसद प्रतिगमन

लॉजिस्टिक प्रतिगमन व्याख्यात्मक चर के एक रैखिक समारोह के रूप में की बाधाओं का लघुगणक मॉडल है । आमतौर पर, इन चरों को में और रैखिक फ़ंक्शन में एक संभावित निरंतर शब्द सहित, हम गुणांक (जिसे डेटा से अनुमानित किया जा सकता है) को और के रूप में । औपचारिक रूप से यह मॉडल का निर्माण करता हैx 1 , ... , एक्स पी बीटा 1 , ... , β पी β 0Yx1,,xpβ1,,βpβ0

log(Odds(Y))=β0+β1x1++βpxp.

लघुगणक को पूर्ववत् करके बाधाओं को स्वयं ही प्राप्त किया जा सकता है:

Odds(Y)=exp(β0+β1x1++βpxp).

श्रेणीबद्ध चर का उपयोग करना

श्रेणीबद्ध चर, जैसे कि आयु समूह, लिंग, ग्लूकोमा की उपस्थिति, आदि , "डमी कोडिंग" के माध्यम से शामिल किए गए हैं। यह दिखाने के लिए कि चर को कैसे कोडित किया जाता है, इससे कोई फर्क नहीं पड़ता, मैं एक छोटे समूह का एक सरल उदाहरण प्रदान करूंगा; कई समूहों के लिए इसका सामान्यीकरण स्पष्ट होना चाहिए। इस अध्ययन में एक चर "पुतली का आकार", तीन श्रेणियों के साथ, "बड़ा", "मध्यम" और "छोटा" है। (अध्ययन व्यवहार करता है इन के रूप में विशुद्ध रूप से स्पष्ट, जाहिरा तौर पर अपने निहित आदेश पर कोई ध्यान नहीं दे रही।) Intuitively, प्रत्येक श्रेणी के लिए अपने स्वयं के हालात का कहना है "बड़े", के लिए "मध्यम" के लिए, और "छोटा" के लिए । इसका मतलब है कि, अन्य सभी चीजें समान हैं,α एम α एसαLαMαS

Odds(Y)=exp(αL+β0+β1x1++βpxp)

"बड़े" श्रेणी में किसी के लिए,

Odds(Y)=exp(αM+β0+β1x1++βpxp)

"मध्यम" श्रेणी में किसी के लिए भी, और

Odds(Y)=exp(αS+β0+β1x1++βpxp)

"लघु" श्रेणी में उन लोगों के लिए।

पहचानने योग्य गुणांक बनाना

मैं उन्हें उजागर करने के लिए पहले दो गुणांक रंग का है क्योंकि मैं तुम्हें नोटिस करना चाहते हैं कि वे एक सरल परिवर्तन होने की अनुमति देते हैं,: हम किसी भी संख्या ले सकता है और, में जोड़कर और में से प्रत्येक से यह घटाकर , , और , हम किसी भी अनुमानित बाधाओं को नहीं बदलेंगे। यह फॉर्म के स्पष्ट समकक्षों के कारण हैγβ0αLαMαS

αL+β0=(αLγ)+(γ+β0),

आदि हालांकि यह मॉडल के लिए कोई समस्या नहीं प्रस्तुत करता है - यह अभी भी वैसी ही चीजों की भविष्यवाणी करता है - यह दर्शाता है कि पैरामीटर अपने आप में व्याख्या करने योग्य नहीं हैं। जब हम इस जोड़-घटाव पैंतरेबाज़ी करते हैं, तो गुणांक के बीच अंतर होते हैं । परंपरागत रूप से, पहचान की इस कमी को दूर करने के लिए , लोग (और डिफ़ॉल्ट रूप से, सॉफ़्टवेयर) "चर" या "संदर्भ" के रूप में प्रत्येक चर में से एक श्रेणी चुनते हैं और बस यह निर्धारित करते हैं कि इसका गुणांक शून्य होगा। इससे अस्पष्टता दूर होती है।

कागज पहले संदर्भ श्रेणियों को सूचीबद्ध करता है; इस मामले में "बड़े"। इस प्रकार, प्रत्येक से को घटाया जाता है , क्षतिपूर्ति करने के लिए और से प्रत्येक को जोड़ दिया जाता है, और जोड़ दिया जाता है।αLαL,αM,αSβ0

सभी आधार श्रेणियों में गिरने वाले एक काल्पनिक व्यक्ति के लिए लॉग ऑड्स इसलिए के साथ-साथ अन्य सभी "कोवरिएट्स" से जुड़े शब्दों का एक गुच्छा - गैर-श्रेणीबद्ध चर: के बराबर होता है :β0

Odds(Base category)=exp(β0+β1X1++βpXp).

किसी भी श्रेणीगत चर से संबंधित कोई भी शब्द यहाँ नहीं दिखाई देते हैं। (मैं थोड़ा इस बिंदु पर संकेतन बदल गए हैं: बीटा अब केवल के गुणांकों हैं covariates , जबकि पूरा मॉडल alphas शामिल विभिन्न श्रेणियों के लिए।)βiαजे

विषमताओं की तुलना करना

आइए हम तुलना करें। मान लीजिए कि एक काल्पनिक व्यक्ति एक है

एक सफेद मोतियाबिंद, कोई मौलिक दृश्य, और एक छोटे से पुतले के साथ 80-89 आयु वर्ग के पुरुष रोगी, एक विशेषज्ञ रजिस्ट्रार द्वारा संचालित किया जा रहा है, ...

इस रोगी के साथ संबद्ध (चलो उसे चार्ली कहते हैं) प्रत्येक श्रेणी के लिए अनुमानित गुणांक हैं: उसके आयु समूह के लिए, होने के लिए , और इसी तरह। जहाँ भी उसकी विशेषता अपनी श्रेणी के लिए आधार है, वह गुणांक सम्मेलन द्वारा शून्य है , जैसा कि हमने देखा है। क्योंकि यह एक रैखिक मॉडल है, गुणांक जोड़ते हैं। इस प्रकार, ऊपर दिए गए बेस लॉग ऑड्स में, इस मरीज के लिए लॉग ऑड्स को जोड़कर प्राप्त किया जाता हैα80-89αपुरुष

α80-89+αपुरुष+αकोई ग्लूकोमा नहीं++αविशेषज्ञ रजिस्ट्रार

यह ठीक वह राशि है जिसके आधार पर इस रोगी की लॉग ऑड भिन्न होती है। लॉग ऑड से परिवर्तित करने के लिए, लघुगणक को पूर्ववत करें और याद रखें कि यह गुणा में बदल जाता है। इसलिए, आधार बाधाओं को कई गुना बढ़ाना चाहिए

exp(α80-89)exp(αपुरुष)exp(αकोई ग्लूकोमा नहीं)exp(αविशेषज्ञ रजिस्ट्रार)

ये "समायोजित OR" (समायोजित अंतर अनुपात) के तहत तालिका में दिए गए नंबर हैं। (इसे "समायोजित" कहा जाता है क्योंकि covariates को मॉडल में शामिल किया गया था। वे हमारी किसी भी गणना में कोई भूमिका नहीं निभाते हैं, जैसा कि आप देखेंगे। इसे "अनुपात" कहा जाता है क्योंकि यह ठीक इसी प्रकार की राशि है। रोगी की अनुमानित बाधाओं के उत्पादन के लिए आधार बाधाओं को गुणा किया जाना चाहिए: इस पद का पहला पैराग्राफ देखें।) तालिका में क्रम में, वे , , , और इसी तरह। लेख के अनुसार, उनका उत्पाद तक काम करता है । इसलियेएक्स1,...,एक्सपीexp(α80-89)=1.58exp(αपुरुष)=1.28exp(αकोई ग्लूकोमा नहीं)=1.0034.5

बाधाओं (चार्ली)=34.5×बाधाओं (आधार)

(ध्यान दें कि आधार श्रेणियों में सभी का अनुपात अनुपात , क्योंकि उत्पाद में सहित यह अपरिवर्तित रहता है। इस प्रकार आप आधार श्रेणियों को तालिका में स्थान दे सकते हैं।) 1.00=exp(0)1

परिणामों को संभाव्यता के रूप में पुनर्स्थापित करना

अंत में, हम इस परिणाम को संभावनाओं में परिवर्तित करते हैं। हमें बताया गया कि आधार रेखा की अनुमानित संभावना । इसलिए, शुरुआत में प्राप्त बाधाओं और संभावनाओं से संबंधित सूत्रों का उपयोग करके, हम गणना कर सकते हैं0.736%=.००,७३६

बाधाओं (आधार)=.००,७३६1-.००,७३६=.००,७४१।

नतीजतन चार्ली के हालात हैं

Odds(Charlie)=34.5×0.00741=0.256.

अंत में, इसे वापस संभावनाओं में परिवर्तित करना देता है

Pr(Y(Charlie)=1)=111+0.256=0.204.

3
व्हीबर: पिछले दिन बहुत थका देने के बाद मेरे कंप्यूटर के सामने आना और आपसे यह असाधारण प्रतिक्रिया पाना केवल शानदार है। आपने बहुत तंग स्थिति में मेरी मदद की है। बहुत धन्यवाद। (किसी तरह @ व्हिबर नहीं दिखाएगा ...)
महोनिसा
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.