ऑड्स संभावना व्यक्त करने का एक तरीका है। बाधाओं अनुपात बस इतना है कि: एक दूसरे से विभाजित बाधाओं। इसका मतलब यह है कि एक ऑड्स अनुपात वह है जो आप एक ऑड्स को गुणा करके दूसरे का उत्पादन करते हैं। आइए देखें कि वे इस सामान्य स्थिति में कैसे काम करते हैं।
बाधाओं और संभावना के बीच रूपांतरण
एक द्विआधारी प्रतिक्रिया की संभावनाएं उसके होने के अवसर का अनुपात होती हैं ( 1 के साथ कोडित ), पीआर ( वाई = 1 ) लिखा जाता है, मौका यह नहीं करता है ( 0 के साथ कोडित ), लिखित पीआर ( वाई = 0 ) :Y1Pr(Y=1)0Pr(Y=0)
Odds(Y)=Pr(Y=1)Pr(Y=0)=Pr(Y=1)1−Pr(Y=1).
दाईं ओर समतुल्य अभिव्यक्ति यह दिखाती है कि ऑड्स को खोजने के लिए यह मॉडल पर निर्भर करता है । इसके विपरीत, ध्यान दें कि हम हल कर सकते हैंPr(Y=1)
Pr(Y=1)=Odds(Y)1+Odds(Y)=1−11+Odds(Y).
रसद प्रतिगमन
लॉजिस्टिक प्रतिगमन व्याख्यात्मक चर के एक रैखिक समारोह के रूप में की बाधाओं का लघुगणक मॉडल है । आमतौर पर, इन चरों को में और रैखिक फ़ंक्शन में एक संभावित निरंतर शब्द सहित, हम गुणांक (जिसे डेटा से अनुमानित किया जा सकता है) को और के रूप में । औपचारिक रूप से यह मॉडल का निर्माण करता हैx 1 , ... , एक्स पी बीटा 1 , ... , β पी β 0Yx1,…,xpβ1,…,βpβ0
log(Odds(Y))=β0+β1x1+⋯+βpxp.
लघुगणक को पूर्ववत् करके बाधाओं को स्वयं ही प्राप्त किया जा सकता है:
Odds(Y)=exp(β0+β1x1+⋯+βpxp).
श्रेणीबद्ध चर का उपयोग करना
श्रेणीबद्ध चर, जैसे कि आयु समूह, लिंग, ग्लूकोमा की उपस्थिति, आदि , "डमी कोडिंग" के माध्यम से शामिल किए गए हैं। यह दिखाने के लिए कि चर को कैसे कोडित किया जाता है, इससे कोई फर्क नहीं पड़ता, मैं एक छोटे समूह का एक सरल उदाहरण प्रदान करूंगा; कई समूहों के लिए इसका सामान्यीकरण स्पष्ट होना चाहिए। इस अध्ययन में एक चर "पुतली का आकार", तीन श्रेणियों के साथ, "बड़ा", "मध्यम" और "छोटा" है। (अध्ययन व्यवहार करता है इन के रूप में विशुद्ध रूप से स्पष्ट, जाहिरा तौर पर अपने निहित आदेश पर कोई ध्यान नहीं दे रही।) Intuitively, प्रत्येक श्रेणी के लिए अपने स्वयं के हालात का कहना है "बड़े", के लिए "मध्यम" के लिए, और "छोटा" के लिए । इसका मतलब है कि, अन्य सभी चीजें समान हैं,α एम α एसαLαMαS
Odds(Y)=exp(αL+β0+β1x1+⋯+βpxp)
"बड़े" श्रेणी में किसी के लिए,
Odds(Y)=exp(αM+β0+β1x1+⋯+βpxp)
"मध्यम" श्रेणी में किसी के लिए भी, और
Odds(Y)=exp(αS+β0+β1x1+⋯+βpxp)
"लघु" श्रेणी में उन लोगों के लिए।
पहचानने योग्य गुणांक बनाना
मैं उन्हें उजागर करने के लिए पहले दो गुणांक रंग का है क्योंकि मैं तुम्हें नोटिस करना चाहते हैं कि वे एक सरल परिवर्तन होने की अनुमति देते हैं,: हम किसी भी संख्या ले सकता है और, में जोड़कर और में से प्रत्येक से यह घटाकर , , और , हम किसी भी अनुमानित बाधाओं को नहीं बदलेंगे। यह फॉर्म के स्पष्ट समकक्षों के कारण हैγβ0αLαMαS
αL+β0=(αL−γ)+(γ+β0),
आदि हालांकि यह मॉडल के लिए कोई समस्या नहीं प्रस्तुत करता है - यह अभी भी वैसी ही चीजों की भविष्यवाणी करता है - यह दर्शाता है कि पैरामीटर अपने आप में व्याख्या करने योग्य नहीं हैं। जब हम इस जोड़-घटाव पैंतरेबाज़ी करते हैं, तो गुणांक के बीच अंतर होते हैं । परंपरागत रूप से, पहचान की इस कमी को दूर करने के लिए , लोग (और डिफ़ॉल्ट रूप से, सॉफ़्टवेयर) "चर" या "संदर्भ" के रूप में प्रत्येक चर में से एक श्रेणी चुनते हैं और बस यह निर्धारित करते हैं कि इसका गुणांक शून्य होगा। इससे अस्पष्टता दूर होती है।
कागज पहले संदर्भ श्रेणियों को सूचीबद्ध करता है; इस मामले में "बड़े"। इस प्रकार, प्रत्येक से को घटाया जाता है , क्षतिपूर्ति करने के लिए और से प्रत्येक को जोड़ दिया जाता है, और जोड़ दिया जाता है।αLαL,αM,αSβ0
सभी आधार श्रेणियों में गिरने वाले एक काल्पनिक व्यक्ति के लिए लॉग ऑड्स इसलिए के साथ-साथ अन्य सभी "कोवरिएट्स" से जुड़े शब्दों का एक गुच्छा - गैर-श्रेणीबद्ध चर: के बराबर होता है :β0
Odds(Base category)=exp(β0+β1X1+⋯+βpXp).
किसी भी श्रेणीगत चर से संबंधित कोई भी शब्द यहाँ नहीं दिखाई देते हैं। (मैं थोड़ा इस बिंदु पर संकेतन बदल गए हैं: बीटा अब केवल के गुणांकों हैं covariates , जबकि पूरा मॉडल alphas शामिल विभिन्न श्रेणियों के लिए।)βiαजे
विषमताओं की तुलना करना
आइए हम तुलना करें। मान लीजिए कि एक काल्पनिक व्यक्ति एक है
एक सफेद मोतियाबिंद, कोई मौलिक दृश्य, और एक छोटे से पुतले के साथ 80-89 आयु वर्ग के पुरुष रोगी, एक विशेषज्ञ रजिस्ट्रार द्वारा संचालित किया जा रहा है, ...
इस रोगी के साथ संबद्ध (चलो उसे चार्ली कहते हैं) प्रत्येक श्रेणी के लिए अनुमानित गुणांक हैं: उसके आयु समूह के लिए, होने के लिए , और इसी तरह। जहाँ भी उसकी विशेषता अपनी श्रेणी के लिए आधार है, वह गुणांक सम्मेलन द्वारा शून्य है , जैसा कि हमने देखा है। क्योंकि यह एक रैखिक मॉडल है, गुणांक जोड़ते हैं। इस प्रकार, ऊपर दिए गए बेस लॉग ऑड्स में, इस मरीज के लिए लॉग ऑड्स को जोड़कर प्राप्त किया जाता हैα80-89αपुरुष
α80-89+ αपुरुष+ αकोई ग्लूकोमा नहीं+ ⋯ + αविशेषज्ञ रजिस्ट्रार।
यह ठीक वह राशि है जिसके आधार पर इस रोगी की लॉग ऑड भिन्न होती है। लॉग ऑड से परिवर्तित करने के लिए, लघुगणक को पूर्ववत करें और याद रखें कि यह गुणा में बदल जाता है। इसलिए, आधार बाधाओं को कई गुना बढ़ाना चाहिए
exp( α80-89) एक्सप( αपुरुष) एक्सप( αकोई ग्लूकोमा नहीं) ⋯ ऍक्स्प( αविशेषज्ञ रजिस्ट्रार) का है ।
ये "समायोजित OR" (समायोजित अंतर अनुपात) के तहत तालिका में दिए गए नंबर हैं। (इसे "समायोजित" कहा जाता है क्योंकि covariates को मॉडल में शामिल किया गया था। वे हमारी किसी भी गणना में कोई भूमिका नहीं निभाते हैं, जैसा कि आप देखेंगे। इसे "अनुपात" कहा जाता है क्योंकि यह ठीक इसी प्रकार की राशि है। रोगी की अनुमानित बाधाओं के उत्पादन के लिए आधार बाधाओं को गुणा किया जाना चाहिए: इस पद का पहला पैराग्राफ देखें।) तालिका में क्रम में, वे , , , और इसी तरह। लेख के अनुसार, उनका उत्पाद तक काम करता है । इसलियेएक्स1, ... , एक्सपीexp( α80-89) = 1.58exp( αपुरुष) = 1.28exp( αकोई ग्लूकोमा नहीं) = 1.0034.5
ऑड्स (चार्ली) = 34.5 × ऑड्स (बेस) ।
(ध्यान दें कि आधार श्रेणियों में सभी का अनुपात अनुपात , क्योंकि उत्पाद में सहित यह अपरिवर्तित रहता है। इस प्रकार आप आधार श्रेणियों को तालिका में स्थान दे सकते हैं।) 1.00 = एक्सप( 0 )1
परिणामों को संभाव्यता के रूप में पुनर्स्थापित करना
अंत में, हम इस परिणाम को संभावनाओं में परिवर्तित करते हैं। हमें बताया गया कि आधार रेखा की अनुमानित संभावना । इसलिए, शुरुआत में प्राप्त बाधाओं और संभावनाओं से संबंधित सूत्रों का उपयोग करके, हम गणना कर सकते हैं0.736 % = 0.00736
ऑड्स (बेस) = 0.007361 - 0.00736 है= 0.00741।
नतीजतन चार्ली के हालात हैं
Odds(Charlie)=34.5×0.00741=0.256.
अंत में, इसे वापस संभावनाओं में परिवर्तित करना देता है
Pr(Y(Charlie)=1)=1−11+0.256=0.204.