लॉजिस्टिक रिग्रेशन में अनुपातों को कम करने के लिए सरल भविष्यवाणियों की व्याख्या


29

मैं लॉजिस्टिक रिग्रेशन का उपयोग करने के लिए कुछ नया हूं, और निम्नलिखित मूल्यों की मेरी व्याख्याओं के बीच एक विसंगति से थोड़ा भ्रमित हूं जो मैंने सोचा था कि वही होगा:

  • घातांक बीटा मान
  • बीटा मानों का उपयोग करके परिणाम की संभावना की भविष्यवाणी की।

यहां उस मॉडल का एक सरलीकृत संस्करण है जिसका मैं उपयोग कर रहा हूं, जहां अल्पपोषण और बीमा दोनों द्विआधारी हैं, और धन निरंतर है:

Under.Nutrition ~ insurance + wealth

मेरा (वास्तविक) मॉडल बीमा के लिए .8 का एक प्रतिपादक बीटा मान लौटाता है, जिसे मैं निम्नानुसार समझाऊंगा:

"एक बीमित व्यक्ति के लिए कुपोषित होने की संभावना है। एक असंक्रमित व्यक्ति के लिए कुपोषित होने की संभावना का 8 गुना।"

हालांकि, जब मैं बीमा चर में 0 और 1 के मूल्यों और धन के लिए औसत मूल्य में डालकर व्यक्तियों के लिए संभावनाओं में अंतर की गणना करता हूं, तो कुपोषण में अंतर केवल .04 है। इस प्रकार गणना की जाती है:

Probability Undernourished = exp(β0 + β1*Insurance + β2*Wealth) /
                             (1+exp(β0 + β1*Insurance + β2*wealth))

मैं वास्तव में इसकी सराहना करूंगा अगर कोई यह समझा सके कि ये मूल्य अलग-अलग क्यों हैं, और क्या बेहतर व्याख्या (विशेष रूप से दूसरे मूल्य के लिए) हो सकती है।


इसके अलावा स्पष्टता का संपादन,
जैसा कि मैं इसे समझता हूं, एक असंक्रमित व्यक्ति (जहां बी 1 बीमा से मेल खाती है) के लिए अल्प पोषित होने की संभावना है:

Prob(Unins) = exp(β0 + β1*0 + β2*Wealth) /
              (1+exp(β0 + β1*0+ β2*wealth))

जबकि बीमित व्यक्ति के लिए पोषित होने की संभावना है:

Prob(Ins)= exp(β0 + β1*1 + β2*Wealth) /
           (1+exp(β0 + β1*1+ β2*wealth))

बीमित व्यक्ति की तुलना में एक असंक्रमित व्यक्ति के लिए अल्पपोषित होने की संभावना है:

exp(B1)

क्या इन मूल्यों के बीच अनुवाद करने का कोई तरीका है (गणितीय रूप से)? मैं अभी भी इस समीकरण से थोड़ा भ्रमित हूं (जहां मुझे आरएचएस पर एक अलग मूल्य होना चाहिए):

Prob(Ins) - Prob(Unins) != exp(B)

आम आदमी की शर्तों में, सवाल यह है कि किसी व्यक्ति का बीमा करने की संभावना कम-पोषित होने की संभावना को उतना अधिक क्यों नहीं बदल देता है, जितना कि ऑड-ईवन अनुपात यह बताता है? मेरे डेटा में, प्रोब (Ins) - प्रोब (Unins) = .04, जहां एक्सपेरीनेटेड बीटा मान है ।8 (इसलिए अंतर क्यों नहीं है? 2?)


2
क्या ये अद्भुत और स्पष्ट स्पष्टीकरण लॉग-लॉजिस्टिक मॉडल / प्रतिगमन पर लागू होते हैं?

जवाबों:


50

exp(β0+β1x)exp(β0+β1x)1+exp(β0+β1x)
exp(β0+β1x)=0exp(β1)xx+1

अगर आपको अतिरिक्त / अलग जानकारी चाहिए तो मुझे बताएं।

अद्यतन:
मुझे लगता है कि यह ज्यादातर संभावनाओं और बाधाओं से अपरिचित होने का एक मुद्दा है, और वे एक दूसरे से कैसे संबंधित हैं। कि में से कोई भी बहुत सहज है, आप थोड़ी देर के लिए साथ काम करने बैठ जाओ और और करने की जरूरत है जानने के उन आधार पर विचार करना; यह स्वाभाविक रूप से किसी के लिए नहीं आता है।

मुद्दा यह है कि पूर्ण संख्याओं को अपने दम पर व्याख्या करना बहुत मुश्किल है। कहते हैं कि मैं आपको एक ऐसे समय के बारे में बता रहा था जब मेरे पास एक सिक्का था और मैं सोचता था कि क्या यह उचित था। तो मैंने इसे कुछ फ़्लिप किया और 6 सिर मिले। इसका क्या मतलब है? 6 एक बहुत, थोड़ा, सही के बारे में है? यह कहना मुश्किल है। इस समस्या से निपटने के लिए हम संख्याओं को कुछ संदर्भ देना चाहते हैं। इस तरह एक मामले में आवश्यक संदर्भ प्रदान करने के लिए दो स्पष्ट विकल्प हैं: मैं कुल संख्या की फ़्लिप दे सकता था, या मैं पूंछ की संख्या दे सकता था। किसी भी स्थिति में, आपके पास 6 शीर्षों की समझ बनाने के लिए पर्याप्त जानकारी होती है, और यदि आप मुझे बताएंगे कि आप जिसको पसंद नहीं करते हैं, तो आप दूसरे मूल्य की गणना कर सकते हैं। संभाव्यता घटनाओं की कुल संख्या से विभाजित किए गए प्रमुखों की संख्या है। ऑड्स हेड की संख्या का अनुपात है

probability=odds1+odds                odds=probability1probability
exp(β)

[0,1](,+)(0,+)wealth

exp(β0+β1x)exp(β0+β1x)=exp(β0+β1x)1+exp(β0+β1x)exp(β0+β1x)1+exp(β0+β1x)
xx

(हालांकि यह एक अलग प्रश्न के संदर्भ में लिखा गया था, मेरा उत्तर यहाँ रसद प्रतिगमन के बारे में जानकारी है कि और अधिक पूरी तरह से एलआर और संबंधित मुद्दों को समझने में आप के लिए सहायक हो सकता है की एक बहुत कुछ शामिल है।)


प्रतिक्रिया के लिए धन्यवाद - मैंने ऊपर दिए गए संपादन में अपनी उलझन को और समझाया।
माइक

वास्तव में समय की सराहना करते हुए एक पूरी व्याख्या लिखने के लिए - बहुत उपयोगी।
माइक

आपका स्वागत है, @ माइक, यही सीवी के लिए है।
गंग -

पुन लास वेगास बाधाओं लिंक: मैं वेगास कभी नहीं गया है, लेकिन देख कुछ कीमतों वेगास आधारित साइटों, जहां वे आंशिक बाधाओं बोली (के रूप में moneyline के खिलाफ) वे "के खिलाफ बाधाओं" के ब्रिटिश प्रणाली का अनुसरण द्वारा की पेशकश की, नहीं सांख्यिकीय "पक्ष में बाधाओं"। जैसे कि आपके लिंक पर "लास वेगास ऑड्स" वास्तविक जुआ बाधाओं के अनुरूप नहीं है, जहां "9 से 1" एक अप्रत्याशित घटना के लिए है, न कि (9 से 1 के रूप में "एक सांख्यिकीविद के लिए") एक संभावना है! भ्रम का एक स्रोत जिसे मैं यहां संबोधित करने की कोशिश करता हूं
सिल्वरफ़िश नोव

@Silverfish, मैं लंबे समय में लास वेगास नहीं गया। मुझे याद नहीं है कि वे आम तौर पर या के खिलाफ बाधाओं को सूचीबद्ध करते हैं। बहरहाल, '4 से 5' को लास वेगास ऑड्स कहा जाता है ।
गंग -

0

वैसे उत्तर सरल है जब आप सभी चर को स्थिर रखने के लिए तैयार होते हैं और एक चर भिन्न होता है। हालाँकि यह थोड़ा जटिल हो जाता है जब हर चर बदलता रहता है। आप निम्नलिखित पोस्ट को देख सकते हैं, यह http://analyticspro.org/2016/03/02/r-tutorial-multiple-linear-regression/ में मदद कर सकता है


-1

ऑड्स अनुपात या = ऍक्स्प (b) प्रोबेबिलिटी A = SQRT (OR) / (SQRT (OR) +1) का अनुवाद करता है, जहां प्रायिकता A, इवेंट A की प्रायिकता है और OR इवेंट A / नहीं होने (या) के होने का अनुपात है उजागर / ऊपर प्रश्न में के रूप में बीमा द्वारा उजागर नहीं)। इसे हल करने में मुझे काफी समय लगा; मुझे यकीन नहीं है कि ऐसा क्यों है, जो सुप्रसिद्ध सूत्र नहीं है।

एक उदाहरण है। मान लीजिए, विश्वविद्यालय में 10 व्यक्ति भर्ती हैं; उनमें से 7 पुरुष हैं। इसलिए, हर आदमी के लिए यह स्वीकार किए जाने की संभावना 70% है। पुरुषों के लिए भर्ती किए जाने वाले ऑड्स 7/3 = 2.33 हैं और 3/7 = 0.43 भर्ती नहीं किए जाने चाहिए। विषम अनुपात (OR) 2.33 / 0.43 = 5.44 है जिसका अर्थ है कि पुरुषों के लिए 5.44 गुना अधिक मौका महिलाओं के लिए भर्ती होने का है। आइए मनुष्य के लिए OR: P = SQRT (5.44) / (SQRT (5.44) +1) = 0.7 से भर्ती होने की संभावना खोजें

अद्यतन यह तभी सत्य है जब भर्ती किए गए पुरुषों या महिलाओं की संख्या आवेदकों की संख्या के बराबर हो। दूसरे शब्दों में, यह OR नहीं है। हम अतिरिक्त जानकारी जाने बिना संभावना हासिल नहीं कर सकते (या हानि) कारक पर निर्भर करता है।


गलत मुझे डर लग रहा: इस उदाहरण में हम बाधाओं (और संभावना) है कि किसी विश्वविद्यालय में भर्ती कराया एक आदमी (या औरत) है, लेकिन कोई बाधाओं का अनुमान कर सकते अनुपात भी जानते हुए भी कि कितने पुरुषों और महिलाओं के बीच में थे बिना आवेदकों । गलत मुझे डर लग रहा: इस उदाहरण में हम बाधाओं (और संभावना) है कि किसी विश्वविद्यालय में भर्ती कराया एक आदमी (या औरत) है, लेकिन कोई बाधाओं का अनुमान कर सकते अनुपात भी जानते हुए भी कि कितने पुरुषों और महिलाओं के बीच में थे बिना आवेदकों । ओआरए को आप यहां बुला रहे हैं, वास्तव में सिर्फ का अंतर है7232

जी, बिलकुल सही कहा आपने, धन्यवाद। मैंने पाया कि हम ज्ञात या (जिसे हम प्राप्त करते हैं, उदाहरण के लिए, लॉजिस्टिक रिग्रेशन आउटपुट के रूप में) में परिवर्तित नहीं कर सकते हैं। मैंने अपने उत्तर में अपडेट डाला।
निकर्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.