लॉगरिदमिक ऑफसेट के साथ बाइनरी मॉडल (प्रोबिट और लॉगिट)


12

क्या किसी को इस बात की व्युत्पत्ति है कि प्रोब और लॉजिट जैसे बाइनरी मॉडल में ऑफसेट कैसे काम करता है?

मेरी समस्या में, अनुवर्ती विंडो लंबाई में भिन्न हो सकती है। मान लीजिए कि रोगियों को उपचार के रूप में रोगनिरोधी गोली मिलती है। शॉट अलग-अलग समय पर होता है, इसलिए यदि परिणाम बाइनरी सूचक है कि क्या कोई भी भड़कना हुआ, तो आपको इस तथ्य के लिए समायोजित करने की आवश्यकता है कि कुछ लोगों के पास लक्षणों को प्रदर्शित करने के लिए अधिक समय है। ऐसा लगता है कि भड़कने की संभावना अनुवर्ती अवधि की लंबाई के लिए आनुपातिक है। यह मेरे लिए गणितीय रूप से स्पष्ट नहीं है कि कैसे ऑफसेट के साथ एक द्विआधारी मॉडल इस अंतर्ज्ञान (पोइसन के साथ विपरीत) को पकड़ता है।

ऑफसेट है दोनों में एक मानक विकल्प Stata (p.1666) और आर , और मैं आसानी से एक के लिए इसे देख सकते हैं प्वासों , लेकिन द्विआधारी मामले में थोड़ा अपारदर्शी है।

उदाहरण के लिए, यदि हमारे पास यह बीजगणितीय मॉडल के समान है जहां जो मानक मॉडल है जिसके गुणांक के साथ विवश । इसे लॉगरिदमिक ऑफ़सेट कहा जाता है । मुझे यह पता लगाने में समस्या हो रही है कि अगर हम या साथ को प्रतिस्थापित करते हैं तो यह कैसे काम करता है ।लॉगजेड1exp{}Φ()Λ()

E[y|x]Z=exp{xβ},
E[y|x]=exp{xβ+logZ},
logZ1exp{}Φ()Λ()

# 1 अपडेट करें:

लॉगिट मामले को नीचे समझाया गया था।

अपडेट # 2:

यहाँ प्रोबेट जैसे गैर-पॉज़िशन मॉडल के लिए ऑफ़सेट का मुख्य उपयोग प्रतीत होता है। ऑफसेट का उपयोग इंडेक्स फ़ंक्शंस गुणांक पर संभावना अनुपात परीक्षण करने के लिए किया जा सकता है। पहले आप बिना पढ़े मॉडल का अनुमान लगाते हैं और अनुमानों को संग्रहीत करते हैं। मान लें कि आप उस परिकल्पना का परीक्षण करना चाहते हैं जो । तब आप चर बनाते हैं , मॉडल छोड़ने वाले फिट करते हैं और को गैर-लघुगणक ऑफसेट के रूप में उपयोग करते हैं । यह विवश मॉडल है। एलआर परीक्षण दोनों की तुलना करता है, और सामान्य वाल्ड परीक्षण का एक विकल्प है।जेड = 2 एक्स एक्स जेडβx=2z=2xxz

जवाबों:


8

आप हमेशा किसी भी GLM में एक ऑफसेट शामिल कर सकते हैं : यह सिर्फ एक प्रेडिक्टर वैरिएबल है जिसका गुणांक 1 पर तय किया गया है। पॉइसन रिग्रेशन सिर्फ एक बहुत ही सामान्य उपयोग के मामले में होता है।

ध्यान दें कि एक द्विपद मॉडल में, ऑफसेट के रूप में लॉग-एक्सपोज़र का एनालॉग सिर्फ द्विपद भाजक है, इसलिए आमतौर पर इसे स्पष्ट रूप से निर्दिष्ट करने की आवश्यकता नहीं है। जैसे आप एक ऑफसेट के रूप में लॉग-एक्सपोज़र के साथ एक काउंट के रूप में एक पॉइज़न आरवी को मॉडल कर सकते हैं, या एक वजन के रूप में एक्सपोज़र के अनुपात के रूप में, आप इसी तरह एक द्विपद आरवी को सफलताओं और असफलताओं की गिनती के रूप में या ट्रायल के रूप में आवृत्ति के रूप में मॉडल कर सकते हैं। भार।

एक लॉजिस्टिक रिग्रेशन में, आप ऑड्स अनुपात के संदर्भ में एक ऑफसेट की व्याख्या करेंगे : में दिए गए आनुपातिक परिवर्तन में परिणाम में एक आनुपातिक परिवर्तन ।Z p / ( 1 - p )logZZp/(1p)

log(p/(1p))=βX+logZp/(1p)=Zexp(βX)

लेकिन इसका कोई विशेष महत्व नहीं है, जैसे कि पोज़ीशन रिजेक्शन में लॉग-एक्सपोज़र करता है। कहा कि, यदि आपकी द्विपद संभावना काफी छोटी है, तो एक लॉजिस्टिक मॉडल लॉग लिंक के साथ एक पॉइसन मॉडल का रुख करेगा (चूंकि LHS दृष्टिकोण 1 पर भाजक) और ऑफसेट को लॉग-एक्सपोज़र टर्म के रूप में माना जा सकता है।

(आपके लिंक किए गए R प्रश्न में वर्णित समस्या बल्कि अज्ञात थी।)


दोनों के समतुल्य होने की मेरी समझ से वेटिंग पार्ट गायब था। यह बहुत मददगार था। मैं अभी भी थोड़ा उलझन में हूं कि कोई व्यक्ति किस तरह से बदल सकता है, एक भड़कने की संभावना के बारे में एक बयान में आनुपातिक होने की संभावना है। अनुवर्ती अवधि की लंबाई , हालांकि मैं देख सकता हूं कि यह में कैसे बढ़ रहा । Pr(Y=1|X)=Φ(xβ+ln(t))टीtt
दिमित्री वी। मास्टरोव

यह संभावना नहीं है, लेकिन बाधाओं का अनुपात है। उम्मीद है कि संपादन इसे स्पष्ट करता है।
हांग ओई

समस्या को अनुपात के संदर्भ में व्यक्त करना इसे बहुत स्पष्ट करता है। प्रोबिट के बारे में क्या?
दिमित्री वी। मास्टरोव

मैं प्रोबेट के लिए काम करने की उम्मीद नहीं करूंगा, या कम से कम एक स्वच्छ व्याख्या करने के लिए, क्योंकि एक विहित लिंक नहीं है, और प्रोबिट के साथ एक द्विआधारी निर्भर चर घातीय परिवार में नहीं आता है। Φ()
StasK

@StasK यह सही लगता है, लेकिन फिर स्टैटा और आर में ये विकल्प क्यों मौजूद हैं? वे क्या पूरा करते हैं?
दिमित्री वी। मास्टरोव

1

इसे समय-समय पर होने वाली समस्या के रूप में स्वीकार करते हुए, एक लॉन्ज़ (समय) के साथ एक लॉजिस्टिक मॉडल प्रभावी रूप से ऑफसेट नहीं होगा जो आपको एक पैरामीट्रिक उत्तरजीविता फ़ंक्शन के लिए प्रतिबद्ध करता है जो डेटा को अच्छी तरह से फिट कर सकता है या नहीं कर सकता है?

पी / (1-पी) = Z * exp (xbeta)

p = [Z * exp (xbeta)] / [1 + Z * exp (xbeta)]

Z = 1- [Z * exp (xbeta)] / [1 + Z * exp (xbeta)]

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.