लॉजिस्टिक रजिस्टेंस के गुण


17

हम कुछ लॉजिस्टिक रेजिमेंट्स के साथ काम कर रहे हैं और हमने महसूस किया है कि औसत अनुमानित संभावना हमेशा नमूने में लोगों के अनुपात के बराबर होती है; अर्थात्, सज्जित मूल्यों का औसत नमूने के औसत के बराबर है।

क्या कोई मुझे कारण समझा सकता है या मुझे एक संदर्भ दे सकता है जहां मुझे यह प्रदर्शन मिल सकता है?


2
इसका कारण यह है कि लॉजिस्टिक प्रतिगमन ठीक उसी को प्राप्त करने की कोशिश कर रहा है: पूर्व वितरण ("औसत") सहित डेटा वितरण को मॉडलिंग करना। क्या यह व्यवहार अवांछित है?
बायरज

1
@ बायर लिंक फ़ंक्शन की अशुद्धता यह संकेत देता है कि यह घटना आपके लक्षण वर्णन से अधिक गहरी है। वास्तव में यहाँ प्रदर्शन किया जाना है।
whuber

इस संपत्ति को कभी-कभी अंशांकन-इन-द-बड़े कहा जाता है जब जोखिम का अनुमान लगाने के लिए लॉजिस्टिक प्रतिगमन का उपयोग किया जाता है।
जूलियट

जवाबों:


26

जो व्यवहार आप देख रहे हैं वह लॉजिस्टिक रिग्रेशन में "विशिष्ट" मामला है, लेकिन हमेशा सच नहीं होता है। यह बहुत अधिक व्यापकता में भी है (नीचे देखें)। यह तीन अलग-अलग तथ्यों के संगम का परिणाम है।

  1. भविष्यवाणियों के रैखिक कार्य के रूप में लॉग-ऑड मॉडलिंग करने का विकल्प,
  2. लॉजिस्टिक रिग्रेशन मॉडल में गुणांकों के अनुमान प्राप्त करने के लिए अधिकतम संभावना का उपयोग, और
  3. मॉडल में एक अवरोधन शब्द का समावेश।

यदि उपरोक्त में से कोई भी मौजूद नहीं है, तो औसत अनुमानित संभावना नहीं होगी, सामान्य रूप से, नमूना में लोगों के अनुपात से मेल खाती है।

हालांकि, (लगभग) सभी सांख्यिकीय सॉफ़्टवेयर ऐसे मॉडल के लिए अधिकतम-संभावना अनुमान का उपयोग करते हैं, इसलिए, व्यवहार में, आइटम 1 और 2 अनिवार्य रूप से हमेशा मौजूद होते हैं, और आइटम 3 आमतौर पर मौजूद होते हैं, विशेष मामलों को छोड़कर।

कुछ विवरण

ठेठ लॉजिस्टिक रिग्रेशन फ्रेमवर्क में, हम प्रायिकता साथ स्वतंत्र द्विपद परीक्षण के परिणाम का निरीक्षण करते हैं । चलो y मैं मनाया प्रतिक्रियाओं हो। तो कुल संभावना है एल = n Π मैं = 1 पी y मैं मैं ( 1 - पी मैं ) 1 - y मैं = n Π मैं = 1 exp ( y मैं लॉग इन करें ( पी मैं / ( 1 - पी मैंपीमैंyमैं और इतने लॉग-संभावना है = n Σ मैं = 1 y मैं लॉग इन करें ( पी मैं / ( 1 - पी मैं ) ) + n Σ मैं = 1 लॉग ( 1 - पी मैं )

एल=Πमैं=1nपीमैंyमैं(1-पीमैं)1-yमैं=Πमैं=1nexp(yमैंलॉग(पीमैं/(1-पीमैं))+लॉग(1-पीमैं)),
=Σमैं=1nyमैंलॉग(पीमैं/(1-पीमैं))+Σमैं=1nलॉग(1-पीमैं)

अब, हम भविष्यवक्ताओं का एक वेक्टर है प्रत्येक अवलोकन के लिए और तथ्य 1 से ऊपर, रसद प्रतिगमन मॉडल मानती है कि लॉग पी मैंएक्समैं मापदंडों के किसी अज्ञात वेक्टर के लिए βनोट: इस उलटफेर करके, हम है कि मिल पी मैं = 1 / ( 1 + - β टी एक्स मैं )

लॉगपीमैं1-पीमैं=βटीएक्समैं,
βपीमैं=1/(1+-βटीएक्समैं)

मॉडल फिट से प्रभावित होती है समीकरणों का एक सेट अधिकतम संभावना का उपयोग करना (फैक्ट 2) पर विचार से हल करने के लिए । गौर करें कि /β=0

β=Σमैंyमैंएक्समैं-Σमैंएक्समैं1+exp(-βटीएक्समैं)=Σमैंyमैंएक्समैं-Σमैंपीमैंएक्समैं,
Σमैंyमैंएक्समैं=Σमैंपी^मैंएक्समैं,
p^i=(1+exp(β^Txi))1

xijiiyixij=iyi=ip^i

एक अनुकरण

R

x <- rnorm(100)
p <- 1/(1+exp(-3*x))
y <- runif(100) <= p
mean(y)
# Should be identical to mean(y)
mean( predict( glm(y~x, family="binomial"), type="response" ) )
# Won't be identical (usually) to mean(y)
mean( predict( glm(y~x+0, family="binomial"), type="response") )

सामान्य मामला : जैसा कि ऊपर उल्लेख किया गया है, संपत्ति जो औसत प्रतिक्रिया के अनुसार अनुमानित औसत के बराबर है, सामान्यीकृत रैखिक मॉडल के वर्ग के लिए अधिक से अधिक व्यापकता रखती है , अधिकतम संभावना से, विहित लिंक फ़ंक्शन का उपयोग करके , और इंटरसेप्ट सहित में नमूना।

संदर्भ

संबंधित सिद्धांत के लिए कुछ अच्छे संदर्भ निम्नलिखित हैं।

  1. ए। अग्रेस्टी (2002), श्रेणीबद्ध डेटा विश्लेषण , 2 एड।, विली।
  2. पी। मैक्कुलग और जेए नेल्डर (1989), सामान्यीकृत रैखिक मॉडल , दूसरा संस्करण, चैपमैन एंड हॉल। (सामान्य तरीकों के मूल लेखकों से पाठ।)

4
+1 यह प्रदर्शन (सभी जीएलएम को सामान्य करने की कोशिश किए बिना लॉजिस्टिक रिग्रेशन मॉडल के लिए विशिष्ट), माददला (1983) लिमिटेड डिपेंडेंट और क्वालिटेटिव वेरिएबल्स इन इकोनोमेट्रिक्स , पीपी 25-26 में भी दिया गया है ।
StasK

@StasK: अतिरिक्त संदर्भ के लिए धन्यवाद, जिससे मैं परिचित नहीं हूं। चीयर्स।
कार्डिनल

@कार्डिनल: मुझे याद नहीं है कि अग्रेती इस पर चर्चा कर रहे हैं। क्या मैक्कलघ और नेल्डर में इसकी चर्चा है?
जूलियट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.