जो व्यवहार आप देख रहे हैं वह लॉजिस्टिक रिग्रेशन में "विशिष्ट" मामला है, लेकिन हमेशा सच नहीं होता है। यह बहुत अधिक व्यापकता में भी है (नीचे देखें)। यह तीन अलग-अलग तथ्यों के संगम का परिणाम है।
- भविष्यवाणियों के रैखिक कार्य के रूप में लॉग-ऑड मॉडलिंग करने का विकल्प,
- लॉजिस्टिक रिग्रेशन मॉडल में गुणांकों के अनुमान प्राप्त करने के लिए अधिकतम संभावना का उपयोग, और
- मॉडल में एक अवरोधन शब्द का समावेश।
यदि उपरोक्त में से कोई भी मौजूद नहीं है, तो औसत अनुमानित संभावना नहीं होगी, सामान्य रूप से, नमूना में लोगों के अनुपात से मेल खाती है।
हालांकि, (लगभग) सभी सांख्यिकीय सॉफ़्टवेयर ऐसे मॉडल के लिए अधिकतम-संभावना अनुमान का उपयोग करते हैं, इसलिए, व्यवहार में, आइटम 1 और 2 अनिवार्य रूप से हमेशा मौजूद होते हैं, और आइटम 3 आमतौर पर मौजूद होते हैं, विशेष मामलों को छोड़कर।
कुछ विवरण
ठेठ लॉजिस्टिक रिग्रेशन फ्रेमवर्क में, हम प्रायिकता साथ स्वतंत्र द्विपद परीक्षण के परिणाम का निरीक्षण करते हैं । चलो y मैं मनाया प्रतिक्रियाओं हो। तो कुल संभावना है
एल = n Π मैं = 1 पी y मैं मैं ( 1 - पी मैं ) 1 - y मैं = n Π मैं = 1 exp ( y मैं लॉग इन करें ( पी मैं / ( 1 - पी मैंपीमैंyमैं
और इतने लॉग-संभावना है
ℓ = n Σ मैं = 1 y मैं लॉग इन करें ( पी मैं / ( 1 - पी मैं ) ) + n Σ मैं = 1 लॉग ( 1 - पी मैं )
ल = ∏मैं = १nपीyमैंमैं( 1 - पीमैं)1 - वाईमैं= ∏मैं = १nexp( yमैंलॉग( पीमैं/ (1- पीमैं) ) + लॉग( 1 - पीमैं) ),
ℓ = Σमैं = १nyमैंलॉग( पीमैं/ (1- पीमैं) ) + ∑मैं = १nलॉग( 1 - पीमैं)।
अब, हम भविष्यवक्ताओं का एक वेक्टर है प्रत्येक अवलोकन के लिए और तथ्य 1 से ऊपर, रसद प्रतिगमन मॉडल मानती है कि
लॉग पी मैंएक्समैं
मापदंडों के किसी अज्ञात वेक्टर के लिए β । नोट: इस उलटफेर करके, हम है कि मिल पी मैं = 1 / ( 1 + ई - β टी एक्स मैं ) ।
लॉगपीमैं1 - पीमैं= βटीएक्समैं,
βपीमैं= 1 / ( 1 + ई- βटीएक्समैं)
मॉडल फिट से प्रभावित होती है समीकरणों का एक सेट अधिकतम संभावना का उपयोग करना (फैक्ट 2) पर विचार से हल करने के लिए । गौर करें कि
∂ ℓ∂ℓ / ∂β= 0
∂ℓ∂β= ∑मैंyमैंएक्समैं- ∑मैंएक्समैं1 + ऍक्स्प( - βटीएक्समैं)= ∑मैंyमैंएक्समैं- ∑मैंपीमैंएक्समैं,
Σमैंyमैंएक्समैं= ∑मैंपी^मैंएक्समैं,
पी^मैं=(1+exp(−β^Txi))−1
xiji∑iyixij=∑iyi=∑ip^i
एक अनुकरण
R
x <- rnorm(100)
p <- 1/(1+exp(-3*x))
y <- runif(100) <= p
mean(y)
# Should be identical to mean(y)
mean( predict( glm(y~x, family="binomial"), type="response" ) )
# Won't be identical (usually) to mean(y)
mean( predict( glm(y~x+0, family="binomial"), type="response") )
सामान्य मामला : जैसा कि ऊपर उल्लेख किया गया है, संपत्ति जो औसत प्रतिक्रिया के अनुसार अनुमानित औसत के बराबर है, सामान्यीकृत रैखिक मॉडल के वर्ग के लिए अधिक से अधिक व्यापकता रखती है , अधिकतम संभावना से, विहित लिंक फ़ंक्शन का उपयोग करके , और इंटरसेप्ट सहित में नमूना।
संदर्भ
संबंधित सिद्धांत के लिए कुछ अच्छे संदर्भ निम्नलिखित हैं।
- ए। अग्रेस्टी (2002), श्रेणीबद्ध डेटा विश्लेषण , 2 एड।, विली।
- पी। मैक्कुलग और जेए नेल्डर (1989), सामान्यीकृत रैखिक मॉडल , दूसरा संस्करण, चैपमैन एंड हॉल। (सामान्य तरीकों के मूल लेखकों से पाठ।)