जीएलएम में, संतृप्त मॉडल की लॉग संभावना हमेशा शून्य होती है?


14

सामान्यीकृत रैखिक मॉडल के आउटपुट के भाग के रूप में, मॉडल के मूल्यांकन के लिए नल और अवशिष्ट विचलन का उपयोग किया जाता है। मैं अक्सर संतृप्त मॉडल की लॉग संभावना के रूप में व्यक्त की गई इन राशियों के सूत्र देखता हूं, उदाहरण के लिए: /stats//a/113022/22199 , लॉजिस्टिक रिग्रेशन: एक संतृप्त मॉडल कैसे प्राप्त करें

संतृप्त मॉडल, जहां तक ​​मैं इसे समझता हूं, वह मॉडल है जो देखी गई प्रतिक्रिया को पूरी तरह से फिट बैठता है। इस प्रकार, ज्यादातर जगहों पर मैंने देखा है, संतृप्त मॉडल की लॉग-लाइबिलिटी हमेशा शून्य के रूप में दी जाती है।

फिर भी, जिस तरह से विचलन का सूत्र दिया गया है, उससे पता चलता है कि कभी-कभी यह मात्रा गैर शून्य होती है। (जैसे कि यह हमेशा शून्य होता है, इसमें परेशान क्यों होता है?)

किन मामलों में यह शून्य हो सकता है? यदि यह कभी भी शून्य नहीं है, तो इसे भक्ति के सूत्र में क्यों शामिल करें?

जवाबों:


18

यदि आप वास्तव में लॉग-लाइबिलिटी का मतलब है , तो जवाब है: यह हमेशा शून्य नहीं है।

उदाहरण के लिए, प्वासों डेटा पर विचार करें: । के लिए लॉग-संभावना Y = ( y 1 , ... , y एन ) द्वारा दिया जाता है: ( μ ; वाई ) = - n Σ मैं = 1 μ मैं + n Σ मैं = 1 y मैं लॉग इन करें μyiPoisson(μi),i=1,,nY=(y1,,yn)

()(μ;Y)=i=1nμi+i=1nyilogμii=1nlog(yi!).

अंतर में ( * ) सम्मान के साथ करने के लिए μ मैं और के लिए सेट 0 (यह है कि हम कैसे संतृप्त मॉडल के लिए MLE प्राप्त है): - 1 + y मैं(μ;Y)()μi0 के लिए इस का समाधानμमैंपाने के लिए μ मैं=yमैं, प्रतिस्थापन μ मैंवापस में(*)के लिएμमैंकि संतृप्त मॉडल की लॉग-संभावना है देता है: ( μ ;Y)=n Σ मैं=1yमैं(लॉग ऑनyमैं-1)-एन Σ मैं=

1+yiμi=0.
μiμ^i=yiμ^i()μi जब तकyमैंबहुत विशेष मान नहीं लेता।
(μ^;Y)=i=1nyi(logyi1)i=1nlog(yi!)0
yi

आइटम के तहत Rफ़ंक्शन के सहायता पृष्ठ में , दस्तावेज़ इस मुद्दे को निम्नानुसार समझाता है:glmdeviance

deviance एक निरंतर, शून्य से अधिकतम दो बार लॉग-लाइक होने की संभावना। जहां समझदार है, निरंतर को चुना जाता है ताकि संतृप्त मॉडल में अवमूल्यन शून्य हो।

ध्यान दें कि इसने उल्लेख किया है कि संतृप्त मॉडल की लॉग- लाइबिलिटी के बजाय विचलन शून्य होना चुना जाता है।

शायद, जो आप वास्तव में पुष्टि करना चाहते थे, वह यह है कि " संतृप्त मॉडल का विचलन हमेशा शून्य के रूप में दिया जाता है", यह सच है, विचलन के बाद से, परिभाषा के अनुसार ( एलन डेटा द्वारा श्रेणीबद्ध डेटा विश्लेषण की धारा 4.5.1 देखें ) अग्रेस्टी) संतृप्त मॉडल के लिए एक निर्दिष्ट जीएलएम की संभावना अनुपात सांख्यिकीय है। constantआर दस्तावेज में ऊपर उल्लिखित वास्तव में संतृप्त मॉडल की दो बार अधिकतम लॉग-संभावना है।

M1M2M1M2

निष्कर्ष

  1. संतृप्त मॉडल की लॉग-संभावना सामान्य गैर-शून्य में है।

  2. संतृप्त मॉडल का विचलन (इसकी मूल परिभाषा में) शून्य है।

  3. विचलन के रूप में यह वास्तव में कुछ और (deviances के बीच अंतर) का अर्थ है सॉफ्टवेयर से निर्गम (आर) के रूप में सामान्य गैर शून्य में है।


7

(1)f(yi;θi,φ)=exp[Ai(yiθiγ(θi))/φ+τ(yi,φ/Ai)].
Aiφ
(θ,φ;Y)=i=1nAi(yiθiγ(θi))/φ+i=1nτ(yi,φ/Ai).
0=U(θi)=(θ,φ;Y)θi=Ai(yiγ(θi))φ

θ^i

()(θ^,φ;Y)=i=1nAi(yiθ^iγ(θ^i))/φ+i=1nτ(yi,φ/Ai).

()Γ(α,β)


f(y;α,β)=βαΓ(α)eβyyα1,y>0,α>0,β>0,
f(1)
φ=1α,θ=βα,
f
f(y;θ,φ)=exp[θy(log(θ))φ+τ(y,φ)],
τ(y,φ)=logφφ+(1φ1)logylogΓ(φ1).
θ^i=1yi
i=1n1φ[θ^iyi(log(θ^i))]=i=1n1φ[1log(yi)]0,
yi

1
क्या loglikelihood शून्य है और केवल अगर मॉडल संभावित परिणामों में से प्रत्येक को 100% संभावना प्रदान कर सकता है?
एलेक्स

0τ0

आपकी व्युत्पत्ति बहुत अच्छी है लेकिन औपचारिक प्रमाण फिलहाल मेरे सिर से थोड़ा ऊपर है। Poisson मॉडल के साथ अपने उदाहरण के लिए धन्यवाद। इस उदाहरण से मैंने जो निकाला वह यह है कि पॉइसन मॉडल 100% संभाव्यता को निर्दिष्ट नहीं कर सकता है, क्योंकि अवलोकन परिणाम पोइसन माध्य के लिए कोई भी मूल्य है, इस प्रकार संभावना शून्य नहीं हो सकती है।
एलेक्स

100%y1,,ynYP(Y=y1)+P(Y=y2)++P(Y=yn)<1

1
YP(Y=yi)<1i

4

0

संभावना है जहां ।

(1)L(y;X,β)=i=1nf(yi;xi,β)=i=1nπiyi(1πi)1yi=i=1n(πi1πi)yi(1πi)
πi=invlogit(xiβ)

लॉग-

logL(y;X,β)=i=1nyilog(πi1πi)+log(1πi)=i=1nyilogit(πi)+log(1πi)=i=1nyixiβ+log(1invlogit(xiβ))=i=1nyixiβ+log(invlogit(xiβ))=i=1nyixiβlog(1+exp[xiβ]))

यदि आप उन सभी गुणांक के संबंध में डेरिवेटिव लेते हैं, जो आपको

(2)(β)=i=1nyixiexp[xiβ](1+exp[xiβ])xi.

इस अभिव्यक्ति को बराबर सेट करने और लिए हल करने से आपको अपना उत्तर मिल जाएगा। आमतौर पर यह विश्लेषणात्मक रूप से नहीं किया जा सकता है, जो इस मॉडल को फिट करने के लिए पुनरावृत्त एल्गोरिदम का उपयोग करने की लोकप्रियता / आवश्यकता की व्याख्या करता है, लेकिन संतृप्त मॉडल के मामले में, यह संभव है।0β

संतृप्त मॉडल को खोजने के लिए, हम प्रत्येक पंक्ति को स्वयं गुणांक देते हैं। So और डिजाइन मैट्रिक्स गुणांक वेक्टर गुणांक βRn

Xβ=[100010001][β1β2βn].

ध्यान दें कि विशेष रूप से, ।xiβ=βi

तो समीकरण की वीं पंक्ति (2) लेने से हमें j

i=1nyixi,j=i=1nexp[xiβ](1+exp[xiβ])xi,j

जो केवल तभी हो सकता है यदि प्रत्येक अवलोकन के लिए :i

yi=invlogit(βi)
या दूसरे शब्दों में से प्रत्येक में प्लस या माइनस अनंत है (यदि है या , क्रमशः)। हम अधिकतम प्राप्त करने के लिए इन मापदंडों को वापस (1) में प्लग कर सकते हैं: स्पष्ट रूप से इस का लॉग ।βiyi10
i=1nπ^iyi(1π^i)1yi=1n=1.
0


लेकिन यह डेटा अनियंत्रित मान लेता है । यदि आपके पास (और समान मान) के साथ समूह हैं (R में, फॉर्म का उपयोग करके फोरेक्सम्पल) तो संतृप्त मॉडल में loglikelihood शून्य नहीं है। ni>1glm( cbind(k, n-k) ~ x + ...
kjetil b halvorsen

@kjetilbhalvorsen ओह अच्छी बात है। मैंने कभी कोशिश नहीं की कि मुझे चेक करे
टेलर

1

@ एलेक्स: हाँ, यह सही है। कम से कम असतत वितरण के लिए। निरंतर वितरण के लिए, यह घनत्व 1 के बराबर होने देने के लिए नीचे आएगा, जो जरूरी नहीं कि सार्थक हो और इसलिए प्रयास करने और प्राप्त करने के लिए एक समझदार चीज नहीं है। थोड़ा और आम तौर पर, संतृप्त मॉडल की लॉग-लाइबिलिटी आपको किसी भी मॉडल के प्रदर्शन के लिए एक ऊपरी बाध्यता प्रदान करती है जो अंतर्निहित वितरण परिवार की आपकी धारणा का अनुसरण करती है। दूसरे शब्दों में, एक संतृप्त द्विपद मॉडल की लॉग-लाइबिलिटी यह "दिए गए डेटा सेट (X, Y) के लिए Y" द्विपद है। 100% (या इसी तरह) के विपरीत, अपने मॉडल को अपने glm मॉडल की तुलना करने के लिए समझ में आता है, क्योंकि आपका मॉडल प्रतिक्रिया वितरण पर आपकी धारणा से स्वाभाविक रूप से विवश है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.