GLM के लिए "लिंक फ़ंक्शन" और "कैनोनिकल लिंक फ़ंक्शन" के बीच अंतर क्या है


65

'लिंक फ़ंक्शन' और 'कैनोनिकल लिंक फ़ंक्शन' के बीच अंतर क्या है? इसके अलावा, क्या एक के बाद एक प्रयोग करने के कोई (सैद्धांतिक) फायदे हैं?

उदाहरण के लिए, एक द्विआधारी प्रतिक्रिया चर जैसे कई लिंक कार्यों का उपयोग कर तैयार किया जा सकता logit , PROBIT , आदि लेकिन, logit यहाँ "प्रामाणिक" लिंक समारोह माना जाता है।


10
मैं यहां बड़े पैमाने पर लिंक कार्यों पर चर्चा करता हूं: लॉग और प्रोबेट मॉडल के बीच अंतर , एक द्विआधारी प्रतिक्रिया चर के लिए प्रतिगमन पर ध्यान केंद्रित करना। यद्यपि उस चर्चा का केवल एक लिंक फ़ंक्शन के 'विहित' होने के अर्थ पर केंद्रित है, फिर भी यह पढ़ने में मददगार हो सकता है। ध्यान दें कि गैर-विहित लिंक फ़ंक्शन के एक विहित और गैर-विहित लिंक फ़ंक्शन के भेद बी / टी और लाभों को समझने के लिए जीएलआईएम में अंतर्निहित गणित में काफी गहराई तक जाने की आवश्यकता होती है।
गंग -

जवाबों:


68

उपरोक्त उत्तर अधिक सहज हैं, इसलिए मैं और अधिक कठोरता की कोशिश करता हूं।

GLM क्या है?

मान = E ( y ) = μ के साथ प्रतिसाद y और p -dimensional कोवरिएट वेक्टर x = ( x 1 , , x p ) के एक सेट को निरूपित करते हैं । के लिए मैं = 1 , ... , n स्वतंत्र टिप्पणियों, प्रत्येक के वितरण y मैं घनत्व के साथ एक घातीय परिवार है ( y मैं ;Y=(y,x)ypx=(x1,,xp)E(y)=μi=1,,nyi यहाँ, ब्याज (प्राकृतिक या विहित पैरामीटर) के पैरामीटर है θ मैं , φ एक है पैमाने पैरामीटर (परिचित या एक बाधा के रूप में देखा) और γ और τ जाना जाता कार्य हैं। N के लिए तय इनपुट मानों की आयामी वैक्टर पी

f(yi;θi,ϕ)=exp{[yiθiγ(θi)]/ϕ+τ(yi,ϕ)}
θiϕγτnpव्याख्यात्मक चर द्वारा निरूपित किए जाते हैं । हम मानते हैं कि इनपुट केवल रैखिक कार्य है, रैखिक भविष्यवक्ता, के माध्यम से प्रभाव (1) वैक्टर η मैं = β 0 + β 1 एक्स मैं 1 + + β पी एक्स मैं पी जिस पर θ मैं निर्भर करता है। ऐसा लगता है कि दिखाया जा सकता है के रूप में θ = ( γ ' ) - 1 ( μ )x1,,xp
ηi=β0+β1xi1++βpxip
θiθ=(γ)1(μ), इस निर्भरता रैखिक भविष्यवक्ता को जोड़ने के द्वारा स्थापित है और θ मतलब के माध्यम से। विशेष रूप से, मतलब μ रैखिक भविष्यवक्ता के एक उलटी और चिकनी समारोह, यानी के रूप में देखा जाता है जी ( μ ) = η या μ = जी - 1 ( η ) अब आप अपने सवाल का जवाब देने:ηθμ
g(μ)=η or μ=g1(η)

g()μηθηθg=(γ)1

Xyixijyij=1,,pμ

इसलिए वे डिफ़ॉल्ट रूप से उपयोग किए जाते हैं। हालाँकि, ध्यान दें कि इस बात का कोई प्राथमिक कारण नहीं है कि इस या किसी अन्य लिंक द्वारा दिए गए पैमाने पर मॉडल में प्रभाव कैसे जोड़ा जाना चाहिए।


5
+1, यह एक बहुत अच्छा जवाब है, @ मोमो। मुझे कुछ समीकरण पढ़ने में कठिन लगे जब उन्हें पैराग्राफ में दफन किया गया था, इसलिए मैंने उन्हें डबल डॉलर-संकेत (अर्थात $ $) का उपयोग करके 'ब्लॉक' कर दिया । मुझे आशा है कि यह ठीक है (यदि नहीं, तो आप रोलबैक कर सकते हैं, w / my माफी)।
गंग -

1
@Momo यहाँ मूल प्रश्न करता है, हालाँकि, इसमें वेई के बारे में पूछा गया शामिल है, इसलिए यह इंगित करने योग्य है कि अभी तक स्पष्ट रूप से उत्तर नहीं दिया गया है।
Glen_b

1
θη=θg(μ)=θθ=(γ)1(μ)θθμg(.)=(γ)1(.)

1
γ(θ)=π=exp(θ)1+exp(θ)(γ)1(.)=logit(.)η=θg(.)θ=logit(π)=ηθηकेवल मौजूद है, अगर हम विहित लिंक फ़ंक्शन का उपयोग करते हैं।
Druss2k

2
μθηθ

16

गंग के एक अच्छे स्पष्टीकरण के हवाले से कहा गया है: विहित लिंक में न्यूनतम दक्षता के विशेष सैद्धांतिक गुण होते हैं। इसका मतलब है कि आप परिणामों की संख्या पर कंडीशनिंग द्वारा एक सशर्त लॉगिट मॉडल (जिसे अर्थशास्त्री एक निश्चित प्रभाव मॉडल कहते हैं) को परिभाषित कर सकते हैं, लेकिन आप सशर्त प्रोबेट मॉडल को परिभाषित नहीं कर सकते हैं, क्योंकि प्रोबेट लिंक के साथ उपयोग करने के लिए पर्याप्त आँकड़े नहीं हैं।


क्या आप न्यूनतम पर्याप्तता पर थोड़ा विस्तार कर सकते हैं? उपरोक्त स्पष्टीकरण से हम अभी भी एक प्रोबेट मॉडल को परिभाषित कर सकते हैं, है ना? यह सुनिश्चित करने के लिए विहित लिंक फ़ंक्शन नहीं होगा, लेकिन गैर-विहित लिंक फ़ंक्शन का उपयोग करने में क्या नुकसान है।
पिकाचुचमेलेऑन

9

यहां MIT के 18.650 वर्ग से प्रेरित एक छोटा सा चित्र है जो मुझे काफी उपयोगी लगता है क्योंकि यह इन कार्यों के बीच संबंधों को देखने में मदद करता है। मैंने @ मोमो के पोस्ट में उसी नोटेशन का उपयोग किया है:

यहाँ छवि विवरण दर्ज करें

  • γ(θ)
  • g(μ)

g

चित्र आसानी से एक दिशा से दूसरी दिशा में जाने की अनुमति देता है, उदाहरण के लिए:

η=g(γ(θ))
θ=γ1(g1(η))

विहित लिंक समारोह

g

γ-1जी-1=(जीγ')-1=मैं
θ=η

1

ऊपर दिए गए उत्तर पहले से ही कवर किए गए हैं जो मैं कहना चाहता हूं। मशीन सीखने के शोधकर्ता के रूप में कुछ बिंदुओं को स्पष्ट करने के लिए:

  1. लिंक फ़ंक्शन सक्रियण फ़ंक्शन के विपरीत और कुछ नहीं है। उदाहरण के लिए, लॉगिट सिग्मॉइड का व्युत्क्रम है, प्रोबिट गॉसियन के संचयी वितरण समारोह का विलोम है।

  2. wटीएक्सwएक्स

उपरोक्त चर्चा का घातीय परिवार से कोई लेना-देना नहीं है, लेकिन क्रिस्टोफर बिशप के PRML पुस्तक अध्याय 4.3.6 में एक अच्छी चर्चा पाई जा सकती है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.