जीएलएम का परिवार प्रतिक्रिया चर या अवशिष्ट के वितरण का प्रतिनिधित्व करता है?


13

मैं इस बारे में कई प्रयोगशाला सदस्यों के साथ चर्चा कर रहा हूं, और हम कई स्रोतों से गए हैं, लेकिन अभी भी इसका जवाब नहीं है:

जब हम कहते हैं कि एक जीएलएम के पास पोइसोन का एक परिवार है तो मान लें कि हम अवशिष्टों के वितरण या प्रतिक्रिया चर के बारे में बात कर रहे हैं?

विवाद के बिंदु

  1. इस लेख को पढ़ते हुए यह कहा गया है कि GLM की धारणाएँ टिप्पणियों की सांख्यिकीय स्वतंत्रता हैं, लिंक और विचरण समारोह के सही विनिर्देश (जो मुझे अवशिष्ट के बारे में सोचते हैं, प्रतिक्रिया चर नहीं), प्रतिक्रिया चर के लिए माप का सही पैमाना और एकल बिंदुओं के अनुचित प्रभाव का अभाव

  2. इस प्रश्न के दो उत्तर हैं जिनमें से प्रत्येक में दो बिंदु हैं, पहला जो अवशिष्ट के बारे में बात करता है, और दूसरा उत्तर चर के बारे में है, जो यह है?

  3. इस ब्लॉगपोस्ट में , जब मान्यताओं के बारे में बात की जाती है, तो वे कहते हैं " अवशेषों का वितरण अन्य हो सकता है, जैसे, द्विपद "

  4. इस अध्याय की शुरुआत में वे कहते हैं कि त्रुटियों की संरचना को पॉइसन होना है, लेकिन अवशिष्टों में निश्चित रूप से सकारात्मक और नकारात्मक मूल्य होंगे, यह कैसे पॉइसन हो सकता है?

  5. यह सवाल, जिसे अक्सर इस तरह के सवालों के रूप में उद्धृत किया जाता है ताकि उन्हें डुप्लिकेट किया जा सके, एक स्वीकृत उत्तर नहीं होता है

  6. यह सवाल जवाब के बारे में बात करता है और अवशिष्ट के बारे में नहीं

  7. में इस Pensilvania विश्वविद्यालय से पाठ्यक्रम विवरण वे मान्यताओं, नहीं बच में प्रतिक्रिया चर के बारे में बात

जवाबों:


18

परिवार GLM मॉडल के लिए तर्क के लिए वितरण परिवार को निर्धारित करता है प्रतिक्रिया की सशर्त वितरण , बच के नहीं (के अलावा अर्ध -models)।

इस तरह देखें: सामान्य रैखिक प्रतिगमन के लिए, हम मॉडल को रूप में लिख सकते हैं इसका मतलब है कि प्रतिक्रिया का सामान्य वितरण (निरंतर विचरण के साथ) है, लेकिन प्रत्येक लिए उम्मीद अलग है । इसलिए प्रतिक्रिया की सशर्त वितरण एक सामान्य वितरण है (लेकिन प्रत्येक लिए एक अलग )। इस मॉडल को लिखने का एक अन्य तरीका जहां प्रत्येक को वितरित किया जाता है ।

YiNormal(β0+xiTβ,σ2).
Yiii
Yi=β0+xiTβ+ϵi
ϵiNormal(0,σ2)

तो सामान्य वितरण परिवार के लिए दोनों विवरण सही हैं (जब सही ढंग से व्याख्या की गई है)। ऐसा इसलिए है क्योंकि सामान्य रैखिक मॉडल के लिए हमारे पास व्यवस्थित भाग ( ) के मॉडल और अशांति वाले भाग ( ) में एक साफ जुदाई होती है, जो बस जोड़ दी जाती है। लेकिन अन्य पारिवारिक कार्यों के लिए, यह अलगाव संभव नहीं है ! अवशिष्ट का क्या मतलब है (और इस कारण से, "अवशिष्ट" की कई अलग-अलग परिभाषाएं) की एक साफ परिभाषा भी नहीं है ।β0+xiTβϵi

इसलिए उन सभी अन्य परिवारों के लिए, हम ऊपर प्रदर्शित पहले समीकरण की शैली में एक परिभाषा का उपयोग करते हैं। अर्थात्, प्रतिक्रिया का सशर्त वितरण। तो, नहीं, पोइसन प्रतिगमन में अवशिष्ट (जो भी परिभाषित किया गया है) में पॉइसन वितरण नहीं है।


13

आगे केजेटिल के उत्कृष्ट उत्तर के लिए, मैं सशर्त वितरण के अर्थ को स्पष्ट करने में मदद करने के लिए कुछ विशिष्ट उदाहरण जोड़ना चाहता था , जो कि एक मायावी अवधारणा का एक सा हो सकता है।

मान लीजिए कि आपने एक झील से 100 मछलियों का यादृच्छिक नमूना लिया और आप यह देखने में रुचि रखते हैं कि मछली की आयु कई परिणामी चर को कैसे प्रभावित करती है:

  1. मछली का वजन (वजन);
  2. मछली 30 सेमी से अधिक लंबी है या नहीं;
  3. मछली तराजू की संख्या।

पहला परिणाम चर निरंतर है, दूसरा द्विआधारी है (0 = मछली 30 सेमी से अधिक लंबा नहीं है; 1 = मछली 30 सेमी से अधिक लंबा है) और तीसरा एक गणना चर है।

सरल रैखिक प्रतिगमन

आयु वजन को कैसे प्रभावित करती है? आप फॉर्म का एक सरल रैखिक प्रतिगमन मॉडल तैयार करने जा रहे हैं:

Weight=β0+β1Age+ϵ

जहां के स्वतंत्र, समान रूप से वितरित किए गए, मतलब 0 और मानक विचलन साथ एक सामान्य वितरण के बाद । इस मॉडल में, झील में सभी मछलियों के लिए एक ही उम्र में साझा करने के लिए वजन चर का मतलब उम्र के साथ रैखिक रूप से भिन्न होना माना जाता है। सशर्त माध्य का प्रतिनिधित्व । इसे सशर्त कहा जाता है क्योंकि यह एक ही आयु के साथ झील में सभी मछलियों के लिए औसत वजन है । (बिना शर्त माध्य भार उनकी आयु की परवाह किए बिना झील की सभी मछलियों का औसत भार होगा।) ϵσβ0+β1Age

सरल बाइनरी लॉजिस्टिक रिग्रेशन

आयु 30 सेमी से अधिक है या नहीं, इससे आयु कैसे प्रभावित होती है? आप फॉर्म का एक सरल बाइनरी लॉजिस्टिक रिग्रेशन मॉडल तैयार करने जा रहे हैं:

log(p1p)=β0+β1Age

जहां सशर्त संभावना को दर्शाता है कि किसी भी उम्र की मछली 30 सेमी से अधिक लंबी है। इस मॉडल में, चर का सशर्त मतलब "मछली 30 सेमी से अधिक है या नहीं", झील में सभी मछलियों के लिए समान आयु साझा करने के लिए माना जाता है कि उन्हें परिवर्तन परिवर्तन के बाद खिलाया जाता है। तर्क-परिवर्तित सशर्त माध्य का प्रतिनिधित्व । यह मॉडल काम करता है क्योंकि हम मानते हैं कि किसी दिए गए उम्र के लिए चर के मानों का वितरण "मछली 30 सेमी से अधिक है या नहीं" एक बर्नौली वितरण है। याद रखें कि इस वितरण के लिए, विचरण माध्य मान का एक कार्य है, इसलिए यदि हम इसके माध्य मान का अनुमान लगा सकते हैं, तो हम इसके विचरण का भी अनुमान लगा सकते हैं।pβ0+β1Agep और विचरण । https://www.theanalysisfactor.com/link-functions-and-errors-in-logistic-regression/ भी देखेंp(1p)

सिंपल पोइसन रिग्रेशन

आयु मछली की तराजू की संख्या को कैसे प्रभावित करती है? आप फॉर्म का एक साधारण पॉइसन प्रतिगमन मॉडल तैयार करने जा रहे हैं:

log(μ)=β0+β1Age

जहां किसी दिए गए उम्र की मछली के लिए परिणाम चर "मछली के तराजू की संख्या" के सशर्त औसत मूल्य को दर्शाता है (अर्थात, किसी दिए गए युग की झील में सभी मछली के लिए मछली की तराजू की अपेक्षित संख्या)। इस मॉडल में, परिणाम परिवर्तनशील के सशर्त माध्य को परिवर्तन के बाद उम्र परिवर्तन के साथ रेखीय रूप से भिन्न मान लिया जाता है। लॉग-परिवर्तित सशर्त माध्य का प्रतिनिधित्व । यह मॉडल काम करता है क्योंकि हम मानते हैं कि किसी दिए गए युग की झील में सभी मछलियों के लिए "मछली के तराजू की संख्या" के मान का वितरण एक पॉइसन वितरण है। याद रखें कि इस वितरण के लिए, माध्य और विचरण बराबर हैं, इसलिए यह अपने माध्य मान को बनाने के लिए पर्याप्त है।μβ0+β1Age

संक्षेप में, एक सशर्त वितरण मॉडल में शामिल पूर्वसूचक चर (ओं) के विशिष्ट मूल्यों के परिणाम मूल्यों के वितरण का प्रतिनिधित्व करता है । ऊपर दिए गए प्रत्येक प्रकार के प्रतिगमन मॉडल को दिए गए परिणाम चर की सशर्त वितरण पर कुछ वितरणात्मक धारणाएं लगाता है। इन वितरण संबंधी मान्यताओं के आधार पर, मॉडल यह बनाने के लिए आगे बढ़ता है कि कैसे (1) सशर्त वितरण का मतलब उम्र के एक समारोह (सरल रेखीय प्रतिगमन) के रूप में भिन्न होता है, (2) सशर्त वितरण के लॉग-परिवर्तित साधन एक फ़ंक्शन के रूप में भिन्न होता है। आयु (सरल बाइनरी लॉजिस्टिक रिग्रेशन) या (3) सशर्त वितरण का लॉग-ट्रांसफ़ॉर्म किया गया अर्थ उम्र के कार्य के रूप में भिन्न होता है।

प्रत्येक प्रकार के मॉडल के लिए, कोई मॉडल की जाँच के उद्देश्य से संबंधित अवशेषों को परिभाषित कर सकता है। विशेष रूप से, पियरसन और अवशिष्ट अवशिष्ट को लॉजिस्टिक और पॉइसन प्रतिगमन मॉडल के लिए परिभाषित किया जा सकता है।


2
अत्यधिक उत्तर। आप दोनों को धन्यवाद। मुझे कभी यह महसूस नहीं हुआ कि "वास्तविक" अवशिष्ट सामान्य जीएलएम ढांचे में कभी भी स्पष्ट नहीं होता है जैसे कि सामान्य वितरण मामले में होता है।
मैटलॉफ्टन

1
@mlofton: अपनी तरह के शब्दों के लिए धन्यवाद। एक उत्कृष्ट प्रश्न ने उत्कृष्ट उत्तर आमंत्रित किए। ज्ञान के इस आदान-प्रदान से हम सभी लाभान्वित होते हैं।
इसाबेला गमेन्ट

4
मैंने जीएलएम का लंबे समय (एक या दो साल के लिए 10 साल पहले) का उपयोग किया और वह हमेशा मेरा भ्रम था, लेकिन मुझे कभी नहीं पता था कि यह मेरा भ्रम था जब तक कि यह स्पष्ट रूप से नहीं पूछा गया और इतनी स्पष्ट रूप से समझाया गया। तो कभी-कभी भ्रम का मतलब सही सवाल पूछने में सक्षम नहीं होना भी है। एक बार फिर धन्यवाद।
mlofton

1
तुम पूरी तरह ठीक हो! भ्रम सीखने का हिस्सा है - जब हम कुछ समय के लिए संघर्ष करते हैं, तो हम इसे बेहतर ढंग से समझने के लिए तैयार होते हैं जब हम अचानक स्पष्ट स्पष्टीकरण पर ठोकर खाते हैं।
इसाबेला घीमे

1
मेरी खुशी और आपके उत्कृष्ट उत्तर @IsabellaGhement के लिए धन्यवाद
पैट्रिक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.