आगे केजेटिल के उत्कृष्ट उत्तर के लिए, मैं सशर्त वितरण के अर्थ को स्पष्ट करने में मदद करने के लिए कुछ विशिष्ट उदाहरण जोड़ना चाहता था , जो कि एक मायावी अवधारणा का एक सा हो सकता है।
मान लीजिए कि आपने एक झील से 100 मछलियों का यादृच्छिक नमूना लिया और आप यह देखने में रुचि रखते हैं कि मछली की आयु कई परिणामी चर को कैसे प्रभावित करती है:
- मछली का वजन (वजन);
- मछली 30 सेमी से अधिक लंबी है या नहीं;
- मछली तराजू की संख्या।
पहला परिणाम चर निरंतर है, दूसरा द्विआधारी है (0 = मछली 30 सेमी से अधिक लंबा नहीं है; 1 = मछली 30 सेमी से अधिक लंबा है) और तीसरा एक गणना चर है।
सरल रैखिक प्रतिगमन
आयु वजन को कैसे प्रभावित करती है? आप फॉर्म का एक सरल रैखिक प्रतिगमन मॉडल तैयार करने जा रहे हैं:
Weight=β0+β1∗Age+ϵ
जहां के स्वतंत्र, समान रूप से वितरित किए गए, मतलब 0 और मानक विचलन साथ एक सामान्य वितरण के बाद । इस मॉडल में, झील में सभी मछलियों के लिए एक ही उम्र में साझा करने के लिए वजन चर का मतलब उम्र के साथ रैखिक रूप से भिन्न होना माना जाता है। सशर्त माध्य का प्रतिनिधित्व । इसे सशर्त कहा जाता है क्योंकि यह एक ही आयु के साथ झील में सभी मछलियों के लिए औसत वजन है । (बिना शर्त माध्य भार उनकी आयु की परवाह किए बिना झील की सभी मछलियों का औसत भार होगा।) ϵσβ0+β1∗Age
सरल बाइनरी लॉजिस्टिक रिग्रेशन
आयु 30 सेमी से अधिक है या नहीं, इससे आयु कैसे प्रभावित होती है? आप फॉर्म का एक सरल बाइनरी लॉजिस्टिक रिग्रेशन मॉडल तैयार करने जा रहे हैं:
log(p1−p)=β0+β1∗Age
जहां सशर्त संभावना को दर्शाता है कि किसी भी उम्र की मछली 30 सेमी से अधिक लंबी है। इस मॉडल में, चर का सशर्त मतलब "मछली 30 सेमी से अधिक है या नहीं", झील में सभी मछलियों के लिए समान आयु साझा करने के लिए माना जाता है कि उन्हें परिवर्तन परिवर्तन के बाद खिलाया जाता है। तर्क-परिवर्तित सशर्त माध्य का प्रतिनिधित्व । यह मॉडल काम करता है क्योंकि हम मानते हैं कि किसी दिए गए उम्र के लिए चर के मानों का वितरण "मछली 30 सेमी से अधिक है या नहीं" एक बर्नौली वितरण है। याद रखें कि इस वितरण के लिए, विचरण माध्य मान का एक कार्य है, इसलिए यदि हम इसके माध्य मान का अनुमान लगा सकते हैं, तो हम इसके विचरण का भी अनुमान लगा सकते हैं।pβ0+β1∗Agep और विचरण । https://www.theanalysisfactor.com/link-functions-and-errors-in-logistic-regression/ भी देखें ।p∗(1−p)
सिंपल पोइसन रिग्रेशन
आयु मछली की तराजू की संख्या को कैसे प्रभावित करती है? आप फॉर्म का एक साधारण पॉइसन प्रतिगमन मॉडल तैयार करने जा रहे हैं:
log(μ)=β0+β1∗Age
जहां किसी दिए गए उम्र की मछली के लिए परिणाम चर "मछली के तराजू की संख्या" के सशर्त औसत मूल्य को दर्शाता है (अर्थात, किसी दिए गए युग की झील में सभी मछली के लिए मछली की तराजू की अपेक्षित संख्या)। इस मॉडल में, परिणाम परिवर्तनशील के सशर्त माध्य को परिवर्तन के बाद उम्र परिवर्तन के साथ रेखीय रूप से भिन्न मान लिया जाता है। लॉग-परिवर्तित सशर्त माध्य का प्रतिनिधित्व । यह मॉडल काम करता है क्योंकि हम मानते हैं कि किसी दिए गए युग की झील में सभी मछलियों के लिए "मछली के तराजू की संख्या" के मान का वितरण एक पॉइसन वितरण है। याद रखें कि इस वितरण के लिए, माध्य और विचरण बराबर हैं, इसलिए यह अपने माध्य मान को बनाने के लिए पर्याप्त है।μβ0+β1∗Age
संक्षेप में, एक सशर्त वितरण मॉडल में शामिल पूर्वसूचक चर (ओं) के विशिष्ट मूल्यों के परिणाम मूल्यों के वितरण का प्रतिनिधित्व करता है । ऊपर दिए गए प्रत्येक प्रकार के प्रतिगमन मॉडल को दिए गए परिणाम चर की सशर्त वितरण पर कुछ वितरणात्मक धारणाएं लगाता है। इन वितरण संबंधी मान्यताओं के आधार पर, मॉडल यह बनाने के लिए आगे बढ़ता है कि कैसे (1) सशर्त वितरण का मतलब उम्र के एक समारोह (सरल रेखीय प्रतिगमन) के रूप में भिन्न होता है, (2) सशर्त वितरण के लॉग-परिवर्तित साधन एक फ़ंक्शन के रूप में भिन्न होता है। आयु (सरल बाइनरी लॉजिस्टिक रिग्रेशन) या (3) सशर्त वितरण का लॉग-ट्रांसफ़ॉर्म किया गया अर्थ उम्र के कार्य के रूप में भिन्न होता है।
प्रत्येक प्रकार के मॉडल के लिए, कोई मॉडल की जाँच के उद्देश्य से संबंधित अवशेषों को परिभाषित कर सकता है। विशेष रूप से, पियरसन और अवशिष्ट अवशिष्ट को लॉजिस्टिक और पॉइसन प्रतिगमन मॉडल के लिए परिभाषित किया जा सकता है।