Nonlinear बनाम सामान्यीकृत रैखिक मॉडल: आप लॉजिस्टिक, पॉइसन, आदि प्रतिगमन को कैसे देखते हैं?


23

मेरे पास शब्दार्थ के बारे में एक प्रश्न है कि मैं साथी सांख्यिकीविदों की राय पर क्या चाहूंगा।

हम जानते हैं कि लॉजिस्टिक, पॉइसन आदि मॉडल सामान्यीकृत रैखिक मॉडल की छतरी के नीचे आते हैं। मॉडल में मापदंडों के गैर-रेखीय कार्य शामिल हैं, जो उचित लिंक फ़ंक्शन का उपयोग करके रैखिक मॉडल फ्रेमवर्क का उपयोग करके मॉडलिंग की जा सकती है।

मैं सोच रहा था कि क्या आप (उपदेश) एक लॉजिस्टिक रिग्रेशन जैसी स्थितियों पर विचार करते हैं:

  1. नॉनलाइनियर मॉडल, जिसे मापदंडों का रूप दिया जाता है
  2. रैखिक मॉडल, चूंकि लिंक हमें रैखिक मॉडल ढांचे में बदल देता है
  3. इसके साथ ही (1) और (2): यह "नॉनलाइन मॉडल के रूप में" शुरू होता है, लेकिन इस तरह से काम किया जा सकता है, जो हमें इसे एक रेखीय मॉडल के रूप में सोचने की अनुमति देता है

काश मैं एक वास्तविक मतदान सेट कर सकता ...

जवाबों:


24

यह एक बड़ा सवाल है।

हम जानते हैं कि लॉजिस्टिक, पॉइसन आदि मॉडल सामान्यीकृत रैखिक मॉडल की छतरी के नीचे आते हैं।

खैर, हाँ और नहीं। प्रश्न के संदर्भ को देखते हुए, हमें यह बताने में काफी सावधानी बरतनी चाहिए कि हम किस बारे में बात कर रहे हैं - और "लॉजिस्टिक" और "पॉइसन" अकेले ही यह वर्णन करने के लिए अपर्याप्त हैं कि क्या इरादा है।

(i) "पॉइसन" एक वितरण है। एक सशर्त वितरण के विवरण के रूप में, यह रैखिक नहीं है (और इसलिए जीएलएम नहीं) जब तक आप सशर्त माध्य का वर्णन करने के लिए एक रैखिक (मापदंडों में) मॉडल निर्दिष्ट नहीं करते हैं (यानी यह केवल "पॉइसन" कहने के लिए पर्याप्त नहीं है)। जब लोगों को "प्वासों प्रतिगमन" निर्दिष्ट करते हैं, वे लगभग हमेशा एक मॉडल है कि करने का इरादा है मापदंडों में रेखीय, और इसलिए एक GLM है। लेकिन "पॉसों" अकेले किसी भी चीज़ की संख्या हो सकती है *।

(ii) दूसरी ओर "लॉजिस्टिक" एक माध्य के वर्णन को संदर्भित करता है (इसका मतलब है कि भविष्यवक्ताओं में लॉजिस्टिक है)। यह एक GLM नहीं है जब तक कि आप इसे सशर्त वितरण के साथ संयोजित नहीं करते हैं जो घातीय परिवार में है। जब लोग दूसरी ओर " लॉजिस्टिक रिग्रेशन " कहते हैं , तो उनका मतलब लगभग हमेशा बायोमिअल मॉडल से होता है, जो लॉगिट लिंक के साथ होता है - इसका मतलब है कि भविष्यवाणियों में लॉजिस्टिक है, मॉडल मापदंडों में रैखिक है और घातीय परिवार में है, इसलिए जीएलएम है।

मॉडल में मापदंडों के गैर-रेखीय कार्य शामिल हैं,

खैर, फिर, हाँ और नहीं।

रैखिक "सामान्यीकृत रेखीय मॉडल" में कहते हैं मापदंडों रैखिक मॉडल दर्ज करें। विशेष रूप से, इसका क्या मतलब है कि रैखिक भविष्यवक्ता के पैमाने पर , मॉडल form ।η=जी(μ)η=एक्सβ

जो उचित लिंक फ़ंक्शन का उपयोग करके रैखिक मॉडल फ्रेमवर्क का उपयोग करके मॉडलिंग की जा सकती है।

सही बात

मैं सोच रहा था कि क्या आप (उपदेश) एक लॉजिस्टिक रिग्रेशन जैसी स्थितियों पर विचार करते हैं:

(मैं यहाँ आपके प्रश्न का क्रम बदल रहा हूँ)

रैखिक मॉडल, चूंकि लिंक हमें रैखिक मॉडल ढांचे में बदल देता है

जीएलएम को "रैखिक" कहना पारंपरिक है, ठीक इसी कारण से। वास्तव में, यह स्पष्ट है कि यह सम्मेलन है, क्योंकि यह नाम में वहीं है

नॉनलाइनियर मॉडल, जिसे मापदंडों का रूप दिया जाता है

हमें यहां बहुत सावधान रहना चाहिए, क्योंकि "नॉनलाइनर" आमतौर पर एक मॉडल को संदर्भित करता है जो मापदंडों में नॉनलाइनियर होता है। सामान्यीकृत रैखिक मॉडल के साथ विपरीत नेलनियर प्रतिगमन।

इसलिए यदि आप GLM का वर्णन करने के लिए "nonlinear" शब्द का उपयोग करना चाहते हैं, तो यह ध्यान से बताना महत्वपूर्ण है कि आपका क्या मतलब है - आम तौर पर, यह मतलब गैर-रेखीय रूप से भविष्यवक्ताओं से संबंधित है।

वास्तव में, यदि आप GLMs को संदर्भित करने के लिए "nonlinear" का उपयोग करते हैं, तो आप न केवल सम्मेलन (और इसलिए गलत समझा जा सकता है) के साथ मुश्किल में पड़ेंगे, बल्कि सामान्यीकृत nonlinear मॉडल के बारे में बात करने की भी कोशिश करेंगे । अगर आप पहले से ही GLMs को "नॉनलाइनर मॉडल" के रूप में चित्रित करते हैं, तो अंतर को समझाना थोड़ा मुश्किल है!

* एक पॉइसन नॉनलाइनर रिग्रेशन मॉडल पर विचार करें , जहां कोई है जिसके लिए पैरामीटर रैखिक रूप से प्रवेश करते हैं, इसलिए हमारे पास अभी भी है:जी(μ)

Y~प्वासों(μएक्स)

लेकिन उदाहरण के लिए, जहां की आयु है, किसी दिए गए पर मृत्यु देखी गई है, और उम्र में जनसंख्या वार्षिक मृत्यु दर के लिए एक मॉडल है :एक्सYएक्सμएक्सएक्स

μएक्स=α+exp(βएक्स)

(आम तौर पर हम उम्र में आबादी के लिए यहां एक ऑफसेट होगा जो शब्द को स्थानांतरित कर देगा , लेकिन हम ऐसी स्थिति उत्पन्न कर सकते हैं जहां हम एक निरंतर प्रदर्शन का निरीक्षण करते हैं। ध्यान दें कि पोइसन और द्विपद दोनों मॉडल का उपयोग मॉडलिंग मृत्यु दर के लिए किया जाता है।)एक्सα

यहां पहला शब्द दुर्घटनाओं (या उम्र से अधिक प्रभाव नहीं) के कारण एक निरंतर मृत्यु दर का प्रतिनिधित्व करता है, जबकि दूसरे कार्यकाल में उम्र के कारण बढ़ती मृत्यु दर है। ऐसा मॉडल शायद कभी-कभी बाद की वयस्क-छोटी-छोटी सीमाओं पर संभव हो सकता है, लेकिन इस तरह का-सेन्सेंट-युग नहीं है; यह अनिवार्य रूप से मेकम का नियम है (एक खतरनाक कार्य के रूप में प्रस्तुत किया गया है, लेकिन जिसके लिए एक वार्षिक दर उचित अनुमान होगा)।

यह एक सामान्यीकृत नेलिनियर मॉडल है।


आपके सहयोग के लिए धन्यवाद। यह वही है जो मैं पाने की कोशिश कर रहा हूं। स्पष्ट रूप से "रैखिक" जीएलएम के नाम पर है। मैं उन मॉडलों को वर्गीकृत करने की कोशिश कर रहा हूं जो स्वाभाविक रूप से नॉनलाइनियर हैं (वे मापदंडों में नॉनलाइनियर हैं ), फिर भी "परिवर्तनशील रैखिक", और इस तरह जीएलएम ढांचे के तहत आते हैं। मुझे लगता है कि शायद मैंने सिर्फ अपने ही सवाल का जवाब दिया है - उन्हें संदर्भित करने का सबसे अच्छा तरीका है "परिवर्तनशील नॉनलाइनर।"
मेगा

1
एक मॉडल को संदर्भित करने के लिए और अधिक सामान्य तरीका जिसे एक परिवर्तन द्वारा मापदंडों में रैखिक प्रदान किया जा सकता है वह है "रैखिक" (इसके विपरीत "अस्थिर नॉनलाइन" के साथ)। मुझे लगता है कि मॉडल के बारे में चर्चा करते समय हमें स्पष्ट होना चाहिए कि यह क्या रेखीय है (बनाम क्या गैर-रेखीय है), और शायद यह भी स्पष्ट हो कि ऐसी चीजों को पारंपरिक रूप से कैसे संदर्भित किया जाता है, क्योंकि लोगों को जानकारी का पता लगाने और समझने में सक्षम होने की आवश्यकता है। जब उनसे चर्चा कर रहा था। कोई व्यक्ति जो GLM के बारे में "नॉनलाइनर" के रूप में बात करता है, उसे गलत समझा जाता है, जब तक कि वे सही क्वालिफायर नहीं जोड़ते हैं जो उनके अर्थ को स्पष्ट करते हैं।
Glen_b -Reinstate Monica

मैं सहमत हूँ। मैं इसे केवल ग्रंथों में गैर-प्रतिगमन प्रतिगमन के रूप में वर्गीकृत करता हूं और मेरे प्रोफेसरों द्वारा यह भी पढ़ाया जाता है कि यह nonlinear है। हम व्यक्तिगत रूप से इसे भ्रमित कर रहे हैं क्योंकि हम इसे GLM फ्रेमवर्क में डील करते हैं, फिर भी मैं इसे (कम से कम) को कॉल करने के साथ सहानुभूति दे सकता हूं। मुझे लगता है कि मैं रैखिक / परिवर्तनशील रैखिक के साथ जा रहा हूं और हम चर्चा करते हैं कि हम बिंदु ए से बिंदु बी तक कैसे पहुंचते हैं (यानी, हम एक अरेखीय फ़ंक्शन के साथ कैसे शुरू करते हैं और इसे रैखिक ढांचे में बदल देते हैं)।
मेग

हां, मैं पूरी तरह से समझता हूं। हालांकि मैं भी ऐसा करने के लिए उनके आवेग के साथ सहानुभूति रखता हूं, अगर मैं उनके कान होता तो मैं उन्हें नॉनलाइन मॉडल (कम से कम हमेशा बिना योग्यता के) कॉल करने की प्रथा के खिलाफ सावधान करता, जिन कारणों से मैं ऊपर उल्लिखित था। यही कारण है कि मुझे लगता है कि यह एक ऐसा महत्वपूर्ण सवाल है - लोग कभी-कभी उन्हें नॉनलाइनर भी कहते हैं, जो मुझे लगता है कि ठीक है जब तक हम स्पष्ट कर रहे हैं कि हम किसको नॉनलाइन कह रहे हैं, क्योंकि यह सबसे पारंपरिक तरीका नहीं है मॉडल का संदर्भ - जब हम सम्मेलन को धता बताते हैं, तो हमें इसे सावधानीपूर्वक और जानबूझकर करना चाहिए।
Glen_b -Reinstate मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.