लॉग-लिंक्ड गामा जीएलएम बनाम लॉग-लिंक्ड गॉसियन जीएलएम बनाम लॉग-ट्रांसफ़ॉर्मेड एलएम


13

मेरे परिणामों से, ऐसा प्रतीत होता है कि जीएलएम गामा सबसे अधिक मान्यताओं को पूरा करता है, लेकिन क्या यह लॉग-रूपांतरित एलएम पर एक सार्थक सुधार है? अधिकांश साहित्य मैंने पॉइसन या बिनोमियल जीएलएम के साथ सौदों को पाया है। मैंने लेख को सामान्य रूप से उपयोग किए जाने वाले जनरेटेड लाइन मॉडल मॉडल के मूल्यांकन का उपयोग किया , लेकिन इसमें निर्णय लेने के लिए उपयोग किए जाने वाले वास्तविक भूखंडों का अभाव है। उम्मीद है कि अनुभव वाला कोई व्यक्ति मुझे सही दिशा में इंगित कर सकता है।

मैं अपनी प्रतिक्रिया चर टी के वितरण को मॉडल करना चाहता हूं, जिसका वितरण नीचे प्लॉट किया गया है। जैसा कि आप देख सकते हैं, यह सकारात्मक तिरछा है
मान्य XHTML:।

मेरे पास विचार करने के लिए दो स्पष्ट कारक हैं: METH और CASEPART।
ध्यान दें कि यह अध्ययन मुख्य रूप से खोजपूर्ण है, अनिवार्य रूप से एक मॉडल के सिद्धांत और उसके आसपास DoE प्रदर्शन करने से पहले पायलट अध्ययन के रूप में कार्य करता है।

मेरे पास R में निम्नलिखित मॉडल हैं, उनके नैदानिक ​​भूखंडों के साथ:

LM.LOG<-lm(log10(T)~factor(METH)+factor(CASEPART),data=tdat)

मान्य XHTML
मान्य XHTML

GLM.GAMMA<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="Gamma"(link='log'))

मान्य XHTML
मान्य XHTML

GLM.GAUS<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="gaussian"(link='log'))

मान्य XHTML
मान्य XHTML

मुझे अवशेषों पर शापिरो-विल्क्स परीक्षण के माध्यम से निम्नलिखित पी-मूल्य भी प्राप्त हुए:

LM.LOG: 2.347e-11  
GLM.GAMMA: 0.6288  
GLM.GAUS:  0.6288  

मैंने एआईसी और बीआईसी मूल्यों की गणना की, लेकिन अगर मैं सही हूं, तो वे मुझे जीएलएम / एलएम में विभिन्न परिवारों के कारण ज्यादा नहीं बताते हैं।

इसके अलावा, मैंने चरम मूल्यों को नोट किया, लेकिन मैं उन्हें बाहरी लोगों के रूप में वर्गीकृत नहीं कर सकता क्योंकि कोई स्पष्ट "विशेष कारण" नहीं है।



1
यह ध्यान देने योग्य है कि सभी तीन मॉडल इस अर्थ में गुणात्मक हैं कि एक प्रतिगमन में वृद्धि ठेठ प्रतिक्रिया में एक रिश्तेदार परिवर्तन के साथ जुड़ी हुई है। दो लॉग-रेखीय GLMs के लिए, "विशिष्ट" का अर्थ अंकगणित माध्य है, जबकि लॉग-रूपांतरित LM के लिए हम ज्यामितीय साधनों के बारे में बात कर रहे हैं। इस प्रकार, जिस तरह से आप प्रभावों और भविष्यवाणियों की व्याख्या करना चाहते हैं, वह मॉडल विकल्प के लिए एक ड्राइविंग कारक भी है, न केवल सही अवशिष्ट भूखंड (ये वैसे भी डेटा संचालित हैं)।
माइकल एम

@MichaelMayer - प्रतिक्रिया के लिए धन्यवाद, बहुत उपयोगी। क्या आप इस बात पर थोड़ा विस्तार कर सकते हैं कि पसंद व्याख्या को कैसे प्रभावित करती है? या मुझे एक संदर्भ की दिशा में इंगित करें?
TLJ

@ Marcinthebox- मैंने पोस्ट करने से पहले उस प्रश्न को देखा। मेरे सवाल का बिलकुल जवाब नहीं देता।
टीएलजे

जवाबों:


19

ठीक है, काफी स्पष्ट रूप से गाऊसी के लिए लॉग-रैखिक फिट अनुपयुक्त है; अवशिष्टों में मजबूत हेटेरोसेडासिटी है। तो आइए उस पर विचार करें।

जो कुछ बचा है वह लॉगानॉर्मल बनाम गामा है।

ध्यान दें कि का हिस्टोग्राम कोई प्रत्यक्ष उपयोग नहीं है, क्योंकि सीमांत वितरण चर का मिश्रण होगा (प्रत्येक भविष्यवक्ताओं के लिए मूल्यों के एक अलग सेट पर वातानुकूलित); यहां तक ​​कि अगर दो में से एक मॉडल सही था, तो वह प्लॉट सशर्त वितरण जैसा कुछ नहीं लग सकता है।T

या तो मॉडल इस मामले में समान रूप से उपयुक्त प्रतीत होता है। वे दोनों माध्य के वर्ग के लिए आनुपातिक हैं, इसलिए फिट के खिलाफ अवशिष्ट में फैलने का पैटर्न समान है।

एक कम बाहरी एक गामा के साथ थोड़ा बेहतर होगा (एक उच्च रूपरेखा के लिए इसके विपरीत)। किसी दिए गए माध्य और विचरण पर, लॉगनॉर्मल अधिक तिरछा होता है और इसमें भिन्नता का उच्च गुणांक होता है।

याद रखने वाली एक बात यह है कि लॉगऑनॉर्मल की उम्मीद ; यदि आप इस अर्थ में रुचि रखते हैं कि आप बस लॉग स्केल फिट को स्पष्ट नहीं कर सकते हैं। वास्तव में, यदि आप माध्य में रुचि रखते हैं, तो गामा लॉगऑनॉर्मल के साथ कई मुद्दों से बचता है (जैसे कि एक बार जब आप लॉगऑनॉर्मल में में पैरामीटर अनिश्चितता को शामिल करते हैं, तो आप लॉग-टी वितरण के आधार पर भविष्यवाणी करते हैं, जो नहीं करता है ' t का एक मतलब है। पूर्वानुमान अंतराल अभी भी ठीक काम करते हैं, लेकिन यह मतलब की भविष्यवाणी के लिए एक समस्या हो सकती है।exp(μ)σ2

कुछ संबंधित चर्चाओं के लिए यहां और यहां भी देखें ।


1
@Gleb_b यह जवाब मेरे विश्लेषण के लिए बहुत उपयोगी है। मेरे कुछ प्रश्न हैं। (१) पहला, क्या यह 'वे दोनों माध्य के वर्ग के लिए आनुपातिक है ...' अवशिष्ट बनाम सज्जित कथानक पर आधारित है? (२) और क्या यह 'एक निम्नतर गामा के साथ थोड़ा बेहतर होगा ... एक दिए गए माध्य और विचरण पर, ...' qq कथानक पर आधारित है? (३) जिसे मैं glm समझता हूँ (जैसे गामा, पॉइसन और ऋणात्मक द्विपद) में अवशिष्ट की सामान्यता और विचरण की समरूपता की धारणा नहीं है। यदि हां, तो डायग्नॉस्टिक्स के लिए प्रासंगिक बनाम सामान्य क्यूक प्लॉटिंग प्लॉटिंग प्रासंगिक क्यों होगा?
ततमी

2
यह व्यापक रूप से एक नया प्रश्न है, या वास्तव में कई (जिनमें से अधिकांश पहले से ही हमारी साइट पर उत्तर दिए गए हैं!) - 1. मॉडल का हिस्सा है। 2. नहीं, ये वितरण के बारे में सामान्य तथ्य हैं। 3. सही है कि वे सामान्य नहीं हैं, हालांकि क्यूक्यू प्लॉट में इस्तेमाल होने वाले अवशेष (आंतरिक रूप से छात्रकृत) विचलन अवशेष हैं जो - विशेष रूप से गामा मामले में - आम तौर पर सामान्य रूप से वितरित होने के बहुत करीब होंगे (मैंने एक जवाब लिखा है कि वह क्यों समझा कुछ बिंदु) और अनिवार्य रूप से निरंतर विचरण होना चाहिए। सामान्यता से कुछ विचलन अप्रत्याशित नहीं है लेकिन पर्याप्त विचलन है ... ctd
Glen_b -Reinstate Monica

2
ctd ... सामान्यता से (अन्य भूखंडों को ठीक मानने से) वितरणात्मक धारणा के साथ किसी समस्या का संकेत हो सकता है।
Glen_b -Reinstate मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.