मिश्रित प्रभाव मॉडल बनाम सामान्यीकृत आकलन समीकरणों का उपयोग कब करें?


63

मैं अनुदैर्ध्य डेटा के साथ थोड़ी देर के लिए मिश्रित प्रभाव वाले मॉडल का उपयोग करके बहुत खुशी से रहा हूं। काश, मैं AR संबंधों को lmer में फिट कर सकता (मुझे लगता है कि मैं सही हूं कि मैं ऐसा नहीं कर सकता?) लेकिन मुझे नहीं लगता कि यह काफी महत्वपूर्ण है इसलिए मुझे बहुत चिंता नहीं है।

मैं अभी सामान्यीकृत आकलन समीकरणों (GEE) पर आया हूं, और वे ME मॉडल की तुलना में अधिक लचीलेपन की पेशकश करते हैं।

अति-सामान्य प्रश्न पूछने के जोखिम पर, क्या कोई सलाह है जो विभिन्न कार्यों के लिए बेहतर है? मैंने कुछ कागजों की तुलना करते हुए देखा है, और वे इस प्रकार हैं:

"इस विशेष क्षेत्र में, एक्स के लिए जीईई का उपयोग न करें, वाई के लिए एमई मॉडल का उपयोग न करें"।

मुझे कोई और सामान्य सलाह नहीं मिली है। क्या कोई मुझे बता सकता है?

धन्यवाद!


1
"वे बहुत अधिक लचीलेपन की पेशकश करते हैं" ... ठीक है, वे भी अपने दृष्टिकोण में भिन्न होते हैं क्योंकि जीईएम का उपयोग एक सीमांत वितरण के लिए किया जाता है, जीएलएमएम का उपयोग करते समय अक्सर सशर्त दृष्टिकोण के विपरीत होता है।
chl


ध्यान दें कि glmmPQLएआर सहसंबंध संरचनाओं को भी फिट कर सकते हैं
टॉम वेन्सलेर्स

एआर रिश्ता क्या है?
उदाहरण

@incodeveritas ऑटोरिग्रेडिव कोवरियन स्ट्रक्चर
टॉमीक्सि

जवाबों:


56

जीईई का उपयोग करें जब आप एक कोवरिएट बनाम व्यक्तिगत विशिष्ट प्रभाव की जनसंख्या औसत प्रभाव को उजागर करने में रुचि रखते हैं। ये दो चीजें केवल लीनियर मॉडल में समतुल्य हैं, लेकिन नॉन-लीनियर (जैसे लॉजिस्टिक) में नहीं। यह देखने के लिए, उदाहरण के लिए, 'वें विषय के' अवलोकन के यादृच्छिक प्रभाव लॉजिस्टिक मॉडल , ;jiYij

log(pij1pij)=μ+ηi

जहाँ विषय और लिए एक यादृच्छिक प्रभाव है ।ηiN(0,σ2)ipij=P(Yij=1|ηi)

आप इन आंकड़ों पर एक यादृच्छिक प्रभाव मॉडल का इस्तेमाल किया है, तो आप का एक अनुमान प्राप्त होगा कि तथ्य यह है कि एक मतलब शून्य सामान्य रूप से वितरित गड़बड़ी प्रत्येक व्यक्ति के लिए लागू किया गया था, यह अलग-अलग विशिष्ट बनाने के लिए खातों।μ

यदि आपने इन डेटा पर GEE का उपयोग किया है, तो आप जनसंख्या औसत लॉग ऑड्स का अनुमान लगा सकते हैं। इस मामले में जो होगा

ν=log(Eη(11+eμηi)1Eη(11+eμηi))

νμ , सामान्य रूप से। उदाहरण के लिए, अगर और , तो । यद्यपि यादृच्छिक प्रभावों का रूपांतरण रूपांतरित (या लिंक किए गए ) पैमाने पर शून्य होता है, लेकिन डेटा के मूल पैमाने पर उनका प्रभाव शून्य नहीं होता है। एक मिश्रित प्रभाव लॉजिस्टिक रिग्रेशन मॉडल के कुछ डेटा का अनुकरण करने की कोशिश करें और इंटरसेप्ट के व्युत्क्रम-लॉगिट के साथ जनसंख्या स्तर औसत की तुलना करें और आप देखेंगे कि वे इस उदाहरण के समान नहीं हैं। गुणांक की व्याख्या में यह अंतर GEE और यादृच्छिक प्रभाव मॉडल के बीच मूलभूत अंतर हैμ=1σ2=1ν.83

संपादित करें: सामान्य तौर पर, कोई भविष्यवाणियों के साथ मिश्रित प्रभाव मॉडल के रूप में नहीं लिखा जा सकता है

ψ(E(Yij|ηi))=μ+ηi

जहां एक लिंक फ़ंक्शन है। जब कभीψ

ψ(Eη(ψ1(E(Yij|ηi))))Eη(E(Yij|ηi))

जनसंख्या औसत गुणांक (GEE) और व्यक्तिगत विशिष्ट गुणांक (यादृच्छिक प्रभाव मॉडल) के बीच अंतर होगा। यही है, डेटा को परिवर्तित करके औसत परिवर्तन, परिवर्तित पैमाने पर यादृच्छिक प्रभावों को एकीकृत करना, और फिर वापस बदलना। ध्यान दें कि रेखीय मॉडल में, (जो कि, ) है, समानता पकड़ती है, इसलिए वे समतुल्य हैं।ψ(x)=x

संपादन 2: यह भी ध्यान देने योग्य है कि जीईई मॉडल द्वारा निर्मित "मजबूत" सैंडविच-प्रकार की मानक त्रुटियां वैध स्पर्शोन्मुख आत्मविश्वास अंतराल प्रदान करती हैं (जैसे वे वास्तव में 95% समय को कवर करती हैं) भले ही मॉडल में निर्दिष्ट सहसंबंध संरचना नहीं है। सही बात।

संपादित करें 3: यदि आपकी रुचि डेटा में एसोसिएशन संरचना को समझने में है, तो संघों का GEE अनुमान बेहद अयोग्य है (और कभी-कभी असंगत)। मैंने इसके लिए एक संदर्भ देखा है लेकिन अभी इसे जगह नहीं दे सकता।


3
(+1) आपके दूसरे संपादन के बारे में, मैं यह जोड़ूंगा कि मॉडल-आधारित विचरण अनुमानक बहुत कम संख्या में क्लस्टर के साथ बेहतर काम करेंगे (या हम एक जैकनाइफ़ अनुमानक का उपयोग कर सकते हैं)। एक संदर्भ के लिए, मैं हमेशा gbi.agrsci.dk/statistics/courses/phd07/material/Day10 की ओर संकेत करता हूं , जिसमें बहुत अच्छे लेक्चर नोट्स (स्टेट बैकग्राउंड हैं, जिसमें GEE की तुलना में शामिल है - GLMM दृष्टिकोण + चित्र में R)। ।
chl

वाह, क्या शानदार जवाब है। बहुत बहुत धन्यवाद। यह पूरी तरह से मैं क्या देख रहा था। और लिंक के लिए chl को भी धन्यवाद। +10 आप दोनों को नजरबंद कर दें।
क्रिस बीले

क्या GEE की भी उच्च स्तरीय प्रभाव उपद्रव मानदंड नहीं हैं? यह मुझे लगता है कि एक और महत्वपूर्ण अंतर है - यदि कोई उन प्रभावों में रुचि रखता है, तो जीईई आपको नहीं देगा। वैकल्पिक रूप से, यदि आप उन वितरण संबंधी धारणाओं को बनाने में सहज नहीं हैं, तो शायद GEE बेहतर होगा।
रोबिन.डाटड्राइवर्स

जो लिंक @chl प्रदान किया गया है वह मृत है: / (छह साल बाद अपेक्षित है, ठीक है?)
गिलहर्मे मार्थ

@GuilhermeMarthe अच्छा पकड़! दुर्भाग्य से, मैं उसी सामग्री को दूसरे धागे में जोड़ता हूं । मुझे दो विकल्प दिखाई देते हैं: जीपैक आर पैकेज (उसी दो लेखकों द्वारा विकसित) का संदर्भ लें या फिलहाल वेबैक मशीन का उपयोग करें ।
CHL

10

मेरे दिमाग में जीईई सबसे उपयोगी है जब हम बायेसियन मॉडलिंग का उपयोग नहीं कर रहे हैं और जब पूर्ण संभावना समाधान उपलब्ध नहीं है। इसके अलावा, जीईई को पर्याप्त रूप से सटीक होने के लिए बड़े नमूना आकारों की आवश्यकता हो सकती है, और यह गैर-बेतरतीब ढंग से लापता अनुदैर्ध्य डेटा के लिए बहुत गैर-मजबूत है। जीईई पूरी तरह से यादृच्छिक पर गायब हो जाता है, जबकि संभावना के तरीके (मिश्रित प्रभाव मॉडल या सामान्यीकृत कम से कम वर्ग, उदाहरण के लिए) केवल यादृच्छिक पर लापता मानते हैं।


1

आप फिट्ज़मौरिस, लैयर्ड और वेयर, एप्लाइड लॉन्गिट्यूडिनल एनालिसिस , जॉन विले एंड संस, 2011, द्वितीय संस्करण, अध्याय 11-16 में गहन चर्चा और ठोस उदाहरण पा सकते हैं ।

उदाहरण के रूप में, आप डेटासेट और एसएएस / स्टाटा / आर कार्यक्रमों को साथी वेबसाइट में पा सकते हैं ।


2
क्या आप इस पुस्तक के मुख्य बिंदुओं को संक्षेप में बता सकते हैं?
chl

2
मैं कहता हूँ कि मैक्रों ने पहले ही इसे कर लिया है ;-) पुस्तक में आप अधिक लंबी और अधिक विस्तृत चर्चा, कुछ विश्लेषणात्मक, संख्यात्मक और चित्रमय उदाहरण और कुछ और बिंदुओं का पता लगा सकते हैं, उनमें से फ्रैंक हरेल ने जो कुछ कहा है। आप गेलमैन के ब्लॉग को भी देख सकते हैं ।
सर्जियो
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.