अनोवा (और ड्रॉप 1) जीएलएमएम के लिए अलग-अलग उत्तर क्यों प्रदान करते हैं?


10

मेरे पास फॉर्म का GLMM है:

lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + 
                (1 | factor3), family=binomial)

जब मैं उपयोग करता हूं drop1(model, test="Chi"), तो मुझे Anova(model, type="III")कार के पैकेज से उपयोग करने की तुलना में अलग-अलग परिणाम मिलते हैं या summary(model)। ये उत्तरार्द्ध दो ही जवाब देते हैं।

गढ़े हुए डेटा के एक समूह का उपयोग करते हुए, मैंने पाया है कि ये दो विधियां सामान्य रूप से भिन्न नहीं होती हैं। वे संतुलित रैखिक मॉडल, असंतुलित रैखिक मॉडल (जहां विभिन्न समूहों में असमान n), और संतुलित सामान्यीकृत रैखिक मॉडल के लिए समान उत्तर देते हैं, लेकिन संतुलित सामान्यीकृत रैखिक मिश्रित मॉडल के लिए नहीं। तो यह प्रतीत होता है कि केवल उन मामलों में जहां यादृच्छिक कारकों को शामिल किया जाता है, यह कलह प्रकट करता है।

  • इन दोनों विधियों के बीच एक विसंगति क्यों है?
  • GLMM का उपयोग करते समय Anova()या drop1()उपयोग किया जाना चाहिए ?
  • इन दोनों के बीच का अंतर कम से कम है, कम से कम मेरे डेटा के लिए। क्या यह भी मायने रखता है कि किसका उपयोग किया जाता है?

जवाबों:


7

मुझे लगता है कि यह अंतर है कि किन परीक्षणों की गणना की जाती है। car::Anovaवाल्ड परीक्षणों का उपयोग करता है, जबकि drop1एकल शर्तों को छोड़ने वाले मॉडल को परिष्कृत करता है। जॉन फॉक्स ने एक बार मुझे लिखा था, कि वाल्ड परीक्षण और परिशोधित अनुपात परीक्षणों का उपयोग करके परिष्कृत मॉडल से परीक्षण (यानी, से रणनीति drop1) रैखिक के लिए सहमत हैं, लेकिन जरूरी नहीं कि गैर-रेखीय मॉडल। दुर्भाग्य से यह मेल ऑफिशल था और इसमें कोई संदर्भ नहीं था। लेकिन मुझे पता है कि उनकी पुस्तक में वाल्ड परीक्षणों पर एक अध्याय है, जिसमें वांछित जानकारी हो सकती है।

car::Anovaकहने की मदद :

टाइप- II परीक्षण की गणना सीमांतता के सिद्धांत के अनुसार की जाती है, शब्द के उच्च-क्रम वाले रिश्तेदारों की उपेक्षा करने के अलावा, अन्य सभी के बाद प्रत्येक शब्द का परीक्षण; तथाकथित प्रकार- III परीक्षण सीमांतता का उल्लंघन करते हैं, अन्य सभी के बाद मॉडल में प्रत्येक शब्द का परीक्षण करते हैं। टाइप- II परीक्षणों की यह परिभाषा एसएएस द्वारा विश्लेषण-के-विचरण मॉडल के लिए निर्मित परीक्षणों से मेल खाती है, जहां सभी भविष्यवक्ता कारक हैं, लेकिन आम तौर पर अधिक नहीं (यानी, जब मात्रात्मक भविष्यवक्ता होते हैं)। टाइप- III परीक्षण के लिए मॉडल तैयार करने में बहुत सावधानी बरतें, या परीक्षण की गई परिकल्पना का कोई मतलब नहीं होगा।

दुर्भाग्य से मैं आपको दूसरे या तीसरे प्रश्न का उत्तर नहीं दे सकता क्योंकि मैं भी यह जानना चाहता हूं।


अद्यतन टिप्पणी टिप्पणी :

सामान्यीकृत मिश्रित मॉडल के लिए कोई वाल्ड, एलआर और एफ परीक्षण नहीं हैं। Anovaबस मिश्रित मॉडल (यानी द्वारा लौटाए गए ऑब्जेक्ट्स ) के लिए अनुमति देता है "chisq"और "F"परीक्षण "mer"करता है lmer। उपयोग अनुभाग कहता है:

## S3 method for class 'mer'
Anova(mod, type=c("II","III", 2, 3), 
    test.statistic=c("chisq", "F"), vcov.=vcov(mod), singular.ok, ...)

लेकिन जैसा कि merवस्तुओं के लिए एफ-परीक्षणों द्वारा गणना की जाती है pbkrtest, जो मेरे ज्ञान के लिए केवल रैखिक मिश्रित मॉडल के लिए काम करता है, AnovaGLMMs के लिए हमेशा वापस आना चाहिए chisq(इसलिए आपको कोई अंतर नहीं दिखता)।

प्रश्न के बारे में अपडेट:

मेरे पिछले उत्तर ने आपके मुख्य प्रश्न का उत्तर देने की कोशिश की, Anova()और इसके बीच का अंतर drop1()। लेकिन अब मुझे समझ में आया है कि अगर आप निश्चित निश्चित प्रभाव महत्वपूर्ण हैं या नहीं, तो आप परीक्षण करना चाहते हैं। आर-sig मिश्रित मॉडलिंग पूछे जाने वाले प्रश्न इस बारे में निम्नलिखित का कहना है:

एकल मापदंडों के परीक्षण

सबसे खराब से सबसे अच्छा:

  • Wald Z- परीक्षण
  • संतुलित, नेस्टेड LMMs के लिए जहां df की गणना की जा सकती है: Wald t- परीक्षण
  • संभावना अनुपात परीक्षण, या तो मॉडल की स्थापना करके ताकि पैरामीटर को अलग किया जा सके / गिराया जा सके (एनोवा या ड्रॉप 1 के माध्यम से), या कंप्यूटिंग लाइबिलिटी प्रोफाइल के माध्यम से
  • MCMC या पैरामीट्रिक बूटस्ट्रैप विश्वास अंतराल

प्रभाव के परीक्षण (यानी परीक्षण है कि कई पैरामीटर एक साथ शून्य हैं)

सबसे खराब से सबसे अच्छा:

  • वाल्ड ची-स्क्वायर परीक्षण (जैसे कार :: एनोवा)
  • संभावना अनुपात परीक्षण (एनोवा या ड्रॉप 1 के माध्यम से)
  • संतुलित, नेस्टेड एलएमएम के लिए जहां डीएफ की गणना की जा सकती है: सशर्त एफ-परीक्षण
  • LMM के लिए: df सुधार के साथ सशर्त F- परीक्षण (उदाहरण के लिए pbkrtest पैकेज में Kenward-Roger)
  • MCMC या पैरामीट्रिक, या गैरपारंपरिक, बूटस्ट्रैप तुलना (गैरपारंपरिक बूटस्ट्रैपिंग को समूहीकरण कारकों के लिए ध्यान से लागू किया जाना चाहिए)

(महत्व दिया)

यह इंगित करता है कि car::Anova()GLMMs के लिए उपयोग करने के आपके दृष्टिकोण को आमतौर पर अनुशंसित नहीं किया जाता है, लेकिन MCMC या बूटस्ट्रैप का उपयोग करने वाले दृष्टिकोण का उपयोग किया जाना चाहिए। मुझे नहीं पता pvals.fncकि languageRपैकेज से GLMMs के साथ क्या होता है, लेकिन यह एक कोशिश के लायक है।


1
धन्यवाद, हेनरिक। अनोवा () तीन अलग-अलग परीक्षणों की गणना कर सकता है: वाल्ड, एलआर, और एफ। मैंने तीनों की कोशिश की है, लेकिन इससे कोई फर्क नहीं पड़ता, जो मुझे अजीब लगता है। मुझे लग रहा है कि यह फ़ंक्शन उन परीक्षणों का उपयोग करने से इंकार कर देगा जो यह निर्णय लेते हैं कि वे डेटा के लिए उपयुक्त नहीं हैं ...
tim.farkas
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.