आर में एनोवा () फ़ंक्शन का उपयोग करके दो मॉडल की तुलना करना


32

के लिए प्रलेखन से anova():

जब वस्तुओं का एक क्रम दिया जाता है, तो 'एनोवा' निर्दिष्ट क्रम में एक दूसरे के खिलाफ मॉडल का परीक्षण करता है ...

एक दूसरे के खिलाफ मॉडल का परीक्षण करने का क्या मतलब है? और आदेश क्यों मायने रखता है?

यहाँ GenABEL ट्यूटोरियल से एक उदाहरण है :

    >  modelAdd = lm(qt~as.numeric(snp1))
    >  modelDom = lm(qt~I(as.numeric(snp1)>=2))
    >  modelRec = lm(qt~I(as.numeric(snp1)>=3))
     anova(modelAdd, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ as.numeric(snp1)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)
    1   2372 2320                      
    2   2371 2320  1    0.0489     0.82
     anova(modelDom, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ I(as.numeric(snp1) >= 2)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)
    1   2372 2322                      
    2   2371 2320  1      1.77     0.18
     anova(modelRec, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ I(as.numeric(snp1) >= 3)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)  
    1   2372 2324                        
    2   2371 2320  1      3.53    0.057 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

मैं इस आउटपुट की व्याख्या कैसे करूं?

जवाबों:


31

जब आप उपयोग करते हैं anova(lm.1,lm.2,test="Chisq"), तो यह तुलना करने के लिए ची-स्क्वायर परीक्षण करता है lm.1और lm.2(यानी यह परीक्षण करता है कि वर्गों के अवशिष्ट योग में कमी सांख्यिकीय रूप से महत्वपूर्ण है या नहीं)। ध्यान दें कि यह केवल तभी समझ में आता है जब lm.1और lm.2नेस्टेड मॉडल हों।

α=0.05α=0.1

रैखिक मॉडल फिट्स के लिए एनोवा की जाँच करें ।


1
लेकिन क्या इस बारे में कुछ भी स्पष्ट नहीं है कि दोनों में से कौन बेहतर है? धन्यवाद!
QED

5
यह निर्भर करता है कि आप "बेहतर" शब्द को कैसे परिभाषित करते हैं। यदि आप इसे मॉडल के रूप में परिभाषित करते हैं जो वर्गों की कम अवशिष्ट राशि प्रदान करता है, तो इसका उत्तर हां है। ऐसा इसलिए है, क्योंकि यह परीक्षण वर्गों के अवशिष्ट योग में कमी की तुलना करता है।
स्टेट

3
दूसरी ओर, यदि दो मॉडल काफी भिन्न नहीं हैं, तो क्या कोई तर्क दे सकता है कि सरल मॉडल "बेहतर" है? मैं यहां समानता के बारे में सोच रहा हूं।
सिनिन्हो

1
क्या होगा अगर एनोवा (mod1, mod2, test = "LRT") इससे क्या फर्क पड़ता है?
एलेरीएल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.