नल और मॉडल डेवियन का उपयोग करके GLM मॉडल का परीक्षण करें


11

मैंने R में एक glm मॉडल बनाया है और एक परीक्षण और प्रशिक्षण समूह का उपयोग करके इसका परीक्षण किया है इसलिए मुझे विश्वास है कि यह अच्छी तरह से काम करता है। आर से परिणाम हैं:

Coefficients:
                            Estimate Std. Error  t value Pr(>|t|)    
(Intercept)               -2.781e+00  1.677e-02 -165.789  < 2e-16 ***
Coeff_A                    1.663e-05  5.438e-06    3.059  0.00222 ** 
log(Coeff_B)               8.925e-01  1.023e-02   87.245  < 2e-16 ***
log(Coeff_C)              -3.978e-01  7.695e-03  -51.689  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for quasibinomial family taken to be 0.9995149)

    Null deviance: 256600  on 671266  degrees of freedom
Residual deviance: 237230  on 671263  degrees of freedom
AIC: NA

गुणांक के सभी पी मान अपेक्षा के अनुसार छोटे हैं।

इस सवाल को देखते हुए ( GLM R में अवशिष्ट और अशक्त नाभिकीय व्याख्या ), मुझे यह गणना करने में सक्षम होना चाहिए कि अशक्त परिकल्पना निम्नलिखित समीकरण का उपयोग कर रही है:

p-value = 1 - pchisq(deviance, degrees of freedom)

इसमें चिपके रहते हैं:

1 - pchisq(256600, 671266)
[1] 1

तो क्या मैं यह सोचकर सही हूं कि अशक्त परिकल्पना को यहां खारिज नहीं किया जा सकता है, भले ही सभी गुणांक के पी मान इतने छोटे हैं या क्या मैंने गलत व्याख्या की है कि इसकी गणना कैसे करें?

जवाबों:


18

यहां गलतफहमी है। अंतर अशक्त विचलन और मॉडल के विचलन के बीच के रूप में एक ची-चुकता स्वतंत्रता की डिग्री के साथ अशक्त df के बराबर वितरित किया जाता है शून्य से मॉडल की df। आपके मॉडल के लिए, यह होगा:

1-pchisq(256600 - 237230, df=(671266 - 671263))
# [1] 0

pchisq()lower.tail = FALSE1


2
क्या परिकल्पना वास्तव में आप बयान के साथ परीक्षण कर रहे हैं 1-pchisq(256600 - 237230, df=(671266 - 671263))?
jII

5
@jesterII, आप देख रहे हैं कि यदि डिवोर्स संयोग से अधिक बदल गया है तो संयोग से उम्मीद की जा सकती है। यानी, यदि आप परीक्षण कर रहे हैं कि मॉडल पूरी तरह से अशक्त मॉडल से बेहतर है। यह एक रैखिक मॉडल में वैश्विक एफ परीक्षण के अनुरूप है।
गूँग - मोनिका

अशक्त परिकल्पना 'मॉडल एक संपूर्ण के रूप में अशक्त मॉडल से बेहतर है', और आपने अशक्त परिकल्पना को अस्वीकार कर दिया है, जिसका अर्थ है कि मॉडल खराब है?
jII

3
@jesterII, कोई अशक्त परिकल्पना नहीं है: 'एक पूरे के रूप में मॉडल अशक्त मॉडल से बेहतर नहीं है ।' चूंकि यह अस्वीकार कर दिया गया है, इसलिए हम निष्कर्ष निकालते हैं कि डेटा अशक्त मॉडल के अनुरूप नहीं हैं। NB, इसका मतलब यह नहीं है कि हमारा मॉडल 'अच्छा' या 'सही' है।
गूँज - मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.