क्या यह निर्धारित करने के लिए एक परीक्षण है कि क्या जीएलएम अतिप्रवाह महत्वपूर्ण है?


44

मैं आर। में पॉइसन GLMs बना रहा हूँ। अतिप्रवाह के लिए जाँच करने के लिए मैं अवशिष्ट अवशिष्टता के अनुपात को स्वतंत्रता द्वारा प्रदान की गई डिग्री के रूप में देख रहा हूँ summary(model.name)

क्या इस अनुपात के लिए कोई कटऑफ मान या परीक्षण "महत्वपूर्ण" माना जाता है? मुझे पता है कि अगर यह> 1 है, तो डेटा ओवरडाइस्ड है, लेकिन अगर मेरे पास अनुपात 1 के करीब है [उदाहरण के लिए, 1.7 का एक अनुपात (अवशिष्ट विचलन = 25.48, डीएफ = 15) और 1.3 का दूसरा (आरडी - 324), डीएफ = 253)], क्या मुझे अभी भी क्वासिपोइसन / नकारात्मक द्विपद पर स्विच करना चाहिए? मैंने पाया यहाँ महत्व के लिए इस परीक्षण: 1-pchisq (अवशिष्ट विचलन, df), लेकिन मैं केवल कि एक बार, जो मुझे परेशान करता है देखा है। मैं यह भी पढ़ता हूं (मुझे स्रोत नहीं मिल रहा है) कि अनुपात 1.5 आम तौर पर सुरक्षित है। राय?

जवाबों:


45

आर पैकेज एईआर में आपको फ़ंक्शन मिलेगा dispersiontest, जो कैमरून एंड त्रिवेदी (1990) द्वारा ओवरडाइस्पोर्ट के लिए एक टेस्ट लागू करता है ।

यह एक सरल विचार का अनुसरण करता है: एक पॉइसन मॉडल में, माध्य और विचरण भी है। वे बराबर हैं। परीक्षण बस इस धारणा को एक विकल्प के खिलाफ एक शून्य परिकल्पना के रूप में परीक्षण करता है जहां जहां निरंतर अर्थ है अविकसितता और अर्थ है अतिविशिष्टता। फ़ंक्शन कुछ नीरस फ़ंक्शन (अक्सर रैखिक या द्विघात है; पूर्व डिफ़ॉल्ट है)। परिणामी परीक्षण बनाम और परीक्षण सांख्यिकीय के परीक्षण के है। आँकड़ा जो अशक्त के तहत विषम रूप से सामान्य मानक है।E(Y)=μVar(Y)=μVar(Y)=μ+cf(μ)c<0c>0f(.)H0:c=0H1:c0t

उदाहरण:

R> library(AER)
R> data(RecreationDemand)
R> rd <- glm(trips ~ ., data = RecreationDemand, family = poisson)
R> dispersiontest(rd,trafo=1)

Overdispersion test

data:  rd
z = 2.4116, p-value = 0.007941
alternative hypothesis: true dispersion is greater than 0
sample estimates:
dispersion 
    5.5658 

यहाँ हम स्पष्ट रूप से देखते हैं कि अतिविशिष्टता का प्रमाण है (सी का अनुमान 5.57 है) जो कि विषुव ग्रहण की धारणा (यानी सी = 0) के खिलाफ काफी दृढ़ता से बात करता है।

ध्यान दें कि यदि आप उपयोग नहीं करते हैं trafo=1, तो यह वास्तव में बनाम साथ परीक्षण करेगा, जिसका निश्चित रूप से अन्य परीक्षण के समान परिणाम है एक के बाद एक टेस्ट स्टेटिस्टिक शिफ्ट किए जा रहे हैं। हालांकि, इसका कारण यह है कि उत्तरार्द्ध एक अर्ध-पॉइसन मॉडल में सामान्य पैरामीरिजेशन से मेल खाता है। H0:c=1H1:c1c=c+1


1
मुझे उपयोग करना था glm(trips ~ 1, data = data, family = poisson)(यानी मेरे डेटा के 1बजाय .), लेकिन बहुत अच्छा, धन्यवाद
फिल

12

एक विकल्प है odTestसे psclपुस्तकालय जो एक प्वासों प्रतिगमन के प्रतिबंध के लिए एक नकारात्मक द्विपद प्रतिगमन की लॉग-संभावना अनुपात तुलना । निम्न परिणाम प्राप्त होता है:μ=Var

>library(pscl)

>odTest(NegBinModel) 

Likelihood ratio test of H0: Poisson, as restricted NB model:
n.b., the distribution of the test-statistic under H0 is non-standard
e.g., see help(odTest) for details/references

Critical value of test statistic at the alpha= 0.05 level: 2.7055 
Chi-Square Test Statistic =  52863.4998 p-value = < 2.2e-16

यहाँ मेरे नकारात्मक द्विपद प्रतिगमन के पक्ष में पॉइसन प्रतिबंध की अशक्तता को खारिज कर दिया गया है NegBinModel। क्यों? क्योंकि परीक्षण आँकड़ा एक 52863.4998से अधिक 2.7055है p-value of < 2.2e-16

का लाभ AER dispersiontestकक्षा "htest" की लौटी हुई वस्तु है, वर्गहीन 'odTest' की तुलना में प्रारूपित करना (जैसे LaTeX में परिवर्तित करना) आसान है।


5

एक अन्य विकल्प पैकेज P__dispसे फ़ंक्शन का उपयोग करना है msmeP__dispसमारोह पियर्सन गणना करने के लिए इस्तेमाल किया जा सकता और पियर्सन फैलाव आँकड़ों के साथ मॉडल फिटिंग के बाद या ।χ2glmglm.nb


2

फिर भी एक और विकल्प एक संभावना-अनुपात परीक्षण का उपयोग करने के लिए दिखाएगा कि अतिविश्लेषण के साथ एक क्यूसिपोइसन जीएलएम अतिविशिष्टता के बिना एक नियमित पॉइसन जीएलएम की तुलना में काफी बेहतर है:

fit = glm(count ~ treatment,family="poisson",data=data) 
fit.overdisp = glm(count ~ treatment,family="quasipoisson",data=data) 
summary(fit.overdisp)$dispersion # dispersion coefficient
pchisq(summary(fit.overdisp)$dispersion * fit$df.residual, fit$df.residual, lower = F) # significance for overdispersion
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.