सारांश में फैलाव। एलएलएम ()


13

मैं एक glm.nb आयोजित किया

glm1<-glm.nb(x~factor(group))

समूह के साथ एक संस्थागत और x एक गणितीय चर है। जब मैं परिणामों का सारांश प्राप्त करने की कोशिश करता हूं, तो मैं थोड़ा अलग परिणाम प्राप्त करता हूं, इस पर निर्भर करता है कि मैं उपयोग करता हूं summary()या summary.glmsummary(glm1)मुझे देता है

    ...
Coefficients:
                    Estimate Std. Error z value Pr(>|z|)  
    (Intercept)       0.1044     0.1519   0.687   0.4921  
    factor(gruppe)2   0.1580     0.2117   0.746   0.4555  
    factor(gruppe)3   0.3531     0.2085   1.693   0.0904 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 1)

जबकि समरी.ग्लम (glm1) मुझे देता है

    ...
Coefficients:
                    Estimate Std. Error t value Pr(>|t|)  
    (Intercept)       0.1044     0.1481   0.705   0.4817  
    factor(gruppe)2   0.1580     0.2065   0.765   0.4447  
    factor(gruppe)3   0.3531     0.2033   1.737   0.0835 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067)

मैं फैलाव पैरामीटर का अर्थ समझता हूं, लेकिन रेखा का नहीं

(Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067)

हैंडबुक में यह कहा गया है, यह अनुमानित फैलाव होगा, लेकिन यह एक बुरा अनुमान लगता है, क्योंकि 0.95 0.7109 के करीब नहीं है, या अनुमानित फैलाव अनुमानित फैलाव पैरामीटर से कुछ अलग है? मुझे लगता है, मुझे किसी summary.nb(x, dispersion=)चीज़ में फैलाव सेट करना है, लेकिन मुझे यकीन नहीं है, अगर मुझे फैलाव को 1 पर सेट करना है (जो कि परिणाम को एक ही परिणाम देगा summary()या अगर मुझे फैलाव पैरामीटर का अनुमान सम्मिलित करना चाहिए, इस मामले में summary.nb(glm1, dispersion=0.7109)या कुछ और करने के लिए अग्रणी ? या मैं सिर्फ का उपयोग कर के साथ ठीक हूँ summary(glm1)?


3
सारांश का उपयोग करें () के रूप में यह वर्ग नीबूं के लिए उपयुक्त S3 विधि को भेजता है। फैलाव अवश्य 1 होना चाहिए, जो अनुमान लगाया जाता है वह थीटा है, जिसे भ्रम से बचने के लिए आकार पैरामीटर कहा जाता है। आंकड़े
मोमो

जवाबों:


14

सबसे पहले, आपको summary.glmकक्षा की एक वस्तु पर उपयोग नहीं करना चाहिए "negbin"। यदि आप फ़ंक्शन कोड को summary.glmदेखते हैं, तो सबसे ऊपर आपको सही गणना दिखाई देगी dispersion। ध्यान दें कि summary.glm केवल मॉडल द्वारा लगाया जा सकता है के बारे में जानता glmहै और इसलिए इसे बाहर विशेष उपचार है, जहां फैलाव पैरामीटर के लिए द्विपद और प्वासों परिवारों एकल है मान लिया इन के अलावा अन्य मॉडल के लिए 1. के बराबर होना चाहिए, से गणना की जाती है मॉडल वस्तु है, लेकिन नोट यह एक धारणा पर आधारित है कि है कि यह एक परिवार है कि है के लिए उपयुक्त है नहीं द्विपद या प्वासों। मॉडल के लिए से सज्जित है । इसलिए जब आप उपयोग करते हैंϕϕϕfamilyglm.nb"Negative Binomial(theta)"summary.glmglm.nbकोड में, फिट किए गए मॉडल पर

if (is.null(dispersion)) 
    dispersion <- if (object$family$family %in% c("poisson", 
        "binomial")) 
        1
    else if (df.r > 0) {
        est.disp <- TRUE
        if (any(object$weights == 0)) 
                warning("observations with zero weight not used for calculating dispersion")
            sum((object$weights * object$residuals^2)[object$weights > 
            0])/df.r
    }

के लिए परीक्षण "poisson"या "binomial"विफल रहता है और फिर यह गणना करता है जहां वास्तविक रूप में इस परिवार के लिए डिफ़ॉल्ट रूप से 1 के बराबर माना जाता है (परिभाषा के अनुसार) ।ϕsummary.negbin

इसके साथ कोई समस्या नहीं है, सही विधि को कॉल करना और तर्क के माध्यम से लिए एक अलग मान की आपूर्ति करना सरल है ।ϕdispersion

दूसरे, आप आउटपुट को गलत समझते हैं। जब आप देखते है

Negative Binomial(0.7109)

जैसा कि मैंने ऊपर दिया था, कोष्ठक में उद्धृत संख्या , नकारात्मक द्विपद वितरण का पैरामीटर। यह मान फिटिंग के दौरान अनुमानित है। ऐसा नहीं है , फैलाव पैरामीटर, और इसलिए दो नंबर जरूरी बराबर नहीं होना चाहिए; वे सिर्फ दो नंबर हैं। φθ^ϕ

जैसा कि परिकलित फैलाव (ऊपर दिए गए कोड का अनुसरण करते हुए) एक (~ 0.95) के बहुत करीब है, यह मान कि मानक त्रुटियों के लिए इस्तेमाल किया जाने वाला बहुत बुरा नहीं है । आप निश्चित रूप से, बस कर सकते हैंφ = 1ϕϕ=1summary.negbin

summary(glm1, dispersion = 0.9509)

और अतिरिक्त आउटपुट मिलता है जो negbinविधि आपको देता है, साथ ही गणना की बजाय का मान ।ϕ


5
+1 अच्छा स्पष्टीकरण। मेरे पास दो छोटी टिप्पणियां हैं: ज्ञात आकार पैरामीटर के साथ द्विपद, पॉसों और नकारात्मक द्विपद में फैलाव पैरामीटर घातीय परिवार की परिभाषा से 1 है (यह एक धारणा नहीं है)। जब आप कहते हैं कि एक अलग फैलाव का अनुमान लगाया जा सकता है और सारांश विधि को आपूर्ति की जा सकती है, तो किसी को सावधान रहना चाहिए क्योंकि किसी को अर्ध क्षेत्र में उद्यम करना होगा जो विशेष रूप से संभावना के लिए निहितार्थ है।
मोमो

@ मोमो वेल ने कहा। मैं आपके द्वारा बताए गए कार्यों के लिए सहायता पृष्ठ के विवरण और विवरण के बीच फटा हुआ था।
मोनिका को बहाल करें - जी। सिम्पसन

2

वेनबेल्स और रिप्ले (2002) से, आधुनिक एप्लाइड सांख्यिकी एस के साथ : 'थीटा' आकार के साथ एक गामा वितरण को परिभाषित करता है और स्केल , इसलिए इसका अर्थ है और विचरण । चलो इस वितरण के साथ एक यादृच्छिक चर हो सकता है; एक प्रतिक्रिया को सशर्त रूप से रूप में पोइसन में वितरित किया जाता है, जिसका अर्थ है , जहां भविष्यवाणियों और गुणांक का एक कार्य है, जो आपकी पसंद के लिंक पर निर्भर करता है। मार्जिन, इसका वितरण बड़े पैमाने पर कार्य के साथ नकारात्मक द्विपद हैθ1θ1 EYEμμ1θEYEμEμ

f(y)=Γ(θ+y)Γ(θ)y!μyθθ(μ+θ)θ+y

उम्मीद

EY=μ

और विचरण

VarY=μ+μ2θ

जैसा कि @Momo बताते हैं, फैलाव पैरामीटर पूरी तरह से एक और बात है, जिसे आप अर्ध-संभावना आकलन करने के लिए अलग-अलग करेंगे। नकारात्मक द्विपद मॉडल और (सच्चे) पॉइसन मॉडल के लिए, यह सही में एक के मूल्य के लिए तय किया गया है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.