जीएलएम के लिए छद्म आर चुकता सूत्र


28

मुझे किताब में छद्म लिए एक सूत्र मिला , विस्तार में द लाइनियर मॉडल विद आर, जूलियन जे। फाइववे (पृष्ठ 59)।R2

1ResidualDevianceNullDeviance

क्या यह GLM के लिए छद्म एक सामान्य सूत्र है ?R2

जवाबों:


22

GLiMs के लिए बड़ी संख्या में छद्म- s हैं। उत्कृष्ट यूसीएलए सांख्यिकी सहायता साइट का यहां व्यापक अवलोकन है । आपके द्वारा सूचीबद्ध की गई सूची को मैकफेडन का छद्म- कहा जाता है । यूसीएलए के टाइपोलॉजी के सापेक्ष, यह की तरह है कि यह शून्य मॉडल पर फिट मॉडल के सुधार को अनुक्रमित करता है। कुछ सांख्यिकीय सॉफ़्टवेयर, विशेष रूप से SPSS, अगर मुझे सही से याद है, तो McFadden के छद्म- को डिफ़ॉल्ट रूप से कुछ विश्लेषणों से परिणाम के रूप में प्रिंट करें, जैसे कि लॉजिस्टिक रिग्रेशन जैसे विश्लेषण, इसलिए मुझे संदेह है कि यह काफी सामान्य है, हालांकि कॉक्स और स्नेल और नागेलकेके छद्म- एस और भी अधिक हो सकता है। हालाँकि, मैकफैडेन के छद्म- में सभी गुण नहीं हैंR2R2R2R2R2R2R2 (कोई छद्म- करता है)। यदि कोई किसी मॉडल को समझने के लिए छद्म- का उपयोग करने में रुचि रखता है, तो मैं दृढ़ता से इस उत्कृष्ट सीवी थ्रेड को पढ़ने की सलाह देता हूं: कौन सा छद्म- उपाय है जो लॉजिस्टिक रिग्रेशन (कॉक्स एंड स्नेल या नागेल्के) के लिए रिपोर्ट करने के लिए है? (इसके लायक क्या है, खुद ही लोगों के एहसास की तुलना में चप्पल है, जिसका एक बड़ा प्रदर्शन @ व्हिबर के उत्तर में देखा जा सकता है: क्या उपयोगी या खतरनाक है? ) R2R2R2R2R2


मुझे आश्चर्य है कि क्या ये सभी छद्म-आर 2 विशेष रूप से केवल लॉजिस्टिक प्रतिगमन के लिए डिज़ाइन किए गए हैं? या क्या वे पोइज़न और गामा-ग्लम के लिए भी सामान्यीकरण करते हैं? मैंने प्रत्येक संभव GLMColin Cameron, A., & Windmeijer, F. A. (1997). An R-squared measure of goodness of fit for some common nonlinear regression models. Journal of Econometrics, 77(2), 329-342.
Jens

@ जेन्स, उनमें से कुछ निश्चित रूप से एलआर विशिष्ट लगते हैं, लेकिन अन्य विचलन का उपयोग करते हैं, जो आप किसी भी जीएलएम से प्राप्त कर सकते हैं।
गोबर -

1
ध्यान दें कि मैकफैडेन के को अक्सर लॉग-लाइबिलिटी के संदर्भ में परिभाषित किया जाता है, जो केवल एक एडिटिव कंटीन्यू तक परिभाषित होता है, न कि ओपी के प्रश्न के अनुसार। एडिटिव स्थिरांक के विनिर्देश के बिना, मैकफैडेन के को अच्छी तरह से परिभाषित नहीं किया गया है। भटकाव एडिटिव कॉन्स्टेंट का एक अनूठा विकल्प है, जो मेरे दिमाग में सबसे उपयुक्त विकल्प है, अगर सामान्यीकरण को रेखीय मॉडल से साथ तुलनीय होना चाहिए । R2R2R2
NRH

यह देखते हुए कि bwlewis.github.io/GLM के रूप में GLM इसमें पुनरावृत्त कम से कम वर्गों का उपयोग करते हुए फिट हैं, वास्तव में GLM लिंक स्केल पर भारित R2 की गणना करने में क्या आपत्ति होगी, जो 1 / variance वजन का उपयोग करके वजन (जो glm वापस देता है) स्लॉट में एक चमक फिट में वजन)?
टॉम वेन्सलेर्स

@TomWenseleers, आप जैसा चाहें वैसा कर सकते हैं, लेकिन मूल तर्क "कौन से छद्म- ... को रिपोर्ट करने के लिए ..." धागा मैं जुड़ा हुआ है, विशेष रूप से प्रायिकतालोगिक का उत्तरR2
गंग - मोनिका

9

आर आउटपुट में शून्य और अवशिष्ट अवमूल्यन देता है glmताकि आप इस तरह की तुलना कर सकें (नीचे अंतिम दो पंक्तियाँ देखें)।

> x = log(1:10)

> y = 1:10

> glm(y ~ x, family = poisson)

>Call:  glm(formula = y ~ x, family = poisson)

Coefficients:
(Intercept)            x  
  5.564e-13    1.000e+00  

Degrees of Freedom: 9 Total (i.e. Null);  8 Residual
Null Deviance:      16.64 
Residual Deviance: 2.887e-15    AIC: 37.97

आप इन मानों को ऑब्जेक्ट से बाहर खींच सकते हैं model$null.devianceऔरmodel$deviance


आह ठीक है। मैं प्रश्न का लिखित रूप में उत्तर दे रहा था। मैंने और जोड़ दिया है, लेकिन मुझे 100% यकीन नहीं है कि अशक्त विचलन की गणना कैसे की जाती है (यह संतृप्त मॉडल की लॉग संभावना के साथ कुछ करना है, लेकिन मुझे आश्वस्त होने के लिए संतृप्ति के बारे में पर्याप्त विवरण याद नहीं है। कि मैं अच्छे अंतर्ज्ञान दे सकूं)
डेविड जे। हैरिस

मैं इसे glm आउटपुट (पारिवारिक व्यवसाय या quasipoisson) में नहीं रखता।
जिज्ञासु

@ टोमस मेरे संपादन को देखते हैं। मुझे नहीं पता कि अगर मुझसे 2 साल पहले गलती हुई थी या तब से डिफ़ॉल्ट आउटपुट बदल गया है।
डेविड जे। हैरिस

summary.glmR2

1
प्रश्न पढ़ें। क्या आपको लगता है कि आप इसका जवाब देते हैं? सवाल यह नहीं था कि "मुझे सूत्र के घटक कहां मिल सकते हैं?"।
उत्सुक

6

आपके द्वारा प्रस्तावित फॉर्मूला माड्डाला (1983) और मैगी (1990) द्वारा प्रस्तावित किया गया है, जो कि लॉजिस्टिक मॉडल पर आर स्क्वेर्ड का अनुमान लगाने के लिए है। इसलिए मुझे नहीं लगता कि यह सभी glm मॉडल पर लागू होता है (पेज 266 पर थॉमस पी। रयान की पुस्तक मॉडर्न रिग्रेशन मेथड्स देखें)।

यदि आप एक नकली डेटा सेट बनाते हैं, तो आप देखेंगे कि यह उदाहरण के रूप में गौसिम glm के लिए R वर्ग ... को कम आंक रहा है।

मुझे लगता है कि एक गाऊसी चमक के लिए आप बुनियादी (एलएम) आर चुकता सूत्र का उपयोग कर सकते हैं ...

R2gauss<- function(y,model){
    moy<-mean(y)
    N<- length(y)
    p<-length(model$coefficients)-1
    SSres<- sum((y-predict(model))^2)
    SStot<-sum((y-moy)^2)
    R2<-1-(SSres/SStot)
    Rajust<-1-(((1-R2)*(N-1))/(N-p-1))
    return(data.frame(R2,Rajust,SSres,SStot))
}

और लॉजिस्टिक (या आर में द्विपद परिवार के लिए) मैं आपके द्वारा प्रस्तावित सूत्र का उपयोग करूंगा ...

    R2logit<- function(y,model){
    R2<- 1-(model$deviance/model$null.deviance)
    return(R2)
    }

पोइसन ग्लम के लिए अब तक मैंने इस पोस्ट के समीकरण का उपयोग किया है।

https://stackoverflow.com/questions/23067475/how-do-i-obtain-pseudo-r2-measures-in-stata-when-using-glm-regression

शोध गेट्स पर छद्म आर 2 पर भी एक बेहतरीन लेख उपलब्ध है ... यहाँ लिंक दिया गया है:

https://www.researchgate.net/publication/222802021_Pseudo_R-squared_measures_for_Poisson_regression_models_with_over-_or_underdispersion

मुझे उम्मीद है कि यह मदद मिलेगी।


बस परिवार = गॉसियन (लिंक = पहचान) के साथ एक जीएलएम मॉडल फिट करें और के मूल्य की जांच करें 1-summary(GLM)$deviance/summary(GLM)$null.devianceऔर आप देखेंगे कि आर 2 एक नियमित ओएलएस प्रतिगमन के आर 2 मान से मेल खाता है, इसलिए उपरोक्त उत्तर सही है! यहाँ भी मेरी पोस्ट देखें - stats.stackexchange.com/questions/412580/...
टॉम Wenseleers

3

R पैकेज डेविड जे हैरिस द्वारा बताए अनुसार D-Squared कीmodEvA गणना करता है1 - (mod$deviance/mod$null.deviance)

set.seed(1)
data <- data.frame(y=rpois(n=10, lambda=exp(1 + 0.2 * x)), x=runif(n=10, min=0, max=1.5))

mod <- glm(y~x,data,family = poisson)

1- (mod$deviance/mod$null.deviance)
[1] 0.01133757
library(modEvA);modEvA::Dsquared(mod)
[1] 0.01133757

मॉडल का डी-स्क्वेर्ड या समझाया गया डिविज़न (गुइज़न एंड ज़िमरमन 2000) https://doi.org/10.1016/S0304-3800(00)00354-9 में प्रस्तुत किया गया है

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.