लॉजिस्टिक रिग्रेशन और फ्रैक्शनल रिस्पॉन्स रिग्रेशन में क्या अंतर है?


13

जहाँ तक मुझे पता है, लॉजिस्टिक मॉडल और फ्रैक्शनल रिस्पांस मॉडल (frm) के बीच का अंतर यह है कि डिपेंडेंट वैरिएबल (Y) जिसमें frm [0,1] है, लेकिन लॉजिस्टिक {0, 1} है। इसके अलावा, फ्रिज अपने मापदंडों को निर्धारित करने के लिए अर्ध-संभावना आकलनकर्ता का उपयोग करता है।

आम तौर पर, हम glmउपस्कर मॉडल प्राप्त करने के लिए उपयोग कर सकते हैं glm(y ~ x1+x2, data = dat, family = binomial(logit))

Frm के लिए, हम बदल family = binomial(logit)जाते हैं family = quasibinomial(logit)

मैंने देखा कि हम family = binomial(logit)frm के पैरामीटर को प्राप्त करने के लिए भी उपयोग कर सकते हैं क्योंकि यह समान अनुमानित मूल्य देता है। निम्न उदाहरण देखें

library(foreign)
mydata <- read.dta("k401.dta")


glm.bin <- glm(prate ~ mrate + age + sole + totemp, data = mydata
,family = binomial('logit'))
summary(glm.bin)

वापसी,

Call:
glm(formula = prate ~ mrate + age + sole + totemp, family = binomial("logit"), 
    data = mydata)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-3.1214  -0.1979   0.2059   0.4486   0.9146  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)    
(Intercept)  1.074e+00  8.869e-02  12.110  < 2e-16 ***
mrate        5.734e-01  9.011e-02   6.364 1.97e-10 ***
age          3.089e-02  5.832e-03   5.297 1.17e-07 ***
sole         3.636e-01  9.491e-02   3.831 0.000128 ***
totemp      -5.780e-06  2.207e-06  -2.619 0.008814 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 1166.6  on 4733  degrees of freedom
Residual deviance: 1023.7  on 4729  degrees of freedom
AIC: 1997.6

Number of Fisher Scoring iterations: 6

और के लिए family = quasibinomial('logit'),

glm.quasi <- glm(prate ~ mrate + age + sole + totemp, data = mydata
,family = quasibinomial('logit'))
summary(glm.quasi)

वापसी,

Call:
glm(formula = prate ~ mrate + age + sole + totemp, family = quasibinomial("logit"), 
    data = mydata)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-3.1214  -0.1979   0.2059   0.4486   0.9146  

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  1.074e+00  4.788e-02  22.435  < 2e-16 ***
mrate        5.734e-01  4.864e-02  11.789  < 2e-16 ***
age          3.089e-02  3.148e-03   9.814  < 2e-16 ***
sole         3.636e-01  5.123e-02   7.097 1.46e-12 ***
totemp      -5.780e-06  1.191e-06  -4.852 1.26e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for quasibinomial family taken to be 0.2913876)

    Null deviance: 1166.6  on 4733  degrees of freedom
Residual deviance: 1023.7  on 4729  degrees of freedom
AIC: NA

Number of Fisher Scoring iterations: 6

दोनों से अनुमानित बीटा familyसमान हैं, लेकिन अंतर एसई मान है। हालांकि, सही एसई प्राप्त करने के लिए, हमें library(sandwich)इस पोस्ट के रूप में उपयोग करना होगा ।

अब, मेरे सवाल:

  1. इन दोनों संहिताओं में क्या अंतर है?
  2. क्या एसईएम मजबूत एसईएम प्राप्त करने के बारे में है?

यदि मेरी समझ सही नहीं है, तो कृपया कुछ सुझाव दें।

जवाबों:


11

यदि आपका प्रश्न है: इन दोनों कोडों में क्या अंतर है?

एक नज़र ?glmकहती है See family for details of family functions, और एक नज़र ?familyनिम्नलिखित विवरण को प्रकट करती है:

कैसिबिनोमियल और क्सिपोइसोन परिवार द्विपद और पॉसियन परिवारों से भिन्न होते हैं केवल यह कि फैलाव पैरामीटर एक पर तय नहीं होता है, इसलिए वे अति-फैलाव को मॉडल कर सकते हैं।

यह वही है जो आप अपने आउटपुट में देखते हैं। और यह दोनों मॉडल / कोड के बीच का अंतर है।

यदि आपका प्रश्न है: लॉजिस्टिक रिग्रेशन और फ्रैक्शनल रिस्पांस रिग्रेशन में क्या अंतर है?

जैसा कि आप सही ढंग से पहचानते हैं, मॉडल एक लॉजिस्टिक है यदि आपके आश्रित चर या तो 0 हैं या 1. पपके और वोल्ड्रिज ने दिखाया है कि आप इस फॉर्म के GLM का उपयोग अंशों के अनुमान के लिए भी कर सकते हैं, लेकिन आपको पहचानने की आवश्यकता है मजबूत मानक त्रुटियों की गणना करें। लॉजिस्टिक रिग्रेशन के लिए यह आवश्यक नहीं है, और वास्तव में, कुछ लोगों को लगता है कि आपको प्रोबेट / लॉजिस्टिक मॉडल में मजबूत मानक त्रुटियों की गणना नहीं करनी चाहिए। हालांकि यह एक अलग बहस है।

सैद्धांतिक आधार Gourieroux, Monfort, और Trognon द्वारा एक प्रसिद्ध पेपर से आता है1984 में इकोनोमेट्रिक में। वे दिखाते हैं कि (कुछ नियमित परिस्थितियों के तहत आदि) अधिकतम संभावना मापदंडों को अधिकतम सीमा तक प्राप्त कर सकते हैं जो रैखिक घातीय परिवार से संबंधित हैं, रैखिक घातीय परिवार में किसी भी अन्य संभावना से संबंधित मापदंडों के लिए निरंतर अनुमान हैं। इसलिए, कुछ अर्थों में, हम यहां लॉजिस्टिक वितरण का उपयोग कर रहे हैं, भले ही यह बिल्कुल सही नहीं है, लेकिन पैरामीटर अभी भी उन मापदंडों के अनुरूप हैं जिन्हें हम प्राप्त करना चाहते हैं। इसलिए, यदि आपका प्रश्न इस अवलोकन से उत्पन्न होता है कि हम लॉजिस्टिक और भिन्नात्मक प्रतिक्रिया मॉडल दोनों का अनुमान लगाने के लिए बहुत ही समान कार्य का उपयोग कर रहे हैं, सिवाय इसके कि हम आश्रित चर की प्रकृति का आदान-प्रदान करते हैं, तो यह अंतर्ज्ञान है।


हम frm प्रदर्शन कैसे माप सकते हैं? क्या हम रैखिक प्रतिगमन की तरह एमएसई का उपयोग कर सकते हैं?
नौसिखिया

1
यह एक बहुत अलग सवाल है। कृपया इसे एक नए के रूप में पोस्ट करें।
coffeinjunky
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.