GLM के लिए किस तरह के अवशिष्ट और कुक की दूरी का उपयोग किया जाता है?


11

क्या किसी को पता है कि कुक की दूरी का सूत्र क्या है? मूल कुक की दूरी के सूत्र छात्र के अवशेषों का उपयोग करते हैं, लेकिन आरडी का उपयोग क्यों किया जाता है। एक GLM के लिए कुक की दूरी की साजिश की गणना करते समय पियर्सन अवशिष्ट। मुझे पता है कि GLM के लिए छात्र अवशिष्ट को परिभाषित नहीं किया गया है, लेकिन कुक की दूरी की गणना करने का सूत्र कैसा दिखता है?

निम्न उदाहरण मान लें:

numberofdrugs <- rcauchy(84, 10)
healthvalue <- rpois(84,75)
test <- glm(healthvalue ~ numberofdrugs, family=poisson)
plot(test, which=5) 

कुक की दूरी के लिए सूत्र क्या है? दूसरे शब्दों में, लाल धराशायी रेखा की गणना करने का सूत्र क्या है? और मानकीकृत पियर्सन अवशिष्ट के लिए यह सूत्र कहां से आता है?

कुक की दूरी

जवाबों:


15

यदि आप कोड (साधारण प्रकार plot.lm, कोष्ठक के बिना, या edit(plot.lm)R प्रॉम्प्ट पर) पर एक नज़र डालते हैं , तो आप देखेंगे कि फ़ंक्शन के साथ कुक की दूरियों को लाइन 44 परिभाषित किया गया cooks.distance()है। यह देखने के लिए कि वह क्या करता है, stats:::cooks.distance.glmR प्रॉम्प्ट पर टाइप करें । वहां आप देखते हैं कि इसे परिभाषित किया गया है

(res/(1 - hat))^2 * hat/(dispersion * p)

जहां resपियर्सन बच (के रूप में द्वारा लौटाए गए हैं influence()समारोह), hatहै टोपी मैट्रिक्स , pमॉडल में पैरामीटर की संख्या है, और dispersionफैलाव वर्तमान मॉडल के लिए विचार किया है (रसद और प्वासों प्रतिगमन के लिए एक तय, देखें help(glm))। संक्षेप में, यह टिप्पणियों और उनके मानकीकृत अवशिष्टों के उत्तोलन के कार्य के रूप में गणना की जाती है। (साथ तुलना करें stats:::cooks.distance.lm।)

एक अधिक औपचारिक संदर्भ के लिए, आप plot.lm()फ़ंक्शन में संदर्भों का अनुसरण कर सकते हैं , अर्थात्

बेल्सले, डीए, कुह, ई। और वेल्श, आरई (1980)। रिग्रेशन डायग्नोस्टिक्स । न्यूयॉर्क: विली।

इसके अलावा, ग्राफिक्स में प्रदर्शित अतिरिक्त जानकारी के बारे में, हम आगे देख सकते हैं और देख सकते हैं कि R उपयोग करता है

plot(xx, rsp, ...                    # line 230
panel(xx, rsp, ...)                  # line 233
cl.h <- sqrt(crit * p * (1 - hh)/hh) # line 243
lines(hh, cl.h, lty = 2, col = 2)    #
lines(hh, -cl.h, lty = 2, col = 2)   #  

जहां rspStd के रूप में लेबल किया गया है। पियरसन अवशेष। GLM, Std के मामले में। अवशिष्ट अन्यथा (पंक्ति 172); हालाँकि, दोनों मामलों में, R द्वारा उपयोग किया जाने वाला सूत्र है (लाइनें 175 और 178)

residuals(x, "pearson") / s * sqrt(1 - hii)

जहाँ hiiहैट्रिक मैट्रिक्स जेनेरिक फ़ंक्शन द्वारा लौटाया गया है lm.influence()। यह std के लिए सामान्य सूत्र है। बच गया:

आररोंजे=आरजे1-^जे

जेजे

आर कोड की अगली पंक्तियों में कुक की दूरी के लिए एक चिकनी (आकर्षित add.smooth=TRUEमें plot.lm()डिफ़ॉल्ट रूप से, देखते हैं getOption("add.smooth")) और समोच्च पंक्तियों (अपने भूखंड में दिखाई नहीं) महत्वपूर्ण मानकीकृत बच के लिए (देखें cook.levels=विकल्प)।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.