यदि आप कोड (साधारण प्रकार plot.lm
, कोष्ठक के बिना, या edit(plot.lm)
R प्रॉम्प्ट पर) पर एक नज़र डालते हैं , तो आप देखेंगे कि फ़ंक्शन के साथ कुक की दूरियों को लाइन 44 परिभाषित किया गया cooks.distance()
है। यह देखने के लिए कि वह क्या करता है, stats:::cooks.distance.glm
R प्रॉम्प्ट पर टाइप करें । वहां आप देखते हैं कि इसे परिभाषित किया गया है
(res/(1 - hat))^2 * hat/(dispersion * p)
जहां res
पियर्सन बच (के रूप में द्वारा लौटाए गए हैं influence()
समारोह), hat
है टोपी मैट्रिक्स , p
मॉडल में पैरामीटर की संख्या है, और dispersion
फैलाव वर्तमान मॉडल के लिए विचार किया है (रसद और प्वासों प्रतिगमन के लिए एक तय, देखें help(glm)
)। संक्षेप में, यह टिप्पणियों और उनके मानकीकृत अवशिष्टों के उत्तोलन के कार्य के रूप में गणना की जाती है। (साथ तुलना करें stats:::cooks.distance.lm
।)
एक अधिक औपचारिक संदर्भ के लिए, आप plot.lm()
फ़ंक्शन में संदर्भों का अनुसरण कर सकते हैं , अर्थात्
बेल्सले, डीए, कुह, ई। और वेल्श, आरई (1980)। रिग्रेशन डायग्नोस्टिक्स । न्यूयॉर्क: विली।
इसके अलावा, ग्राफिक्स में प्रदर्शित अतिरिक्त जानकारी के बारे में, हम आगे देख सकते हैं और देख सकते हैं कि R उपयोग करता है
plot(xx, rsp, ... # line 230
panel(xx, rsp, ...) # line 233
cl.h <- sqrt(crit * p * (1 - hh)/hh) # line 243
lines(hh, cl.h, lty = 2, col = 2) #
lines(hh, -cl.h, lty = 2, col = 2) #
जहां rsp
Std के रूप में लेबल किया गया है। पियरसन अवशेष। GLM, Std के मामले में। अवशिष्ट अन्यथा (पंक्ति 172); हालाँकि, दोनों मामलों में, R द्वारा उपयोग किया जाने वाला सूत्र है (लाइनें 175 और 178)
residuals(x, "pearson") / s * sqrt(1 - hii)
जहाँ hii
हैट्रिक मैट्रिक्स जेनेरिक फ़ंक्शन द्वारा लौटाया गया है lm.influence()
। यह std के लिए सामान्य सूत्र है। बच गया:
आर एसजे= आरजे1 - एच^जे-----√
जेजे
आर कोड की अगली पंक्तियों में कुक की दूरी के लिए एक चिकनी (आकर्षित add.smooth=TRUE
में plot.lm()
डिफ़ॉल्ट रूप से, देखते हैं getOption("add.smooth")
) और समोच्च पंक्तियों (अपने भूखंड में दिखाई नहीं) महत्वपूर्ण मानकीकृत बच के लिए (देखें cook.levels=
विकल्प)।