दस्तावेज़ में कहा गया है , plot.lm()
6 अलग-अलग भूखंड वापस कर सकते हैं:
[१] फिट किए गए मूल्यों के खिलाफ अवशिष्टों का एक भूखंड, [२] फिट किए गए मूल्यों के खिलाफ, स्क्वायरर्ट (अवशेषों का एक स्केल-स्थान का प्लॉट) [३] एक सामान्य क्यूक्यू प्लॉट, [४] कुक की दूरियों का एक प्लॉट: पंक्ति लेबल, [५] लीवरेज के खिलाफ अवशिष्टों का एक प्लॉट, और [६] लीवरेज / (१-लीवरेज) के खिलाफ कुक की दूरियों का एक प्लॉट। डिफ़ॉल्ट रूप से, पहले तीन और 5 प्रदान किए जाते हैं। ( मेरी संख्या )
भूखंड [1] , [२] , [३] और [५] डिफ़ॉल्ट रूप से वापस आ जाते हैं। इंटरप्रिटिंग [1] पर सीवी पर चर्चा की गई है: एक रेखीय मॉडल की मान्यताओं की पुष्टि के लिए अवशेषों बनाम फिट प्लॉट की व्याख्या करना । मैंने होमोसेक्शुअलिटी और उन प्लॉट्स की धारणा को समझाया जो आपको इसका मूल्यांकन करने में मदद कर सकते हैं (स्केल-लोकेशन प्लॉट्स [2] सहित ) सीवी पर यहां: रैखिक रिग्रेशन मॉडल में निरंतर विचरण करने का क्या मतलब है? मैंने यहाँ CV पर Qq- प्लॉट्स [3] पर चर्चा की है: QQ प्लॉट हिस्टोग्राम और यहाँ से मेल नहीं खाता है: PP- प्लॉट्स बनाम QQ- प्लॉट्स । यहाँ एक बहुत अच्छा अवलोकन भी है: क्यूक्यू-प्लॉट की व्याख्या कैसे करें? तो, जो कुछ बचा है वह मुख्य रूप से केवल [5] , अवशिष्ट-उत्तोलन की साजिश को समझ रहा है ।
इसे समझने के लिए, हमें तीन चीजों को समझने की जरूरत है:
- का लाभ उठाने,
- मानकीकृत अवशिष्ट, और
- कुक की दूरी
( एक्स)¯, वाई ¯)एक्सहो कि परिणाम आप प्राप्त कुछ डेटा बिंदुओं द्वारा संचालित कर रहे हैं; यही इस भूखंड को निर्धारित करने में आपकी सहायता करने का इरादा है।
एक्सएक्स¯एक्स
एन
इन तथ्यों को ध्यान में रखते हुए, चार अलग-अलग स्थितियों से जुड़े भूखंडों पर विचार करें:
- एक डेटासेट जहां सब कुछ ठीक है
- उच्च-उत्तोलन वाला एक डेटासेट, लेकिन निम्न-मानकीकृत अवशिष्ट बिंदु
- निम्न-उत्तोलन वाला एक डेटासेट, लेकिन उच्च-मानक अवशिष्ट बिंदु
- उच्च-लीवरेज, उच्च-मानकीकृत अवशिष्ट बिंदु वाला डेटासेट
( एक्स)¯, वाई ¯)21
leverage std.residual cooks.d
high leverage, low residual 0.3814234 0.0014559 0.0000007
low leverage, high residual 0.0476191 3.4456341 0.2968102
high leverage, high residual 0.3814234 -3.8086475 4.4722437
नीचे इन कोडों को उत्पन्न करने के लिए उपयोग किया गया कोड है:
set.seed(20)
x1 = rnorm(20, mean=20, sd=3)
y1 = 5 + .5*x1 + rnorm(20)
x2 = c(x1, 30); y2 = c(y1, 20.8)
x3 = c(x1, 19.44); y3 = c(y1, 20.8)
x4 = c(x1, 30); y4 = c(y1, 10)
* यह समझने में मदद के लिए कि OLS प्रतिगमन डेटा और रेखा के बीच ऊर्ध्वाधर दूरी को कम करने वाली रेखा को कैसे ढूंढता है, मेरा जवाब यहां देखें: y के साथ x और x के साथ y पर रैखिक प्रतिगमन में क्या अंतर है?