व्याख्या करना। प्लाट ()


89

आर में प्लॉट (lm) द्वारा उत्पन्न ग्राफ की व्याख्या करने के बारे में मेरा एक सवाल था। मैं सोच रहा था कि क्या आप लोग मुझे बता सकते हैं कि स्केल-लोकेशन और लीवरेज-अवशिष्ट भूखंडों की व्याख्या कैसे करें? किसी भी टिप्पणी की सराहना की जाएगी। सांख्यिकी, प्रतिगमन और अर्थमिति का बुनियादी ज्ञान ग्रहण करें।


क्या आपकी नज़र यहाँ है ?
user603

6
और यहाँ (पृष्ठ )२ से), यहाँ
कोल्लेरदश

जवाबों:


139

दस्तावेज़ में कहा गया है , plot.lm()6 अलग-अलग भूखंड वापस कर सकते हैं:

[१] फिट किए गए मूल्यों के खिलाफ अवशिष्टों का एक भूखंड, [२] फिट किए गए मूल्यों के खिलाफ, स्क्वायरर्ट (अवशेषों का एक स्केल-स्थान का प्लॉट) [३] एक सामान्य क्यूक्यू प्लॉट, [४] कुक की दूरियों का एक प्लॉट: पंक्ति लेबल, [५] लीवरेज के खिलाफ अवशिष्टों का एक प्लॉट, और [६] लीवरेज / (१-लीवरेज) के खिलाफ कुक की दूरियों का एक प्लॉट। डिफ़ॉल्ट रूप से, पहले तीन और 5 प्रदान किए जाते हैं। ( मेरी संख्या )

भूखंड [1] , [२] , [३] और [५] डिफ़ॉल्ट रूप से वापस आ जाते हैं। इंटरप्रिटिंग [1] पर सीवी पर चर्चा की गई है: एक रेखीय मॉडल की मान्यताओं की पुष्टि के लिए अवशेषों बनाम फिट प्लॉट की व्याख्या करना । मैंने होमोसेक्शुअलिटी और उन प्लॉट्स की धारणा को समझाया जो आपको इसका मूल्यांकन करने में मदद कर सकते हैं (स्केल-लोकेशन प्लॉट्स [2] सहित ) सीवी पर यहां: रैखिक रिग्रेशन मॉडल में निरंतर विचरण करने का क्या मतलब है? मैंने यहाँ CV पर Qq- प्लॉट्स [3] पर चर्चा की है: QQ प्लॉट हिस्टोग्राम और यहाँ से मेल नहीं खाता है: PP- प्लॉट्स बनाम QQ- प्लॉट्स । यहाँ एक बहुत अच्छा अवलोकन भी है: क्यूक्यू-प्लॉट की व्याख्या कैसे करें? तो, जो कुछ बचा है वह मुख्य रूप से केवल [5] , अवशिष्ट-उत्तोलन की साजिश को समझ रहा है ।

इसे समझने के लिए, हमें तीन चीजों को समझने की जरूरत है:

  • का लाभ उठाने,
  • मानकीकृत अवशिष्ट, और
  • कुक की दूरी

(एक्स¯, Y¯)एक्सहो कि परिणाम आप प्राप्त कुछ डेटा बिंदुओं द्वारा संचालित कर रहे हैं; यही इस भूखंड को निर्धारित करने में आपकी सहायता करने का इरादा है।

एक्सएक्स¯एक्स

एन

इन तथ्यों को ध्यान में रखते हुए, चार अलग-अलग स्थितियों से जुड़े भूखंडों पर विचार करें:

  1. एक डेटासेट जहां सब कुछ ठीक है
  2. उच्च-उत्तोलन वाला एक डेटासेट, लेकिन निम्न-मानकीकृत अवशिष्ट बिंदु
  3. निम्न-उत्तोलन वाला एक डेटासेट, लेकिन उच्च-मानक अवशिष्ट बिंदु
  4. उच्च-लीवरेज, उच्च-मानकीकृत अवशिष्ट बिंदु वाला डेटासेट

यहाँ छवि विवरण दर्ज करें यहाँ छवि विवरण दर्ज करें

(एक्स¯, Y¯)21

                              leverage std.residual   cooks.d
high leverage,  low residual 0.3814234    0.0014559 0.0000007
low leverage,  high residual 0.0476191    3.4456341 0.2968102
high leverage, high residual 0.3814234   -3.8086475 4.4722437

नीचे इन कोडों को उत्पन्न करने के लिए उपयोग किया गया कोड है:

set.seed(20)

x1 = rnorm(20, mean=20, sd=3)
y1 = 5 + .5*x1 + rnorm(20)

x2 = c(x1, 30);        y2 = c(y1, 20.8)
x3 = c(x1, 19.44);     y3 = c(y1, 20.8)
x4 = c(x1, 30);        y4 = c(y1, 10)

* यह समझने में मदद के लिए कि OLS प्रतिगमन डेटा और रेखा के बीच ऊर्ध्वाधर दूरी को कम करने वाली रेखा को कैसे ढूंढता है, मेरा जवाब यहां देखें: y के साथ x और x के साथ y पर रैखिक प्रतिगमन में क्या अंतर है?


अच्छा जवाब जो अधिक सीखने के लिए सभी लेखन दिशाओं में इंगित करता है। (आश्चर्य होगा कि इन भूखंडों की पूर्ण और स्पष्ट व्याख्याओं की इतनी कमी क्यों है)
theforestecologist

हालांकि यहां प्रत्येक भूखंड के लिए एक संक्षिप्त समेकित स्पष्टीकरण का एक उदाहरण है।
theforestecologist 23
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.