ऐसा लगता है कि आप उपयोग कर रहे हैं R
। यदि हां, तो ध्यान दें कि आप का उपयोग कर एक scatterplot पर बिंदुओं की पहचान कर सकते हैं ? पहचान । मुझे लगता है कि यहां कई चीजें चल रही हैं। पहले, आपके पास LN_RT_vol_in ~ LN_AT_vol_in
(.2, 1.5) पर (हाइलाइट किए गए) के प्लॉट पर एक बहुत प्रभावशाली बिंदु है । यह लगभग -3.7 के मानकीकृत अवशिष्ट होने की बहुत संभावना है। उस बिंदु का प्रभाव प्रतिगमन रेखा को समतल करने के लिए होगा, इसे तेजी से ऊपर की ओर की रेखा से अधिक क्षैतिज रूप से झुकाना होगा अन्यथा आपको मिल जाएगा। इसका एक प्रभाव यह है कि आपके सभी अवशेषों को जहां वे अन्यथा भूखंड के भीतर स्थित हैं (कम से कम जब उस कोवरिएट के संदर्भ में सोचते हैं और दूसरे को अनदेखा करते हैं) के सापेक्ष वामावर्त घुमाया जाएगा residual ~ predicted
।
फिर भी, आपके द्वारा देखे जाने वाले अवशिष्टों की स्पष्ट सीधी रेखा अभी भी वहाँ होगी, क्योंकि वे आपके मूल डेटा के 3-आयामी क्लाउड में कहीं मौजूद हैं। वे सीमांत भूखंडों में से किसी एक में मिलना मुश्किल हो सकता है। आप पहचान () फ़ंक्शन का उपयोग मदद करने के लिए कर सकते हैं, और आप एक गतिशील 3 डी स्कैल्प्लॉट बनाने के लिए rgl पैकेज का उपयोग भी कर सकते हैं जिसे आप अपने माउस के साथ स्वतंत्र रूप से घुमा सकते हैं। हालांकि, ध्यान दें कि सीधी रेखा के अवशेष उनके अनुमानित मूल्य में सभी 0 से नीचे हैं, और 0 से नीचे के अवशेष हैं (यानी, वे फिट किए गए प्रतिगमन लाइन से नीचे हैं); जहाँ आप को देखने के लिए एक बड़ा संकेत देता है। के अपने प्लॉट पर फिर से देख रहे हैंLN_RT_vol_in ~ LN_AT_vol_in
, मुझे लगता है कि मैं उन्हें देख सकता हूं। उस क्षेत्र में बिंदुओं के बादल के निचले किनारे पर तिरछे नीचे और बाएँ से लगभग (-.01, -1.00) चलने वाले बिंदुओं का एक बहुत सीधा समूह है। मुझे संदेह है कि प्रश्न में वे बिंदु हैं।
दूसरे शब्दों में, अवशिष्ट उस तरह से दिखते हैं क्योंकि वे उस तरह से पहले से ही डेटा स्थान के भीतर कहीं हैं। संक्षेप में, यह वही है जो @ttnphns सुझाव दे रहा है, लेकिन मुझे नहीं लगता कि यह किसी भी मूल आयाम में एक स्थिर है - यह आपके मूल अक्षों के कोण पर एक आयाम में एक निरंतर है। मैं आगे @MichaelChernick से सहमत हूं कि अवशिष्ट भूखंड में यह स्पष्टता शायद हानिरहित है, लेकिन यह कि आपका डेटा वास्तव में बहुत सामान्य नहीं है। हालांकि, वे कुछ सामान्य-ईश हैं, और आपको डेटा की एक सभ्य संख्या प्रतीत होती है, इसलिए CLT आपको कवर कर सकता है, लेकिन आप केवल मामले में बूटस्ट्रैप करना चाहते हैं। अंत में, मुझे चिंता होगी कि वह 'बाहरी' आपके परिणामों को चला रहा है; एक मजबूत दृष्टिकोण शायद विलय कर दिया गया है।