मैं कहूंगा कि एक व्यक्तिगत संख्या (जैसे कि एक अवशिष्ट), जिसके परिणामस्वरूप संभाव्यता वितरण से एक यादृच्छिक ड्रा होता है, एक वास्तविक मूल्य है , न कि एक यादृच्छिक चर । इसी तरह, मैं यह कहूंगा कि आपके डेटा और आपके मॉडल से गणना किए गए अवशिष्टों का सेट , वास्तविक मूल्यों का एक सेट है। संख्याओं के इस सेट को एक अंतर्निहित वितरण ~ से स्वतंत्र ड्रॉ के रूप में परिकल्पित किया जा सकता है । (हालांकि दुर्भाग्य से, यहां कई अतिरिक्त जटिलताएं हैं। उदाहरण के लिए, आपके पास वास्तव मेंNe=y−y^ϵN(μ,σ2)Nजानकारी के स्वतंत्र टुकड़े, क्योंकि अवशिष्ट, , को दो शर्तों को पूरा करना चाहिए: , और ) e∑ei=0∑xiei=0
अब, कुछ संख्याओं को देखते हुए, वे अवशिष्ट हों या जो भी हों, यह निश्चित रूप से सच है कि उनके पास एक भिन्नता, , लेकिन यह है। जिस चीज की हम परवाह करते हैं, वह डेटा जनरेटिंग प्रक्रिया (उदाहरण के लिए, जनसंख्या वितरण के विचरण का अनुमान लगाने) के बारे में कुछ कहने में सक्षम है। पूर्ववर्ती सूत्र का उपयोग करते हुए, हम को स्वतंत्रता के अवशिष्ट डिग्री के साथ बदलकर एक अनुमान दे सकते हैं , लेकिन यह एक अच्छा अनुमान नहीं हो सकता है। यह एक ऐसा विषय है जो बहुत तेजी से बहुत जटिल हो सकता है, लेकिन कुछ संभावित कारणों में विषमता हो सकती है (यानी, जनसंख्या का विचरण विभिन्न स्तरों पर अलग-अलग होता है ), और आउटलेर्स की उपस्थिति∑(ei−e¯)2/NNx(यानी, कि एक दिया अवशिष्ट पूरी तरह से एक अलग आबादी से तैयार है)। लगभग निश्चित रूप से, व्यवहार में, आप उस आबादी के विचरण का अनुमान लगाने में सक्षम नहीं होंगे, जहां से एक बाहरी रूपरेखा तैयार की गई थी, लेकिन फिर भी, सिद्धांत में, इसका विचरण होता है। मुझे इन पंक्तियों के साथ कुछ संदेह है कि लेखकों के दिमाग में क्या था, हालांकि, मुझे ध्यान देना चाहिए कि मैंने उस पुस्तक को नहीं पढ़ा है।
अद्यतन: प्रश्न के पुन : निर्धारण पर, मुझे संदेह है कि जिस तरह से एक बिंदु का -value फिट प्रतिगमन रेखा को प्रभावित करता है, और इस तरह उस बिंदु के साथ जुड़े अवशिष्ट के मूल्य का उल्लेख किया जा सकता है । यहाँ समझदारी का प्रमुख लाभ है । मैं यहाँ अपने उत्तर में इन विषयों पर चर्चा करता हूँ: व्याख्या करना प्लॉट .lm () । x