प्रतिगमन विश्लेषण में मानकीकृत अवशिष्ट को कैसे समझा जाए?


9

उदाहरण के अनुसार प्रतिगमन विश्लेषण के अनुसार , अवशिष्ट प्रतिक्रिया और अनुमानित मूल्य के बीच का अंतर है, फिर यह कहा जाता है कि प्रत्येक अवशिष्ट का अलग-अलग विचरण होता है, इसलिए हमें मानकीकृत अवशिष्टों पर विचार करने की आवश्यकता है।

लेकिन विचरण मानों के समूह के लिए है, किसी एक मान का विचरण कैसे हो सकता है?


2
इसकी लिंक प्रदान करने के लिए यह सीधे पाठ्यपुस्तक को उद्धृत करने में मदद करेगा (या यदि यह ऑनलाइन उपलब्ध है)। बहुत कुछ खो सकता है अगर एक भी शब्द क्रम से या संदर्भ से बाहर ले जाए। (उदाहरण के लिए, बच आमतौर पर भविष्यवाणी और प्रतिक्रिया, नहीं दूसरी तरह के आसपास के बीच अंतर के रूप में परिभाषित कर रहे हैं।)
whuber

एकल यादृच्छिक चर में भिन्नताएं होती हैं। अवशिष्ट यादृच्छिक चर हैं - वे डेटा के कार्य हैं। तो, एकल अवशिष्ट (मानकीकृत या नहीं) के संस्करण हैं।
अतिथि

#whuber पाठ्यपुस्तक "Regression.Analysis.by.Example", पृष्ठ, 89 है। इसमें कई तरह के अवशेषों पर चर्चा की गई। साधारण अवशिष्ट प्रतिक्रिया-भविष्यवाणी है। @guest "एकल यादृच्छिक चर में भिन्नताएं होती हैं", यह वही है जो मुझे समझ में नहीं आता है, चर एक नमूने के लिए एक संपत्ति है, यह नहीं है? नमूने में एकल मान (जैसे अवशिष्ट) का भिन्नता क्यों है?
ccshao

क्या पुस्तक में एक लेखक है ...? यह आमतौर पर खोजने में आसान बनाता है। मुझे लगता है कि आप नमूना विचरण और जनसंख्या विचरण को भ्रमित कर रहे हैं। प्रयोग किए जाने से पहले अवशिष्ट अज्ञात है। प्रतिक्रिया यादृच्छिक है और इसलिए अवशिष्ट है, क्योंकि यह प्रतिक्रिया का एक कार्य है। जब हम अवशिष्ट के विचरण की बात करते हैं, तो हम अंतर्निहित यादृच्छिक चर के विचरण के बारे में बात करते हैं।
10

असुविधा के लिए खेद है, लेखक SAMPRIT CHATTEFUEE और ALI S. HADI हैं, उदाहरण के लिए प्रतिगमन विश्लेषण, चौथा संस्करण।
ccshao

जवाबों:


9

मैं कहूंगा कि एक व्यक्तिगत संख्या (जैसे कि एक अवशिष्ट), जिसके परिणामस्वरूप संभाव्यता वितरण से एक यादृच्छिक ड्रा होता है, एक वास्तविक मूल्य है , न कि एक यादृच्छिक चर । इसी तरह, मैं यह कहूंगा कि आपके डेटा और आपके मॉडल से गणना किए गए अवशिष्टों का सेट , वास्तविक मूल्यों का एक सेट है। संख्याओं के इस सेट को एक अंतर्निहित वितरण ~ से स्वतंत्र ड्रॉ के रूप में परिकल्पित किया जा सकता है । (हालांकि दुर्भाग्य से, यहां कई अतिरिक्त जटिलताएं हैं। उदाहरण के लिए, आपके पास वास्तव मेंNe=yy^ϵN(μ,σ2)Nजानकारी के स्वतंत्र टुकड़े, क्योंकि अवशिष्ट, , को दो शर्तों को पूरा करना चाहिए: , और ) eei=0xiei=0

अब, कुछ संख्याओं को देखते हुए, वे अवशिष्ट हों या जो भी हों, यह निश्चित रूप से सच है कि उनके पास एक भिन्नता, , लेकिन यह है। जिस चीज की हम परवाह करते हैं, वह डेटा जनरेटिंग प्रक्रिया (उदाहरण के लिए, जनसंख्या वितरण के विचरण का अनुमान लगाने) के बारे में कुछ कहने में सक्षम है। पूर्ववर्ती सूत्र का उपयोग करते हुए, हम को स्वतंत्रता के अवशिष्ट डिग्री के साथ बदलकर एक अनुमान दे सकते हैं , लेकिन यह एक अच्छा अनुमान नहीं हो सकता है। यह एक ऐसा विषय है जो बहुत तेजी से बहुत जटिल हो सकता है, लेकिन कुछ संभावित कारणों में विषमता हो सकती है (यानी, जनसंख्या का विचरण विभिन्न स्तरों पर अलग-अलग होता है ), और आउटलेर्स की उपस्थिति(eie¯)2/NNx(यानी, कि एक दिया अवशिष्ट पूरी तरह से एक अलग आबादी से तैयार है)। लगभग निश्चित रूप से, व्यवहार में, आप उस आबादी के विचरण का अनुमान लगाने में सक्षम नहीं होंगे, जहां से एक बाहरी रूपरेखा तैयार की गई थी, लेकिन फिर भी, सिद्धांत में, इसका विचरण होता है। मुझे इन पंक्तियों के साथ कुछ संदेह है कि लेखकों के दिमाग में क्या था, हालांकि, मुझे ध्यान देना चाहिए कि मैंने उस पुस्तक को नहीं पढ़ा है।

अद्यतन: प्रश्न के पुन : निर्धारण पर, मुझे संदेह है कि जिस तरह से एक बिंदु का -value फिट प्रतिगमन रेखा को प्रभावित करता है, और इस तरह उस बिंदु के साथ जुड़े अवशिष्ट के मूल्य का उल्लेख किया जा सकता है । यहाँ समझदारी का प्रमुख लाभ है । मैं यहाँ अपने उत्तर में इन विषयों पर चर्चा करता हूँ: व्याख्या करना प्लॉट .lm ()x


1
धन्यवाद! उत्तोलन वह चीज है जिसे मैं पहले नहीं समझता। डेटा के लिए कोई या थोड़ा प्रतिगमन प्रभाव नहीं है, जिसमें एवीजी (एक्स) के करीब x है, इस प्रकार उच्च विचरण।
ccshao
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.