कच्चे अवशिष्ट बनाम मानकीकृत अवशिष्ट बनाम छात्र अवशिष्ट - क्या उपयोग करने के लिए कब?


31

यह एक समान प्रश्न लगता है और कई प्रतिक्रियाएं नहीं मिली हैं।

कुक के डी जैसे परीक्षाओं को स्वीकार करना, और एक समूह के रूप में केवल अवशिष्टों को देखना, मैं इस बात में दिलचस्पी रखता हूं कि अन्य लोग किस तरह से अवशिष्ट का उपयोग करते हैं, जो अच्छाई के लिए फिट होने का आकलन करते हैं। मैं कच्चे अवशेषों का उपयोग करता हूं:

  1. एक क्यूक्यू-साजिश में, सामान्यता का आकलन करने के लिए
  2. ( बनाम) hetereoscedasticity और (बी) धारावाहिक autocorrelation के नेत्रगोलक जाँच के लिए बनाम अवशिष्ट के एक स्कैल्पलॉट में।y

बनाम रेजीड्यूल्स की साजिश रचने के लिए लिए मूल्यों की जांच करें जहां आउटलेयर हो सकते हैं, मैं छात्र के अवशेषों का उपयोग करना पसंद करता हूं । मेरी प्राथमिकता का कारण यह है कि यह आसानी से देखने की अनुमति देता है कि किन अवशेषों पर -values ​​समस्याग्रस्त हैं, हालांकि मानकीकृत अवशिष्ट एक अत्यंत समान परिणाम प्रदान करते हैं। मेरा सिद्धांत जिस पर प्रयोग किया जाता है वह यह है कि यह इस पर निर्भर करता है कि किस विश्वविद्यालय में गया था।yyy

क्या यह इसी तरह है कि दूसरे कैसे अवशिष्ट का उपयोग करते हैं? क्या अन्य लोग सारांश आंकड़ों के साथ संयोजन में ग्राफ़ की इस संख्या का उपयोग करते हैं?


3
छात्र अवशेष अवशिष्टों का पता लगाने में निश्चित रूप से बेहतर हैं, और, शायद, विषमलैंगिकता निरीक्षण में थोड़ा बेहतर है। अन्य प्रयोजनों के लिए, यह मेरे लिए कोई फर्क नहीं पड़ता है कि कौन से अवशिष्ट का उपयोग करना है।
tnnphns

एक सवाल पर ध्यान आकर्षित करने के लिए, मिशेल, या इसकी स्थिति (जैसे सीडब्ल्यू) में बदलाव के लिए पूछें, कृपया प्रश्न के नीचे "ध्वज" लिंक का पालन करें। यह स्वचालित रूप से सभी मध्यस्थों को सूचित करेगा। प्रश्नों, टिप्पणियों, या उत्तरों में एम्बेड अनुरोध हिट-या-मिस है क्योंकि यह इस आशा पर निर्भर करता है कि एक मध्यस्थ (या अन्य उच्च प्रतिनिधि उपयोगकर्ता) वास्तव में इसे उचित समय के भीतर पढ़ेगा!
whuber

@whuber आह, देखिए मुझे लगा कि आप में से एक इसे अंततः पढ़ेगा। :) झंडे का उपयोग करने पर टिप के लिए धन्यवाद।
मिशेल

1
हाय @ttnphns वे बेहतर क्यों होंगे? विशेष रूप से, छात्रों को मानकीकृत से बेहतर क्यों बनाया जाएगा? (मैं वास्तव में कभी नहीं जवाब यहाँ से जाना जाता है)
को पुनः स्थापित मोनिका - पीटर Flom

4
@ पेटर, स्टूडेंट रेजिडेंशियल OLS फिटिंग एल्गो द्वारा "विकृत" कम हैं और "त्रुटियों" की सैद्धांतिक धारणा के करीब हैं । उन्हें फिट लाइन के विभिन्न क्षेत्रों में सीधे तुलना की जा सकती है, अगर एक बिंदु एक बाहरी है, तो निर्णय में थान बेहतर होते हैं।
tnnphns

जवाबों:


8

यह शब्दावली पर स्पष्टीकरण के रूप में इतना जवाब नहीं है। आपका प्रश्न कच्चे, स्टैंडराइज्ड और छात्रों के अवशेषों के बारे में पूछता है। हालांकि, यह अधिकांश सांख्यिकीविदों द्वारा उपयोग की जाने वाली शब्दावली नहीं है, हालांकि मैं आपके क्लास नोट्स को नोट करता हूं कि यह है।

कच्चा: जैसा आपके पास है।

मानकीकृत: यह वास्तव में अवशेषों के वास्तविक मानक विचलन द्वारा विभाजित कच्चे अवशेष हैं। जैसा कि सही मानक विचलन शायद ही कभी ज्ञात हो, एक मानकीकृत अवशिष्ट लगभग कभी उपयोग नहीं किया जाता है।

आंतरिक रूप से विद्यार्थी: क्योंकि अवशिष्टों का सही मानक विचलन आमतौर पर ज्ञात नहीं है, इसके बजाय अनुमानित मानक विचलन का उपयोग किया जाता है। यह एक अंतर-छात्रीय अवशिष्ट है, और इसे आप मानकीकृत कहते हैं।

बाहरी रूप से छात्र: आंतरिक रूप से छात्र के अवशिष्ट के समान, सिवाय इसके कि अवशिष्ट के मानक विचलन का अनुमान एक प्रतिगमन से विचाराधीन है।

पियरसन: अवशिष्ट के बजाय प्रतिक्रिया चर (y चर) के मानक विचलन द्वारा विभाजित कच्चे अवशिष्ट। आपके पास यह सूचीबद्ध नहीं है।

"एक को छोड़ दो": एक औपचारिक नाम नहीं है, लेकिन यह क्लास नोट्स के समान है।

स्टैंडराइज्ड "लीव आउट वन": का भी औपचारिक नाम नहीं है, लेकिन यह वह नहीं है, जो क्लास नोट्स छात्रों को कहते हैं।

सूत्रों का कहना है:

  1. वही विकि लिंक जो आपके पास छात्र के अवशिष्टों के बारे में है ("एक छात्र अवशिष्ट अवशिष्ट है जो अपने मानक विचलन के अनुमान से अवशिष्ट के विभाजन के परिणामस्वरूप होता है")

  2. एसएएस में अवशिष्ट गणना के लिए प्रलेखन


2
+1 निश्चित रूप से कुछ सांख्यिकीविदों ने ओपी के प्रश्न में शर्तों का उपयोग किया है (और हमेशा समान शब्दों का उपयोग करके दूसरों के साथ पूरी तरह से लगातार नहीं)। मुझे लगता है कि आपके द्वारा उपयोग की जाने वाली शर्तें अधिक सामान्य हो रही हैं, लेकिन मुझे यकीन नहीं है कि हम किस आधार पर सांख्यिकीविदों के बीच उनके अपेक्षाकृत दुनिया भर में उपयोग का अनुमान लगा सकते हैं - उदाहरण के लिए, जरूरी नहीं कि मदद करें क्योंकि औसत सांख्यिकीविद् सक्रिय रूप से नहीं होंगे। प्रकाशित करने। आप सही हो सकते हैं - लेकिन हमें कैसे पता चलेगा? [यदि आप फिर से संपादित करते हैं, तो आप "मानकीकृत" के साथ अंत में "
स्टैंडराइज्ड

2

पुन: भूखंड,

ओवरफिटिंग जैसी एक चीज है, लेकिन ओवरप्लोटिंग वास्तव में बहुत नुकसान नहीं कर सकता है, खासकर निदान चरण में। एक मानकीकृत सामान्य संभावना प्लॉट आपके QQ- प्लॉट के बगल में चोट नहीं पहुंचा सकता है। मुझे वितरण के मध्य का आकलन करना बेहतर लगता है।

पुन: अवशिष्ट,

मैं मसौदा चरण में दोनों मानकीकृत और छात्र अवशिष्टों को चलाता हूं और आमतौर पर मानकीकृत लोगों को कोडिंग करता हूं। मुझे नहीं पता कि अन्य लोग वास्तव में क्या चलाते हैं, क्योंकि डायग्नोस्टिक्स को वास्तव में प्रतिकृति सामग्री में कोडित किया जाता है जो मुझे ऑनलाइन मिलता है।

डायग्नोस्टिक्स,

एक रेखीय मॉडल के लिए, मैं आमतौर पर विचरण मुद्रास्फीति कारक ( vifस्टाटा में कमांड के साथ ) और कुछ समरूपता परीक्षण (जैसे स्टाटा में कमांड के साथ ) जोड़ता हूं hettest, साथ ही साथ नेस्ट रिग्रेशन वाले मॉडल अपघटन की जांच करने के लिए कि क्या कोई मतलब है ।R2

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.