हम "अवशिष्ट मानक त्रुटि" क्यों कहते हैं?


14

एक मानक त्रुटि एक पैरामीटर लिए एक अनुमानक के अनुमानित मानक विचलन है । θ θσ^(θ^)θ^θ

अवशिष्ट के अनुमानित मानक विचलन को "अवशिष्ट मानक त्रुटि" क्यों कहा जाता है (उदाहरण के लिए, आर के summary.lmफ़ंक्शन के आउटपुट में ) और "अवशिष्ट मानक विचलन" नहीं? हम यहाँ एक मानक त्रुटि से किस पैरामीटर का अनुमान लगाते हैं?

क्या हम प्रत्येक अवशिष्ट को "उसके" त्रुटि शब्द के लिए एक अनुमानक के रूप में मानते हैं और इन सभी अनुमानकों की "पूलित" मानक त्रुटि का अनुमान लगाते हैं?


6
मुझे लगता है कि यह एक R चीज है। मुझे नहीं लगता कि अन्य सॉफ़्टवेयर आवश्यक रूप से उपयोग करते हैं, जो कि फॉन्टिंग, और पाठ्यपुस्तकों में 'अवशिष्ट मानक विचलन' आम है। मेरे पास कोई उत्तर नहीं है, लेकिन मुझे हमेशा लगा कि यह अजीब था कि आर उस वाक्यांश का उपयोग करता है।
गंग -

@ गुंग: यह स्पष्टीकरण हो सकता है! जब उद्धरणों में "अवशिष्ट मानक त्रुटि" को देखते हुए मुझे बिना उद्धरणों के केवल 0.1% हिट मिलते हैं ...
माइकल एम

यदि आप चाहें तो मैं इसे (गैर-) उत्तर के रूप में रख सकता हूं।
गंग -

1
@gung यह हास्यास्पद है कि विशिष्ट सॉफ़्टवेयर का उपयोग आपकी सोच को कैसे आकार देता है: मैं इसे कभी भी "अवशिष्ट एसडी" नहीं कहूंगा - अवशेष डेटा नहीं हैं, लेकिन त्रुटियां हैं, इसलिए अवशिष्ट त्रुटि उचित नाम लगती है। लेकिन अगर आप इसके बारे में सोचते हैं तो यह वास्तव में एक आर-चीज़ लगती है।
टिम

2
@ समय, इसे सही ढंग से त्रुटियों के मानक विचलन का अनुमान माना जा सकता है , लेकिन अवशिष्ट तकनीकी रूप से स्वयं त्रुटियां नहीं हैं। न ही यह त्रुटि एसडी के मानक त्रुटि है, जो इसके लायक है।
गंग -

जवाबों:


12

मुझे लगता है कि phrasing R के summary.lm()आउटपुट के लिए विशिष्ट है । ध्यान दें कि अंतर्निहित मूल्य को वास्तव में "सिग्मा" ( summary.lm()$sigma) कहा जाता है । मुझे नहीं लगता कि अन्य सॉफ़्टवेयर आवश्यक रूप से अवशिष्ट के मानक विचलन के लिए उस नाम का उपयोग करते हैं। इसके अलावा, टंकण 'अवशिष्ट मानक विचलन' पाठ्यपुस्तकों में आम है, उदाहरण के लिए। मुझे नहीं पता कि आर के summary.lm()आउटपुट में उपयोग की जाने वाली फंतासिंग कैसे हुई , लेकिन मैंने हमेशा सोचा कि यह अजीब था।


कैसे summary.lm(reg)$sigmaअलग है sd(reg$residuals)?
हवाई

3
@ AndréTerra, स्वतंत्रता की सही डिग्री n - p है, जिसे सारांश उपयोग करता है। sd var का उपयोग करता है जो n - 1 डिग्री स्वतंत्रता का उपयोग करता है। यदि आप मैन्युअल रूप से n - p से विभाजित होने वाले अवशिष्टों के मानक विचलन की गणना करते हैं, तो आपको वही उत्तर मिलेगा जो सारांश प्रदान करता है।
जादु

3
गोबर को नष्ट करने के लिए, मैं आर के प्रलेखन से उद्धृत करता हूं stats::sigma: मिथ्या नाम "अवशिष्ट मानक त्रुटि" बहुत सारे आर (और एस) का हिस्सा रहा है जो आसानी से वहां परिवर्तित हो सकते हैं।
NRH

2

मेरे अर्थमिति प्रशिक्षण से, इसे "अवशिष्ट मानक त्रुटि" कहा जाता है क्योंकि यह वास्तविक "अवशिष्ट मानक विचलन" का अनुमान है। इस संबंधित प्रश्न को देखें जो इस शब्दावली को पुष्ट करता है।

अवशिष्ट मानक त्रुटि के लिए एक Google खोज भी बहुत हिट दिखाती है, इसलिए यह किसी भी तरह से एक विषमता नहीं है। मैंने उद्धरण के साथ दोनों शब्दों की कोशिश की, और दोनों लगभग 60,000 बार दिखा।


दिलचस्प। लेकिन आप किसी भी यादृच्छिक चर के मानक विचलन का अनुमान क्यों कहेंगे (जैसे त्रुटि शब्द; और विशिष्ट अनुमानक नहीं) "मानक त्रुटि"?
माइकल एम।

मेरी सोच है कि हमें अनुमान के लिए एक नाम होना चाहिए (वास्तविक मूल्य से अलग करने के लिए), कोई भी नाम दूसरे के रूप में अच्छा है। लेकिन निश्चित रूप से व्युत्पत्ति के बारे में अधिक जानकार कोई बेहतर कारण प्रस्तुत कर सकता है। ध्यान दें कि निश्चित रूप से गुणांक मानक त्रुटि के साथ एक समानांतर है, जो गुणांक के अनुमान के मानक विचलन का अनुमान है।
हेइज़ेनबर्ग

0

सीधे शब्दों में कहें, नमूना की मानक त्रुटि इस बात का अनुमान है कि नमूना का मतलब जनसंख्या के माध्य से कितनी दूर होने की संभावना है, जबकि नमूना का मानक विचलन वह डिग्री है जिसमें नमूना के भीतर के व्यक्ति नमूना मतलब से भिन्न होते हैं।

मानक त्रुटि - विकिपीडिया, मुक्त विश्वकोश


6
यह सच है, लेकिन वास्तव में इस सवाल का जवाब नहीं है। आर को "अवशिष्ट मानक त्रुटि" कहते हैं, "यह अनुमान नहीं है कि नमूना माध्य जनसंख्या के माध्य से कितनी दूर होने की संभावना है"।
गंग -

0

एक फिट प्रतिगमन मॉडल बिंदु अनुमान भविष्यवाणियों को उत्पन्न करने के लिए मापदंडों का उपयोग करता है जो अवलोकन प्रतिक्रियाओं के साधन हैं यदि आप एक ही XX मूल्यों के साथ अध्ययन को अनंत बार मानने के लिए थे ( जब रैखिक मॉडल सच है )।

इन अनुमानित मूल्यों और मॉडल को फिट करने के लिए इस्तेमाल किए जाने वाले लोगों के बीच के अंतर को " रेजिड्यूल्स " कहा जाता है , जो डेटा संग्रह प्रक्रिया की नकल करते समय, 0 के साथ यादृच्छिक चर के गुण होते हैं। इसके बाद देखे गए अवशेषों का उपयोग इन मूल्यों में परिवर्तनशीलता का अनुमान लगाने और मापदंडों के नमूना वितरण का अनुमान लगाने के लिए किया जाता है।

ध्यान दें:

जब अवशिष्ट मानक त्रुटि ठीक 0 होती है तो मॉडल डेटा को पूरी तरह से फिट करता है (ओवरफिटिंग के कारण होने वाली संभावना)।

यदि अवशिष्ट मानक त्रुटि को बिना शर्त प्रतिक्रिया में परिवर्तनशीलता से महत्वपूर्ण रूप से भिन्न नहीं दिखाया जा सकता है, तो यह बताने के लिए कम साक्ष्य है कि रैखिक मॉडल में कोई भी अनुमानित क्षमता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.