विचरण और माध्य चुकता त्रुटि के बीच अंतर क्या है?


27

मुझे आश्चर्य है कि यह पहले नहीं पूछा गया है, लेकिन मैं आँकड़े.स्टैकएक्सचेंज पर सवाल नहीं खोज सकता।

यह सामान्य रूप से वितरित नमूने के विचरण की गणना करने का सूत्र है:

(XX¯)2n1

यह एक सरल रेखीय प्रतिगमन में टिप्पणियों की औसत चुकता त्रुटि की गणना करने का सूत्र है:

(yiy^i)2n2

इन दो सूत्रों के बीच क्या अंतर है? एकमात्र अंतर जो मैं देख सकता हूं कि MSE का उपयोग करता है । तो अगर यह एकमात्र अंतर है, तो उन्हें दोनों भिन्नताओं के रूप में क्यों नहीं, बल्कि स्वतंत्रता के विभिन्न अंशों के साथ देखें?n2


यहाँ विकिपीडिया पृष्ठ के बारे में क्या है जो स्पष्ट नहीं है?
TrynnaDoStat

3
मतलबी औसत से टिप्पणियों के चुकता विचलन का औसत है। इसके विपरीत एमएसई सही मूल्यों से भविष्यवाणियों के चुकता विचलन का औसत है।
random_guy

3
"विचरण" और "माध्य चुकता त्रुटि" दोनों के कई सूत्र और अलग-अलग अनुप्रयोग हैं। अपने प्रश्न को स्पष्ट करने के लिए, क्या आप (ए) बता सकते हैं कि आप इन अवधारणाओं को किस तरह के डेटा पर लागू कर रहे हैं और (बी) उनके लिए फॉर्मूले दे सकते हैं? (यह संभव है कि आप अपने प्रश्न का उत्तर भी पता चल जाएगा ऐसा करने से।)
whuber

6
वहाँ एक अधिक सामान्य सूत्र, जो दोनों के विशेष मामले हैं है: जहां प्राप्त करने में अनुमानित पैरामीटर की संख्या हैi(yiy^i)2nppy^
Glen_b -Reinstate मोनिका

@Glen_b क्या आप इस सामान्य सूत्र पर अधिक जानकारी के लिए संदर्भ प्रदान कर सकते हैं?
trianta2

जवाबों:


28

ओएलएस के लिए आपने जो लिखा है, उसका मतलब चुकता त्रुटि कुछ छिपा रही है:

in(yiy^i)2n2=in[yi(β^0+β^xxi)]2n2

ध्यान दें कि अंश और दोनों के एक फ़ंक्शन पर बैठता है , इसलिए आप प्रत्येक चर के लिए स्वतंत्रता की एक डिग्री खो देते हैं, इसलिए । नमूना विचरण के लिए सूत्र में, अंश एकल चर का एक कार्य है, इसलिए आप अस्वीकृति में सिर्फ एक डिग्री की स्वतंत्रता खो देते हैं।yxn2

हालाँकि, आप ध्यान देने योग्य हैं कि ये वैचारिक रूप से समान मात्राएँ हैं। नमूना विचरण नमूना माध्य (वर्ग इकाइयों में) के आसपास डेटा के प्रसार को मापता है, जबकि MSE नमूना प्रतिगमन रेखा के आसपास डेटा के ऊर्ध्वाधर प्रसार को मापता है (चुकता ऊर्ध्वाधर इकाइयों में)।


@ बाम्बे हे! ध्यान देने के लिए धन्यवाद। क्या कोई आधिकारिक सीवी स्टाइल गाइड है जिसने इस संपादन को प्रेरित किया है? अगर ऐसा है तो मैं इसे सीखना चाहता हूँ। यदि नहीं, तो ठीक है, ग्लेन_ बी ने एक बार मुझे अपनी व्यक्तिगत शैली की वरीयताओं के साथ उपनिवेश होने के लिए ठीक ही कहा था और दूसरों को क्यूएस और अस के लिए संपादित किया था। तुम क्या सोचते हो? (और मैं इसे एक कॉलेजियम लहजे में पूछता हूं: मुझे लगता है कि आपका संपादन कुछ जोड़ता है। बस हमारे संपादन मूल्यों को बेहतर ढंग से समझना चाहता है।)
एलेक्सिस

1
मुझे नहीं लगता कि इस सुझाव को बनाने वाला कोई आधिकारिक सीवी स्टाइल गाइड है, लेकिन लाटेक्स में इनलाइन फॉर्मूला (एक डॉलर चिह्न के साथ चिह्नित) हैं जो सीधे पाठ के ब्लॉक में दिए गए हैं, और प्रदर्शित सूत्र (दो डॉलर के चिह्न के साथ चिह्नित) हैं कि एक अलग लाइन पर गाया जाता है। प्रदर्शित सूत्र विभिन्न लेआउट का उपयोग करते हैं। आपका सूत्र मूल रूप से एक अलग रेखा पर था लेकिन एक डॉलर के चिह्न के साथ चिह्नित किया गया था; मुझे नहीं लगता कि इससे कोई मतलब है। हालाँकि, आप व्यक्तिगत प्राथमिकताओं के बारे में सही हैं, इसलिए बेझिझक माफी माँग लें। मेरे द्वारा संपादित किए जाने का कारण यह था कि मैं वैसे भी क्यू में एक टाइपो को ठीक कर रहा था।
अमीबा का कहना है कि मोनिका

यदि प्रतिगमन समस्या में कोई अवरोधक शब्द नहीं है, तो MSE की स्वतंत्रता की डिग्री समान है, जैसे बजाय विचरण सूत्र में हैβ0n1n2
develarist

1

प्रसरण सूत्र में, नमूना माध्य जनसंख्या माध्य का अनुमान लगाता है। नमूना माध्य की गणना डेटा बिंदुओं के साथ दिए गए नमूने के लिए की जाती है । नमूना माध्य को जानना हमें केवल स्वतंत्र डेटा बिंदुओं के साथ छोड़ देता है क्योंकि वें डेटा बिंदु नमूना माध्य से विवश है, इसलिए ( ) अंश में सूत्र में स्वतंत्रता (DOF) की डिग्री।nn1nn1

MSE फॉर्मूले में y ( ) का अनुमानित मूल्य प्राप्त करने के लिए , हमें दोनों (यानी इंटरसेप्ट) के साथ-साथ (यानी ढलान) तो हम 2 डीओएफ खो देते हैं, और यही कारण है कि (=β0+β1×xβ0β1n2

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.