मतलब चुकता त्रुटि और वर्गों के अवशिष्ट योग


31

विकिपीडिया की परिभाषाओं को देखते हुए:

यह मुझे लगता है कि

MSE=1NRSS=1N(fiyi)2

जहां नमूनों की वह संख्या है और के बारे में हमारी अनुमान है ।Nfiyi

हालाँकि, विकिपीडिया के किसी भी लेख में इस संबंध का उल्लेख नहीं है। क्यूं कर? क्या मैं कुछ भूल रहा हूँ?


6
मुझे पता है कि यह बेकार और शत्रुतापूर्ण है, लेकिन वे इसका उल्लेख नहीं करते क्योंकि यह स्पष्ट है। इसके अलावा, आप यहाँ थोड़ा सावधान रहना चाहते हैं। आमतौर पर, जब आप वास्तविक अनुभवजन्य काम में एक एमएसई मुठभेड़ यह नहीं है से विभाजित लेकिन से विभाजित जहां संख्या कुछ प्रतिगमन मॉडल में दाएँ हाथ की ओर चर के (अवरोधन सहित) है। RSSNRSSNKK
बिल

10
@ बिल: ठीक है, यह वास्तव में उस तरह का संबंध है जो आमतौर पर विकिपीडिया पर लेख से जुड़ा होता है। स्वतंत्रता की डिग्री के बारे में आपकी बात यह भी बताती है कि यह बिल्कुल स्पष्ट नहीं है और निश्चित रूप से उल्लेख के लायक है।
bluenote10

2
@ बिल: सहमत, हालांकि स्पष्टता बहुत व्यक्तिपरक है। आंकड़े / मशीन सीखने का ग्रे क्षेत्र अंकन नरक से अटे पड़ा है और इसलिए यह स्पष्ट होना अच्छा है।
रौनक जूल

जवाबों:


30

वास्तव में यह विकिपीडिया में मीन चुकता त्रुटि के प्रतिगमन खंड में उल्लिखित है :

प्रतिगमन विश्लेषण में, शब्द का अर्थ चुकता त्रुटि का उपयोग कभी-कभी त्रुटि विचरण के निष्पक्ष अनुमान को संदर्भित करने के लिए किया जाता है: स्वतंत्रता की डिग्री की संख्या से विभाजित वर्गों का अवशिष्ट योग।

आप यहां कुछ संकेत भी पा सकते हैं: आंकड़ों में त्रुटियां और अवशिष्ट। यह कहता है कि अभिव्यक्ति का मतलब चुकता त्रुटि के विभिन्न मामलों में अलग-अलग अर्थ हो सकते हैं, जो कभी-कभी मुश्किल होता है।


4

लेकिन इस बात का ध्यान रखें कि कभी-कभी Sumared of Squared Erros (SSE) और Squares (RSS) के Residue Sum का भी उपयोग किया जाता है, इस प्रकार पाठकों को भ्रमित करते हैं। उदाहरण के लिए, रेखीय प्रतिगमन के बारे में अधिक जानकारी के लिए इस Url: https://365datascience.com/sum-squares/ की जाँच करें ।

विचारों के सांख्यिकीय बिंदु से कड़ाई से बोलते हुए, त्रुटियाँ और अवशेष पूरी तरह से अलग अवधारणाएं हैं। त्रुटियां मुख्य रूप से वास्तविक देखे गए नमूना मूल्यों और आपके अनुमानित मूल्यों के बीच अंतर को संदर्भित करती हैं, और ज्यादातर रूट मीट स्क्वायर्ड एरर्स (आरएमएसई) और मीन एब्सोल्यूट एरर्स (एमएई) जैसे सांख्यिकीय मेट्रिक्स में उपयोग की जाती हैं। इसके विपरीत, अवशेष रेखीय प्रतिगमन से निर्भर चर और अनुमानों के बीच अंतर को विशेष रूप से संदर्भित करते हैं।


0

अगर हम MSE को RMSE का वर्गबोध मानते हैं तो मुझे यह सही नहीं लगता। उदाहरण के लिए, आपके पास भविष्यवाणियों और टिप्पणियों पर सैंपल किए गए डेटा की एक श्रृंखला है, अब आप एक रैखिक पुनर्मिलन करने की कोशिश करते हैं: अवलोकन (ओ) = ए + बी एक्स भविष्यवाणी (पी)। इस मामले में, MSE O और P के बीच वर्गीय अंतर का योग है और नमूना आकार N द्वारा विभाजित है।

लेकिन अगर आप यह मापना चाहते हैं कि रेखीय प्रतिगमन कैसे करता है, तो आपको मीन स्क्वेरड रेसिड्यू (MSR) की गणना करने की आवश्यकता है। उसी स्थिति में, यह सबसे पहले वर्गों (अवतारों) के अवशिष्ट योग की गणना करेगा, जो कि वास्तविक अवलोकन मूल्यों और रेखीय प्रतिगमन से प्राप्त अनुमानित टिप्पणियों के बीच वर्गीय अंतर के योग से मेल खाता है। इसके बाद, इसे आरएसएस द्वारा N-2 से विभाजित किया जाता है। MSR प्राप्त करें।

सीधे शब्दों में, उदाहरण में, एमएसई का आरएसएस / एन का उपयोग करके अनुमान नहीं लगाया जा सकता है क्योंकि आरएसएस घटक की गणना करने के लिए उपयोग किए जाने वाले घटक के लिए अब समान नहीं है।


1
मुझे यह उत्तर समझ में नहीं आता है।
माइकल आर। चेरनिक

देखें, नमूना भविष्यवाणी और प्रेक्षित डेटा मूल्यों के उल्लिखित उदाहरण के आधार पर, रैखिक प्रतिगमन स्थापित किया गया है: अवलोकन (ओ) = ए + बी एक्स भविष्यवाणी (पी) (ए, बी क्रमशः अवरोधन और ढलान हैं)। इस स्थिति में, MSE = Σ (OP) ^ 2 / n, जहां OP (OP) ^ 2 स्क्वेयरेड एरोस (SSE) का योग है और n नमूना आकार है। हालाँकि, मीन स्क्वेरड रेसिड्यूज़ (MSR) = O (OO ^) ^ 2 / n-2, जहाँ ´ (OOΣ) ^ 2 वर्गों (RSS) के रेसिड्यू सम के बराबर है और O` = a + b + X X P MSR और RSS का उपयोग मुख्य रूप से रैखिक प्रतिगमन के समग्र महत्व के परीक्षण के लिए किया जाता है। यह भी ध्यान दें, SSE = व्यवस्थित इरोस (SE) + RSS, जहाँ SE = ´ (PO´) ^ 2
Dr.CYY
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.