RMSE बनाम निर्धारण का गुणांक


21

मैं एक भौतिक मॉडल का मूल्यांकन कर रहा हूं और जानना चाहूंगा कि मैं यहां कौन सी विधियों का उपयोग कर रहा हूं (आरएमएसई और निर्धारण के गुणांक के बीच)

समस्या इस प्रकार है: मेरे पास एक फ़ंक्शन है जो इनपुट मान x, लिए भविष्यवाणियों को आउटपुट करता है । मेरे पास उस मान के लिए वास्तविक अवलोकन भी है जिसे मैं कहता ।yx¯=f(x)yx

मेरा सवाल यह है कि आरएमएसई या के पेशेवरों और विपक्ष क्या हैं । मैंने उन दोनों को कागजों में इस्तेमाल होने वाली समस्या के लिए देखा है, जिन पर मैं काम कर रहा हूं।R2

जवाबों:


16

मैंने उन दोनों का उपयोग किया है, और बनाने के लिए कुछ बिंदु हैं।

  • Rmse उपयोगी है क्योंकि यह व्याख्या करना सरल है। हर कोई जानता है कि यह क्या है।
  • Rmse सापेक्ष मान नहीं दिखाता है। तो rmse=0.2 , आप विशेष रूप से सीमा पता होना चाहिए α<yx<β । यदि α=1,β=1000 , तो 0.2 एक अच्छा मूल्य है। यदि α=0,β=1 , यह अब इतना अच्छा नहीं लगता है।
  • पिछले दृष्टिकोण के साथ इनलाइन, rmse इस तथ्य को छिपाने का एक अच्छा तरीका है कि जिन लोगों का आपने सर्वेक्षण किया था, या जो माप आपने लिए थे, वे अधिकतर समान हैं (हर किसी ने उत्पाद को 3 सितारों के साथ रेट किया है), और आपके परिणाम अच्छे दिखते हैं क्योंकि डेटा ने आपकी मदद की। यदि डेटा थोड़ा यादृच्छिक था, तो आप अपने मॉडल को बृहस्पति की परिक्रमा करते हुए पाएंगे।
  • सामान्य R 2 के बजाय दृढ़ संकल्प के समायोजित गुणांक का उपयोग करेंR2
  • दृढ़ संकल्प के गुणांक को समझाना मुश्किल है। यहां तक ​​कि क्षेत्र के लोगों को एक फुटनोट टिप की आवश्यकता है जैसे कि \ _ फुटनोट {दृढ़ संकल्प का समायोजित गुणांक एक डेटा सेट में परिवर्तनशीलता का अनुपात है जिसे सांख्यिकीय मॉडल द्वारा समझाया जा सकता है। यह मान दर्शाता है कि मॉडल द्वारा भविष्य के परिणामों की कितनी अच्छी भविष्यवाणी की जा सकती है। न्यूनतम 0, और 1 अधिकतम के रूप में ले सकता है। "R2
  • निर्धारण का गुणांक यह बताने में बहुत सटीक है कि आपका मॉडल कितनी अच्छी तरह से एक घटना की व्याख्या करता है। यदि y x मानों की परवाह किए बिना , तो आपका मॉडल खराब है। मेरा मानना ​​है कि एक अच्छे मॉडल के लिए कट ऑफ प्वाइंट 0.6 से शुरू होता है, और यदि आपके पास 0.7-0.8 के आसपास कुछ है, तो आपका मॉडल बहुत अच्छा है।R2=0.2yx
  • पुनरावृत्ति करने के लिए, कहना है कि, अपने मॉडल के साथ, आप 70% समझा सकते हैं कि वास्तविक डेटा में क्या चल रहा है। बाकी, 30%, कुछ ऐसा है जिसे आप नहीं जानते हैं और आप समझा नहीं सकते हैं। यह शायद इसलिए है क्योंकि वहाँ भ्रमित कारक हैं, या आपने मॉडल के निर्माण में कुछ गलतियाँ की हैं।आर2=0.7
  • कंप्यूटर विज्ञान में, लगभग हर कोई rmse का उपयोग करता है। सामाजिक विज्ञान अधिक बार उपयोग करते हैं।आर2
  • यदि आपको अपने मॉडल में मापदंडों को सही ठहराने की जरूरत नहीं है, तो बस rmse का उपयोग करें। हालांकि, यदि आपको अपने मॉडल का निर्माण करते समय अपने मापदंडों को डालने, हटाने या बदलने की आवश्यकता है, तो आपको यह दिखाने के लिए का उपयोग करने की आवश्यकता है कि ये पैरामीटर डेटा को सबसे अच्छा समझा सकते हैं।आर2
  • यदि आप , R भाषा में कोड का उपयोग करेंगे । इसमें पुस्तकालय हैं, और आप इसे सभी परिणाम देने के लिए डेटा देते हैं।आर2

एक इच्छुक कंप्यूटर वैज्ञानिक के लिए, आंकड़ों के बारे में लिखना रोमांचकारी था। आपका अपना।


8
This value shows how well future outcomes can be predicted by the model- यह बेहद भ्रामक है और सीधे सादे गलत की ओर झुकाव है । इस बात की कोई गारंटी नहीं है कि किसी दिए गए मॉडल में दृढ़ संकल्प का उच्च गुणांक भविष्य के परिणामों की भविष्यवाणी कैसे करेगा।
पैगंबर 60091

5
मुझे लगता है कि " यदि आपका मॉडल खराब हैआर2=0.2 " जैसे कथन हैं , तो " आपका मॉडल बहुत अच्छा हैआर2=0.7-0.8 " सकल संघटन हैं। अगर वास्तविक दुनिया की समस्या के लिए कुछ भी हो, तो 0.8 का एक 2 समस्या पर बहुत अधिक संदेह करेगा ...आर2
usεr11852

3
यदि = 0.2 है, तो yx मानों की परवाह किए बिना, आपका मॉडल खराब है। मेरा मानना ​​है कि एक अच्छे मॉडल के लिए कट ऑफ प्वाइंट 0.6 से शुरू होता है, और यदि आपके पास 0.7-0.8 के आसपास कुछ है, तो आपका मॉडल बहुत अच्छा है। यह बहुत हद तक उस क्षेत्र पर निर्भर करता है जिसमें आप काम कर रहे हैं। कल्पना करें कि आप अगले वर्ष के लिए स्टैक एक्सचेंज प्रासंगिक सूचकांकों की भविष्यवाणी करने की कोशिश करते हैं। आप 0.2 के आर 2 के साथ दुनिया के सबसे अमीर आदमी होंगे । R2R2
जनवरी को जनवरी हैकबर्ग

मैं जैन हैनबर्ग और पैगंबर 60091 से सहमत हूं। आपके उत्तर के भाग निश्चित रूप से गलत हैं और मुझे समझ नहीं आ रहा है कि यह स्वीकृत उत्तर क्यों है और लोग उत्थान कर रहे हैं। वास्तव में इसका मतलब यह है कि लोग अपने मैट्रिक्स का उपयोग कर रहे हैं बिना यह जाने कि उनकी व्याख्या कैसे की जा सकती है ..
कॉर्ड कल्डेमेयर

9

कोई फर्क नहीं पड़ता कि इर्रार माप आप क्या देते हैं, एक परिशिष्ट में अपना पूरा परिणाम वेक्टर देने पर विचार करें। जो लोग आपकी पद्धति के खिलाफ तुलना करना पसंद करते हैं, लेकिन एक अन्य त्रुटि माप पसंद करते हैं, ऐसे मूल्य को आपकी तालिका से प्राप्त कर सकते हैं।

:आर2

  • व्यवस्थित त्रुटियों को प्रतिबिंबित नहीं करता है। कल्पना कीजिए कि आप गोलाकार वस्तुओं की त्रिज्या के बजाय व्यास को मापते हैं। आपके पास 100% की अपेक्षित overestimation है, लेकिन अभी भी एक करीब 1 तक पहुंच सकता है ।आर2

  • पिछली टिप्पणियों से असहमत हैं कि को समझना मुश्किल है। जितना अधिक मूल्य है, उतना ही सटीक आपका मॉडल है, लेकिन इसमें व्यवस्थित त्रुटियों को शामिल किया जा सकता है।आर2

  • सूत्र को समझने में आसान द्वारा व्यक्त किया जा सकता है, जहां आप चुकता अवशिष्ट के योग का अनुपात बनाते हैं और इस तरह से विभाजित करते हैं:

आर2=1-एसएसn=1-Σ(yमैं-yमैं¯)2Σ(yमैं-y¯)2

  • अपने अधिक उन्नत संस्करण में व्यक्त किया जाना चाहिए एक डी जे । यहां अधिक भविष्यवक्ता मॉडल को सजाते हैं। ओवरफिटिंग के खिलाफ अधिक मजबूत होने की उम्मीद है।आरजे2

:आरएस

  • आप केवल एक उच्च परिशुद्धता (एकल लेकिन बड़े आउटलेयर दोनों को भारी दंड देते हैं) और कोई व्यवस्थित त्रुटि नहीं होने से कम तक पहुंच सकते हैं । तो एक तरह से कम R M S E E उच्च R 2 की तुलना में बेहतर गुणवत्ता प्रदान करता है।आरएसआरएसआर2

  • इस नंबर की एक इकाई है और ऐसे लोगों के लिए है जो आपके डेटा से परिचित नहीं हैं और व्याख्या करना आसान नहीं है। यह उदाहरण के लिए डेटा के माध्य से का उत्पादन करने के लिए हो सकता है आर एम एस । सावधान रहें, यह केवल r e l की परिभाषा नहीं है आर एम एस । कुछ लोग माध्य से विभाजित होने के बजाय अपने डेटा की सीमा से विभाजित करना पसंद करते हैं।rel.RMSErel.RMSE

जैसा कि अन्य लोगों ने उल्लेख किया है, विकल्प आपके क्षेत्र और कला की स्थिति पर निर्भर हो सकता है। वहाँ भी तुलना करने के लिए एक बहुत ही स्वीकार्य तरीका है? उसी माप का उपयोग करें जैसा वे करते हैं और आप चर्चा में आसानी से अपने तरीकों के लाभों को सीधे लिंक करने में सक्षम हैं।


7

दोनों रूट-मीन वर्ग त्रुटि (RMSE) और दृढ़ संकल्प के गुणांक ( )R2 अलग है, फिर भी पूरक, जानकारी है कि जब आपके भौतिक मॉडल का मूल्यांकन मूल्यांकन किया जाना चाहिए प्रदान करते हैं। न तो "बेहतर" है, लेकिन कुछ रिपोर्टें विशेष एप्लिकेशन के आधार पर एक मीट्रिक पर अधिक ध्यान केंद्रित कर सकती हैं।

मैं दोनों मीट्रिक के अंतर को समझने के लिए एक बहुत ही सामान्य मार्गदर्शिका के रूप में निम्नलिखित का उपयोग करूंगा:

RMSE आप कैसे पास (या अब तक) पर अपनी भावी मूल्यों वास्तविक डेटा आप मॉडल की कोशिश कर रहे हैं से की भावना देता है। यह विभिन्न अनुप्रयोगों में उपयोगी है जहां आप अपने मॉडल की भविष्यवाणियों की सटीकता और सटीकता को समझना चाहते हैं (जैसे, मॉडलिंग ट्री ऊंचाई)।

पेशेवरों

  1. यह समझना और संवाद करना अपेक्षाकृत आसान है क्योंकि रिपोर्ट किए गए मान उसी इकाइयों में हैं, जिस पर निर्भर चर को मॉडल किया जा रहा है।

विपक्ष

  1. यह बड़ी त्रुटियों के प्रति संवेदनशील है (छोटी भविष्यवाणी त्रुटियों से अधिक बड़ी भविष्यवाणी त्रुटियों को दंडित करता है)।

R2

पेशेवरों

  1. आपके चयनित चर डेटा को कितनी अच्छी तरह से फिट करते हैं, इसका एक समग्र अर्थ देता है।

विपक्ष

  1. R2R2

बेशक, ऊपर नमूना आकार और नमूने के डिजाइन के अधीन होगा, और एक सामान्य समझ यह है कि सहसंबंध का कोई मतलब नहीं है।


1

इसमें MAE, मीन एब्सोल्यूट एरर भी है। RMSE के विपरीत, यह बड़ी त्रुटियों के प्रति अति संवेदनशील नहीं है। मैंने जो पढ़ा है, उसमें से कुछ क्षेत्र आरएमएसई, अन्य एमएई पसंद करते हैं। मुझे दोनों का इस्तेमाल करना पसंद है।


0

दरअसल, सांख्यिकीय वैज्ञानिकों को मॉडल का सबसे अच्छा फिट पता होना चाहिए, तो RMSE उन लोगों के लिए अपने मजबूत अनुसंधान में बहुत महत्वपूर्ण है। यदि RMSE शून्य के बहुत करीब है, तो मॉडल सबसे अच्छा फिट है।

निर्धारण का गुणांक कृषि और अन्य क्षेत्रों जैसे अन्य वैज्ञानिकों के लिए अच्छा है। यह 0 और 1. के बीच का मान है। यदि यह 1 है, तो मानों का 100% मनाया डेटा सेट से मेल खाता है। यदि यह 0 है, तो डेटा पूरी तरह से विषम है। डॉ एस के खादर बाबू, वीआईटी विश्वविद्यालय, वेल्लोर, तमिलनाडु, भारत।


0

यदि वैक्टर में से प्रत्येक के कुछ तत्व में कुछ संख्या जोड़ी जाती है, तो RMSE बदल जाता है। एक ही या दोनों वैक्टर में सभी तत्वों को एक संख्या से गुणा किया जाता है। आर कोड इस प्रकार है;

#RMSE vs pearson's correlation
one<-rnorm(100)
two<-one+rnorm(100)

rumis<-(two - one)^2
(RMSE<-sqrt(mean(rumis)))
cor(one,two)

oneA<-one+100

rumis<-(two - oneA)^2
(RMSE<-sqrt(mean(rumis)))
cor(oneA,two)

oneB<-one*10
twoB<-two*10

rumis<-(twoB - oneB)^2
(RMSE<-sqrt(mean(rumis)))
cor(oneB,twoB)
cor(oneB,twoB)^2

0

अंतत: अंतर केवल मानकीकरण का है क्योंकि दोनों एक ही मॉडल के विकल्प की ओर ले जाते हैं, क्योंकि RMSE बार अंशों या R वर्ग में अवलोकनों की संख्या होती है, और उत्तरार्द्ध का भाजक सभी मॉडलों पर स्थिर होता है (सिर्फ एक के खिलाफ एक साजिश रचता है) अन्य 10 विभिन्न मॉडलों के लिए)।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.