आप RMSLE (रूट मीन स्क्वेर लॉगरिदमिक एरर) की व्याख्या कैसे करते हैं?


29

मैं एक मशीन लर्निंग प्रतियोगिता कर रहा हूँ जहाँ वे RMSLE (रूट मीन स्क्वैर्ड लॉगरिदमिक एरर) का उपयोग करते हैं, ताकि उपकरण की श्रेणी के विक्रय मूल्य की भविष्यवाणी करने वाले प्रदर्शन का मूल्यांकन किया जा सके। समस्या यह है कि मुझे यकीन नहीं है कि मेरे अंतिम परिणाम की सफलता की व्याख्या कैसे करें।

उदाहरण के लिए यदि मैंने RMSLE प्राप्त किया है तो क्या मैं इसे घातीय शक्ति बढ़ा सकता हूं और इसे rmse की तरह व्याख्या कर सकता हूं? (यानी? )?1.052 = 2.863 = आर एम एस 1.052ee1.052=2.863=RMSE

क्या तब मैं कह सकता हूं कि मेरी भविष्यवाणियां वास्तविक कीमतों से औसतन थीं ? या मीट्रिक की व्याख्या करने का एक बेहतर तरीका है? या अन्य मॉडलों के अन्य RMSLE की तुलना करने के अपवाद के साथ मीट्रिक की भी व्याख्या की जा सकती है? ±$2.863


मेरे सीमित ज्ञान के साथ, यह है: 1.

जवाबों:


26

मैं RMSLE से पहले नहीं देखा है, लेकिन मैं यह है संभालने हूँ 1Ni=1N(log(xi)log(yi))2

इस प्रकार यह घातांक आपको RMSE नहीं देगा, यह आपको देगा

e1Ni=1N(log(xi)log(yi))21Ni=1N(xiyi)2

यदि हम दोनों पक्षों का लॉग लेते हैं, तो हमें RMSLE बनाम मिलता है 12log(1Ni=1N(xiyi)2)

दुर्भाग्य से, सामान्य तौर पर एक अच्छा आसान रिश्ता नहीं है (हालांकि कोई मुझसे ज्यादा स्मार्ट है / मेरे बारे में उससे ज्यादा सोचकर शायद दोनों के बीच कुछ रिश्ते का पता लगाने के लिए जेनसन की असमानता का उपयोग कर सके)।

2.86


हाय @ डगल धन्यवाद! यह निश्चित रूप से स्पष्ट चीजों की मदद करता है।
ओपस

18

मुझे नहीं पता कि क्या कोई सीधा-सीधा जेनेरिक विवेचन है, किसी विशेष मामले का विश्लेषण करना भी।

उदाहरण के लिए, यदि आप माध्य मान के साथ सभी मामलों की भविष्यवाणी करते हैं और इसे अपने दृष्टिकोण से तुलना करते हैं, तो मूल्यांकन में क्या दिलचस्पी हो सकती है।

वैसे भी, मेरा मानना ​​है कि RMSLE का उपयोग आमतौर पर तब किया जाता है जब आप पूर्वानुमानित और सच्चे मूल्यों में भारी अंतर को दंडित नहीं करना चाहते हैं जब दोनों अनुमानित और सच्चे मूल्य बड़ी संख्या में होते हैं। इन मामलों में केवल प्रतिशत अंतर ही मायने रखता है क्योंकि आप फिर से लिख सकते हैं

logPi+1logAi+1=logPi+1Ai+1

उदाहरण के लिए P = 1000 और A = 500 आपको लगभग वही त्रुटि देगा जब P = 100000 और A = 50000।



1

एक आसानी से समझ में आने वाली चीज़ के संदर्भ में एक हानि समारोह के प्रदर्शन को मापने का एक अप्रत्यक्ष तरीका है, हालांकि यह सीधे उन मूल्यों को परिवर्तित नहीं करेगा जैसा आपने आशा की है।

एक बार जब मॉडल को RMSLE का उपयोग करके प्रशिक्षित और परीक्षण किया जाता है, तो बस उस पर एक नया मीट्रिक ले लें। सिर्फ इसलिए कि मॉडल को RMSLE पर प्रशिक्षित किया गया था, इसका मतलब यह नहीं है कि आप तब मैट्रिक्स के रूप में अन्य अधिक समझने योग्य नुकसान कार्य नहीं कर सकते हैं।

केरेस में, उदाहरण के लिए, आप मॉडल कंपाइलर में एक मैट्रिक्स श्रेणी में अतिरिक्त नुकसान कार्यों को निर्दिष्ट कर सकते हैं। MSLE के नीचे मॉडल (RMSLE के समतुल्य) को प्रशिक्षित करने के लिए उपयोग किया जाता है, लेकिन MAE और MSE भी दर्ज किए जाते हैं:

model.compile(loss='mean_squared_logarithmic_error', optimizer='adam', metrics=['mean_absolute_error','mean_squared_error'])
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.