RandomForestRegressor के लिए बैग त्रुटि अनुमान की व्याख्या करना


9

मैं अपने डेटा पर randomForest regressor का उपयोग कर रहा हूं और मैं देख सकता हूं कि ओब स्कोर 0.83 प्राप्त किया गया था। मुझे यकीन नहीं है कि यह इस तरह से कैसे निकला। मेरा मतलब है कि मेरे लक्ष्य 10 ^ 7 की सीमा में उच्च मूल्य हैं। इसलिए यदि यह एमएसई है तो यह बहुत अधिक होना चाहिए था। मुझे समझ में नहीं आता कि 0.83 यहाँ क्या दर्शाता है।

मैं स्केनर टूलकिट के अजगर के रैंडमफॉरस्टरेगर का उपयोग कर रहा हूं।

मैं करता हूँ

मॉडल = randomForestRegressor (max_depth = 7, n_estimators = 100, oob_score = True, n_jobs = -1) model.fit (trainX, trainY)

तब मुझे मॉडल.बॉय_स्कोर_ दिखाई देता है और मुझे 0.83809026152005295 जैसे मान मिलते हैं


@Momo। मैं अजगर के sklearn.ensemble का RandomForestRegressor का उपयोग कर रहा हूं। मैं सिर्फ मॉडल का उपयोग करता हूं जैसे
user34790

जवाबों:


6

यादृच्छिक वन द्वारा अनुमानित (यानी अनुमानित) लक्ष्य मान के साथ जमीनी सच्चाई (यानी सही / वास्तविक) लक्ष्य मूल्यों की तुलना करने के लिए, scikit-learn MSE का उपयोग नहीं करता है लेकिन आर2(उदाहरण के लिए MATLAB या ( ब्रीमन 1996 बी ) के विपरीत , जैसा कि आप फॉरेस्टहोम के कोड में देख सकते हैं :

self.oob_score_ = 0.0
for k in xrange(self.n_outputs_):
    self.oob_score_ += r2_score(y[:, k], predictions[:, k])
self.oob_score_ /= self.n_outputs_

r2_score()निर्धारण उर्फ के गुणांक की गणना करता है आर 2 , जिसका सबसे अच्छा संभव स्कोर 1.0 है, और निम्न मान बदतर हैं।

जानकारी के लिए:

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.