मुझे लगता है कि यह एक सीधा सवाल है, हालांकि इसके पीछे का तर्क क्यों या क्यों नहीं हो सकता है। मेरे द्वारा पूछे जाने का कारण यह है कि मैंने हाल ही में एक RF के अपने कार्यान्वयन को लिखा है और हालांकि यह अच्छा प्रदर्शन करता है, यह उतना अच्छा प्रदर्शन नहीं कर रहा है जितना मैंने उम्मीद की थी ( कागले फोटो क्वालिटी प्रेडिक्शन प्रतियोगिता डेटा सेट, विजेता स्कोर और कुछ के आधार पर) बाद की जानकारी जो तकनीक के उपयोग के बारे में उपलब्ध थी)।
ऐसी परिस्थितियों में पहली बात मैं अपने मॉडल के लिए प्लॉट भविष्यवाणी की त्रुटि है, इसलिए प्रत्येक दिए गए भविष्यवाणी मूल्य के लिए मैं सही लक्ष्य मान से दूर पूर्वाग्रह (या विचलन) का निर्धारण करता हूं। मेरे RF के लिए मुझे यह प्लॉट मिला:
मैं सोच रहा था कि क्या यह RF के लिए आमतौर पर मनाया जाने वाला पूर्वाग्रह पैटर्न है (यदि नहीं तो यह शायद डेटा सेट और / या उसके कार्यान्वयन के लिए कुछ विशिष्ट हो सकता है)। मैं निश्चित रूप से पूर्वाग्रह की भरपाई करने के लिए इसका उपयोग करके भविष्यवाणियों को बेहतर बनाने के लिए इस भूखंड का उपयोग कर सकता हूं, लेकिन मैं सोच रहा हूं कि क्या आरएफ मॉडल में ही कोई और मौलिक त्रुटि या कमी है जिसे संबोधित करने की आवश्यकता है। धन्यवाद।
== ADDENDUM ==
मेरी प्रारंभिक जांच इस ब्लॉग प्रविष्टि रैंडम फ़ॉरेस्ट बायस - अपडेट पर है