पहले के रूप में 'व्याख्या' की जा सकती है: यदि आपके भविष्य के मॉडल में एक भविष्यवक्ता महत्वपूर्ण है, तो उस भविष्यवक्ता के लिए अन्य मानों को यादृच्छिक रूप से असाइन करें लेकिन 'वास्तविक रूप से' (यानी: अपने डेटासेट पर इस भविष्यवक्ता के मूल्यों को अनुमति देना), एक नकारात्मक प्रभाव होना चाहिए। भविष्यवाणी पर, यानी: एक ही मॉडल का उपयोग करके डेटा से भविष्यवाणी करने के लिए जो एक चर को छोड़कर एक ही है, को बदतर पूर्वानुमान देना चाहिए।
इसलिए, आप मूल डेटासेट के साथ और फिर 'अनुमत' डेटासेट के साथ एक पूर्वानुमानात्मक माप (MSE) लेते हैं, और आप किसी तरह उनकी तुलना करते हैं। एक तरह से, खासकर जब से हम उम्मीद करते हैं कि मूल MSE हमेशा छोटा होगा, अंतर लिया जा सकता है। अंत में, मूल्यों को चर पर तुलनीय बनाने के लिए, इन्हें बढ़ाया जाता है।
दूसरे विभाजन के लिए: प्रत्येक विभाजन पर, आप गणना कर सकते हैं कि यह विभाजन नोड अशुद्धता को कम करता है (प्रतिगमन पेड़ों के लिए, वास्तव में, विभाजन से पहले और बाद में आरएसएस के बीच का अंतर)। यह उस चर के लिए सभी पेड़ों पर, सभी पेड़ों पर विभाजित है।
ध्यान दें: एक अच्छा पढ़ा हुआ तत्व हैस्टी, टिब्शिरानी और फ्रीडमैन द्वारा सांख्यिकीय सीखना है ...
?importance
? वहाँ एक व्याख्या है कि दोनों उपायों का क्या मतलब है ...