क्या रैंडम फ़ॉरेस्ट के साथ मॉडलिंग को क्रॉस-मान्यता की आवश्यकता है?


10

जहाँ तक मैंने देखा है, इस बारे में राय अलग-अलग है। सबसे अच्छा अभ्यास निश्चित रूप से क्रॉस-वैलिडेशन का उपयोग करके निर्देशित करेगा (विशेषकर यदि एक ही डेटासेट पर अन्य एल्गोरिदम के साथ आरएफ की तुलना करें)। दूसरी ओर, मूल स्रोत बताता है कि मॉडल प्रशिक्षण के दौरान ओओबी त्रुटि की गणना की जाती है, यह परीक्षण सेट प्रदर्शन के एक संकेतक के लिए पर्याप्त है। यहां तक ​​कि ट्रेवर हस्ती, अपेक्षाकृत हाल की वार्ता में कहते हैं कि "रैंडम फ़ॉरेस्ट मुफ्त क्रॉस-मान्यता प्रदान करते हैं"। सहज रूप से, यह मेरे लिए समझ में आता है, अगर प्रशिक्षण और एक डेटासेट पर आरएफ-आधारित मॉडल को बेहतर बनाने की कोशिश कर रहा है।

इस पर आपकी क्या राय है?


3
इस सवाल का मुख्य बिंदु addresssing नहीं है - लेकिन आप अभी भी शायद पार मान्य करने के लिए (जैसे आदि पेड़ों की गहराई, के रूप में) माध्यमिक मापदंडों चाहेगा
Wouter

आप प्रशिक्षण सेट पर प्रदर्शन के संदर्भ में आरएफ का उपयोग कर सकते हैं या अन्य दृष्टिकोणों से तुलना कर सकते हैं, या प्रदर्शन का परीक्षण करने के लिए डेटा के स्वतंत्र / सबसेट का उपयोग कर सकते हैं। यह आपकी परिकल्पना का सवाल है: क्या आप परिणामों को एक बड़ी आबादी के लिए सामान्य करने की कोशिश कर रहे हैं या केवल आरएफ की संपत्ति के बजाय डेटा को हाथ में वर्गीकृत करने के लिए।
कात्या जूल

जवाबों:


3

1-(1-1एन)एन1--10.6

जैसा कि @ राउटर बताते हैं, आप शायद पैरामीटर ट्यूनिंग के लिए क्रॉस सत्यापन करना चाहते हैं, लेकिन परीक्षण सेट त्रुटि के अनुमान के रूप में ओओबी त्रुटि ठीक होनी चाहिए।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.