रैंडम फ़ॉरेस्ट ओवरफ़िट नहीं कर सकता?


10

मैंने कुछ साहित्य पढ़ा है कि यादृच्छिक वन ओवरफिट नहीं कर सकते हैं। जबकि यह बहुत अच्छा लगता है, यह सच होना बहुत अच्छा लगता है। क्या rf की ओवरफिट करना संभव है?


5
यदि यह फिट हो सकता है, तो यह ओवरफिट कर सकता है। RF के संदर्भ में, सोचें कि क्या होता है यदि आपके जंगल में पर्याप्त पेड़ नहीं हैं (कहते हैं कि आपका जंगल प्रभाव को स्पष्ट करने के लिए एकल पेड़ है)। इसमें एक से अधिक मुद्दे हैं, लेकिन यह सबसे स्पष्ट है।
मार्क क्लेसेन

मैंने आरएफ पर एक और सूत्र का जवाब दिया है कि यह आसानी से ओवरफिट कर सकता है यदि भविष्यवाणियों की संख्या बड़ी है।
राशिफल

जवाबों:


7

बेतरतीब जंगल ओवरफिट कर सकते हैं। मुझे इस पर यकीन है। आमतौर पर इसका मतलब यह है कि यदि आप अधिक पेड़ों का उपयोग करते हैं तो मॉडल ओवरफिट नहीं होगा।

y=log(x)+ϵ


रैंडम फॉरेस्ट मुख्य रूप से विचरण को कम करता है, यह ओवरफिट कैसे हो सकता है? @ डोंबेयो शायद ऐसा हो सकता है, क्योंकि निर्णय के पेड़ के मॉडल एक्सट्रपलेशन पर अच्छा प्रदर्शन नहीं करते हैं। मान लीजिए कि, एक अनौपचारिक भविष्यवक्ता चर के लिए, डीटी खराब भविष्यवाणी दे सकता है।
इटाची

ओवरफिटिंग का एक स्पष्ट संकेत यह है कि अवशिष्ट विचरण बहुत कम हो जाता है। तब, क्या आप अपनी पहली टिप्पणी के साथ लागू करने की कोशिश कर रहे हैं?
whuber

पूर्वाग्रह-विचरण व्यापार में, जब हम पूर्वाग्रह को कम करने की कोशिश करते हैं, तो हम विचरण के लिए क्षतिपूर्ति करते हैं। ऐसा है कि, अगर x = 80 y = 100 देता है, लेकिन x = 81 y = -100 देता है। यह ओवरफिटिंग होगा । उच्च विचरण करने के लिए समान नहीं है। @ जब भी मैंने ovefitting किया है केवल उच्च विचरण के कारण है। मुझे समझ में नहीं आता कि अवशिष्ट विचलन को कम करने से ओवरफिटिंग कैसे होती है। क्या आप कृपया मुझे पढ़ने के लिए कुछ पेपर साझा कर सकते हैं
इटाची

2
xi=1,2,,10yiy=β0+β1x+β2x2++βkxkk=0,1,,9

1
@ अपनी टिप्पणी से पता चलता है कि मुझे स्पष्ट रूप से कहा जाना चाहिए कि मैं अपने उदाहरण को यादृच्छिक जंगलों के बारे में नहीं, बल्कि विचरण में कमी और ओवरफिटिंग की अंतर्निहित अवधारणाओं के बारे में बता रहा था। लेकिन आपकी पहली टिप्पणी अपारदर्शी है क्योंकि यह अप्रासंगिक है (और, जैसा कि मैंने इसे पढ़ा है, गलत है): ओएलएस मॉडल के इस क्रम में अवशिष्ट विचरण मायने रखता है, न कि भविष्यवाणी विचरण। वास्तव में - फिटिंग मॉडल के सामान्य प्रश्न पर लौटना - यदि भविष्यवाणियों के विचरण को कम करना उद्देश्य था, तो हमेशा शून्य की भविष्यवाणी करने वाला कोई भी मॉडल इष्टतम होगा!
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.