XGBoost के ट्यूटोरियल से, मुझे लगता है कि जब प्रत्येक पेड़ बढ़ता है, तो सभी वेरिएबल्स को विभाजित नोड्स के लिए चुने जाने के लिए स्कैन किया जाता है, और अधिकतम लाभ विभाजन वाले को चुना जाएगा। तो मेरा प्रश्न यह है कि अगर मैं डेटा सेट में कुछ शोर चर जोड़ूं, तो क्या ये शोर चर चर के चयन को प्रभावित करेंगे (प्रत्येक वृक्ष के लिए)? मेरा तर्क यह है कि क्योंकि ये शोर चर अधिकतम लाभ को विभाजित नहीं करते हैं, इसलिए उन्हें कभी नहीं चुना जाएगा ताकि वे पेड़ की वृद्धि को प्रभावित न करें।
यदि जवाब हाँ है, तो क्या यह सच है कि "अधिक चर XGBoost के लिए बेहतर है"? चलो प्रशिक्षण समय पर विचार नहीं करते हैं।
इसके अलावा, यदि उत्तर हाँ है, तो क्या यह सच है कि "हमें मॉडल से गैर-महत्वपूर्ण चर को फ़िल्टर करने की आवश्यकता नहीं है"।
धन्यवाद!