XGBoost पूर्वानुमान चरण में लापता डेटा को संभाल सकता है


12

हाल ही में मैंने XGBoost एल्गोरिदम की समीक्षा की है और मैंने देखा है कि यह एल्गोरिथ्म प्रशिक्षण चरण में लापता डेटा (बिना आवेग के) को संभाल सकता है। मैं सोच रहा था कि क्या XGboost लापता डेटा (बिना आवेग के) को संभाल सकता है जब इसका उपयोग नई टिप्पणियों के पूर्वानुमान के लिए किया जाता है या लापता डेटा को लागू करना आवश्यक है।

अग्रिम में धन्यवाद।

जवाबों:


14

xgboost प्रशिक्षण समय पर निर्णय लेता है कि क्या लापता मान दाएं या बाएं नोड में जाते हैं। यह चुनता है कि कौन सा नुकसान कम से कम हो। यदि प्रशिक्षण के समय कोई लापता मान नहीं है, तो यह किसी भी नई मिसिंग को सही नोड में भेजने में चूक करता है।

यदि आपकी यादों के वितरण में संकेत है, तो यह अनिवार्य रूप से मॉडल द्वारा फिट है।

सावधान रहें यदि आपके स्कोरिंग डेटा में इसके लापता मूल्य आपके प्रशिक्षण डेटा से अलग तरीके से वितरित हैं। xgboost की अनुपलब्ध हैंडलिंग सुविधाजनक है, लेकिन मास्किंग से सुरक्षा नहीं करती है।

स्रोत: यह जवाब

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.