Xgboost में min_child_weight पैरामीटर की परिभाषा इस प्रकार दी गई है:
एक बच्चे में आवश्यक वजन का न्यूनतम योग (हेसियन)। यदि वृक्ष विभाजन चरण लीफ नोड में एक परिणाम के साथ होता है, उदाहरण के लिए न्यूनतम वजन min_child_weight से कम होता है, तो निर्माण प्रक्रिया आगे विभाजन को छोड़ देगी। रैखिक प्रतिगमन मोड में, यह बस प्रत्येक नोड में होने के लिए आवश्यक न्यूनतम संख्या से मेल खाती है। जितना बड़ा होगा, एल्गोरिथ्म उतना ही अधिक रूढ़िवादी होगा।
मैंने मूल पेपर सहित xgboost पर काफी कुछ चीजें पढ़ी हैं (देखें सूत्र 8 और समीकरण 9 के ठीक बाद वाला), यह प्रश्न और अधिकांश चीजें xgboost के साथ करने के लिए हैं जो एक Google खोज के पहले कुछ पृष्ठों पर दिखाई देती हैं। ;)
मूल रूप से मैं अभी भी खुश नहीं हूं कि हम हेसियन की राशि पर बाधा क्यों डाल रहे हैं? मूल पेपर से मिनट पर मेरा एकमात्र विचार यह है कि यह वेटेड क्वांटाइल स्केच सेक्शन (और समीकरण 3 वेटेड स्क्वेर्ड लॉस के रूप में सुधार) से संबंधित है, जिसमें प्रत्येक उदाहरण के 'वेट' के रूप में ।
एक और सवाल यह है कि यह केवल रैखिक प्रतिगमन मोड में उदाहरणों की संख्या क्यों है? मुझे लगता है कि यह वर्गों के समीकरण के योग के दूसरे व्युत्पन्न से संबंधित है?