मुझे लगता है कि बूस्टिंग ट्री मॉडल में 3 ट्यूनिंग पैरामीटर हैं, अर्थात
- पेड़ों की संख्या (पुनरावृत्तियों की संख्या)
- संकोचन पैरामीटर
- विभाजन की संख्या (प्रत्येक घटक पेड़ों का आकार)
मेरा सवाल यह है: ट्यूनिंग मापदंडों में से प्रत्येक के लिए, मुझे इसका इष्टतम मूल्य कैसे खोजना चाहिए? और कौन सी विधि?
ध्यान दें: संकोचन पैरामीटर और पेड़ों के पैरामीटर की संख्या एक साथ संचालित होती है, यानी संकोचन पैरामीटर के लिए एक छोटा मान पेड़ों की संख्या के लिए उच्च मूल्य की ओर जाता है। और हमें इसे भी ध्यान में रखना होगा।
मैं विशेष रूप से विभाजन की संख्या के लिए इष्टतम मूल्य खोजने के लिए विधि में रुचि रखता हूं। क्या यह मॉडल के पीछे क्रॉस-मान्यता या डोमेन ज्ञान के आधार पर होना चाहिए?
और gbm
आर में पैकेज में इन चीजों को कैसे किया जाता है ?