GB की n.minobsinnode पैरामीटर की भूमिका R [बंद] में


21

मैं जानना चाहता था कि GBM पैकेज में n.minobsinnode पैरामीटर का क्या मतलब है। मैंने मैनुअल पढ़ा, लेकिन यह स्पष्ट नहीं है कि यह क्या करता है। परिणाम सुधारने के लिए क्या वह संख्या छोटी या बड़ी होनी चाहिए?


9
"यह सवाल भविष्य के किसी भी आगंतुक की मदद करने की संभावना नहीं है"। मैं भविष्य का आगंतुक हूं, और मुझे यह मददगार लगा।
फ्लॉडरर

1
मुझे यह मददगार भी लगा।
oaxacamatt

जवाबों:


25

GBM एल्गोरिथ्म के प्रत्येक चरण में, एक नया निर्णय ट्री का निर्माण किया जाता है। प्रश्न जब एक निर्णय पेड़ बढ़ रहा है 'कब रोकना है?'। जब तक आप जा सकते हैं तब तक प्रत्येक नोड को विभाजित करना है जब तक कि प्रत्येक टर्मिनल नोड में केवल 1 अवलोकन न हो। यह n.minobsinnode = 1 के अनुरूप होगा। वैकल्पिक रूप से, नोड्स का विभाजन तब समाप्त हो सकता है जब प्रत्येक नोड में कुछ निश्चित संख्या में अवलोकन होते हैं। आर जीबीएम पैकेज के लिए डिफ़ॉल्ट 10 है।

उपयोग करने के लिए सबसे अच्छा मूल्य क्या है? यह डेटा सेट पर निर्भर करता है और आप वर्गीकरण या प्रतिगमन कर रहे हैं या नहीं। चूंकि प्रत्येक पेड़ की भविष्यवाणी को टर्मिनल नोड में सभी इनपुट के निर्भर चर के औसत के रूप में लिया जाता है, 1 का मान शायद प्रतिगमन (!) के लिए इतनी अच्छी तरह से काम नहीं करेगा, लेकिन वर्गीकरण के लिए उपयुक्त हो सकता है।

उच्च मूल्यों का अर्थ है छोटे पेड़ ताकि एल्गोरिथ्म तेजी से चले और कम मेमोरी का उपयोग करें, जो एक विचार हो सकता है।

आमतौर पर, परिणाम इस पैरामीटर के प्रति बहुत संवेदनशील नहीं होते हैं और जीबीएम प्रदर्शन के स्टोकेस्टिक प्रकृति को देखते हुए वास्तव में यह निर्धारित करना मुश्किल हो सकता है कि वास्तव में क्या मूल्य 'सबसे अच्छा' है। बातचीत की गहराई, संकोचन और पेड़ों की संख्या सभी सामान्य रूप से बहुत अधिक महत्वपूर्ण होंगे।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.