मैं जानना चाहता था कि GBM पैकेज में n.minobsinnode पैरामीटर का क्या मतलब है। मैंने मैनुअल पढ़ा, लेकिन यह स्पष्ट नहीं है कि यह क्या करता है। परिणाम सुधारने के लिए क्या वह संख्या छोटी या बड़ी होनी चाहिए?
मैं जानना चाहता था कि GBM पैकेज में n.minobsinnode पैरामीटर का क्या मतलब है। मैंने मैनुअल पढ़ा, लेकिन यह स्पष्ट नहीं है कि यह क्या करता है। परिणाम सुधारने के लिए क्या वह संख्या छोटी या बड़ी होनी चाहिए?
जवाबों:
GBM एल्गोरिथ्म के प्रत्येक चरण में, एक नया निर्णय ट्री का निर्माण किया जाता है। प्रश्न जब एक निर्णय पेड़ बढ़ रहा है 'कब रोकना है?'। जब तक आप जा सकते हैं तब तक प्रत्येक नोड को विभाजित करना है जब तक कि प्रत्येक टर्मिनल नोड में केवल 1 अवलोकन न हो। यह n.minobsinnode = 1 के अनुरूप होगा। वैकल्पिक रूप से, नोड्स का विभाजन तब समाप्त हो सकता है जब प्रत्येक नोड में कुछ निश्चित संख्या में अवलोकन होते हैं। आर जीबीएम पैकेज के लिए डिफ़ॉल्ट 10 है।
उपयोग करने के लिए सबसे अच्छा मूल्य क्या है? यह डेटा सेट पर निर्भर करता है और आप वर्गीकरण या प्रतिगमन कर रहे हैं या नहीं। चूंकि प्रत्येक पेड़ की भविष्यवाणी को टर्मिनल नोड में सभी इनपुट के निर्भर चर के औसत के रूप में लिया जाता है, 1 का मान शायद प्रतिगमन (!) के लिए इतनी अच्छी तरह से काम नहीं करेगा, लेकिन वर्गीकरण के लिए उपयुक्त हो सकता है।
उच्च मूल्यों का अर्थ है छोटे पेड़ ताकि एल्गोरिथ्म तेजी से चले और कम मेमोरी का उपयोग करें, जो एक विचार हो सकता है।
आमतौर पर, परिणाम इस पैरामीटर के प्रति बहुत संवेदनशील नहीं होते हैं और जीबीएम प्रदर्शन के स्टोकेस्टिक प्रकृति को देखते हुए वास्तव में यह निर्धारित करना मुश्किल हो सकता है कि वास्तव में क्या मूल्य 'सबसे अच्छा' है। बातचीत की गहराई, संकोचन और पेड़ों की संख्या सभी सामान्य रूप से बहुत अधिक महत्वपूर्ण होंगे।