random-forest पर टैग किए गए जवाब

रैंडम वन एक मशीन-सीखने की विधि है जो कई निर्णय पेड़ों के आउटपुट के संयोजन पर आधारित है।

1
क्या ब्रेमेन का यादृच्छिक वन सूचना लाभ या गिन्नी इंडेक्स का उपयोग करता है?
मैं जानना चाहूंगा कि क्या ब्रिमन का रैंडम फॉरेस्ट (R randomForest package में रैंडम फॉरेस्ट) एक स्प्लिटिंग मानदंड (विशेषता चयन के लिए मानदंड) सूचना लाभ या गिन्नी इंडेक्स के रूप में उपयोग करता है? मैंने इसे http://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm और R में यादृच्छिकतम पैकेज के लिए दस्तावेज़ीकरण में खोजने की कोशिश की …

1
गनी घटती है और गिन्नी अशुद्धता बच्चों की
मैं यादृच्छिक जंगल के लिए Gini सुविधा महत्व के उपाय पर काम कर रहा हूं। इसलिए, मुझे नोड की अशुद्धता में गिनी की कमी की गणना करने की आवश्यकता है। यहाँ मैं ऐसा कर रहा हूँ, जो परिभाषा के साथ संघर्ष की ओर ले जाता है, यह सुझाव देता है …

7
बेतरतीब जंगल उग आए हैं
मैं scikits- सीखने में रैंडम फ़ॉरेस्ट रिग्रेशन का उपयोग करने की कोशिश कर रहा हूं। समस्या यह है कि मुझे वास्तव में उच्च परीक्षण त्रुटि मिल रही है: train MSE, 4.64, test MSE: 252.25. यह मेरा डेटा कैसा दिखता है: (नीला: वास्तविक डेटा, हरा: अनुमानित): मैं प्रशिक्षण के लिए 90% …

1
निरंतर चर की भविष्यवाणी करते समय निर्णय वृक्ष विभाजन को कैसे लागू किया जाना चाहिए?
मैं वास्तव में रैंडम फ़ॉरेस्ट का कार्यान्वयन लिख रहा हूं, लेकिन मेरा मानना ​​है कि प्रश्न पेड़ों (आरएफ से स्वतंत्र) के लिए विशिष्ट है। इसलिए संदर्भ यह है कि मैं एक निर्णय वृक्ष में एक नोड बना रहा हूं और भविष्यवाणी और लक्ष्य चर दोनों निरंतर हैं। नोड के पास …

1
जिसमें रैंडम फॉरेस्ट में इंटरेक्शन टर्म्स शामिल हैं
मान लीजिए कि हमारे पास एक प्रतिक्रिया वाई और भविष्यवाणियां X1, ...., Xn हैं। अगर हम X1, ...., Xn के रैखिक मॉडल के माध्यम से Y को फिट करने की कोशिश करते थे, और यह सिर्फ इतना हुआ कि Y और X1 के बीच का वास्तविक संबंध, ..., Xn रैखिक …

2
स्किटिट-लर्न बूटस्ट्रैप फ़ंक्शन टेस्ट सेट को फिर से क्यों करता है?
मॉडल मूल्यांकन के लिए बूटस्ट्रैपिंग का उपयोग करते समय, मैंने हमेशा सोचा कि आउट-ऑफ-बैग नमूने सीधे परीक्षण सेट के रूप में उपयोग किए जाते थे। हालाँकि, ऐसा प्रतीत नहीं होता है कि हटाए गए डरावने-सीखने केBootstrap दृष्टिकोण के लिए मामला है , जो आउट-ऑफ-द-बैग डेटा सब्मिट से ड्राइंग से परीक्षण …

1
क्या बैगिंग एल्गोरिदम यादृच्छिक वन के उत्तराधिकारी के योग्य हैं?
एल्गोरिदम को बढ़ावा देने के लिए, मैं कहूंगा कि वे बहुत अच्छी तरह से विकसित हुए हैं। 1995 की शुरुआत में AdaBoost को पेश किया गया था, फिर कुछ समय बाद यह ग्रैडिएंट बूस्टिंग मशीन (GBM) थी। हाल ही में, 2015 के आसपास XGBoost पेश किया गया था, जो सटीक …

2
बेतरतीब से विभिन्न परिणाम कैरेट और बेसिक randomForest पैकेज के माध्यम से
मैं थोड़ा उलझन में हूं: कैरेट के माध्यम से प्रशिक्षित मॉडल के परिणाम मूल पैकेज में मॉडल से कैसे भिन्न हो सकते हैं? मैंने पढ़ा कि क्या कैरेट पैकेज के साथ रैंडमफॉरस्ट के फाइनलमॉडल का उपयोग करने से पहले प्रीप्रोसेसिंग की आवश्यकता है? लेकिन मैं यहां किसी भी प्रीप्रोसेसिंग का …

3
रैंडम फ़ॉरेस्ट मॉडल में अधिक हाल के डेटा को वेट करना
मैं 6 श्रेणियों के बीच भेदभाव करने के लिए रैंडम फ़ॉरेस्ट के साथ एक वर्गीकरण मॉडल का प्रशिक्षण दे रहा हूं। मेरे लेन-देन के डेटा में लगभग 60k + अवलोकन और 35 चर हैं। यहाँ एक उदाहरण है कि यह लगभग कैसा दिखता है। _________________________________________________ |user_id|acquisition_date|x_var_1|x_var_2| y_vay | |-------|----------------|-------|-------|--------| |111 …

1
यादृच्छिक वन पर LASSO का उपयोग करना
मैं निम्नलिखित प्रक्रिया का उपयोग करके एक यादृच्छिक वन बनाना चाहूंगा: विभाजन को निर्धारित करने के लिए सूचना के लाभ का उपयोग करके डेटा और सुविधाओं के यादृच्छिक नमूनों पर एक पेड़ बनाएं एक पत्ती नोड को समाप्त करें यदि यह पूर्व-परिभाषित गहराई से अधिक है या किसी भी विभाजन …

1
RandomForest - MDS प्लॉट व्याख्या
मैंने 8 चर (विभिन्न शरीर मुद्राओं और चालन) के आधार पर 6 जानवरों के व्यवहार (उदाहरण के लिए खड़े, चलना, तैरना आदि) को वर्गीकृत करने के लिए यादृच्छिक रूप से उपयोग किया। RandomForest पैकेज में MDSplot मुझे यह आउटपुट देता है और मुझे परिणाम की व्याख्या करने में समस्या है। …

2
जब चयनित सुविधाओं की संख्या कम हो जाती है, तो यादृच्छिक वन OOB त्रुटि का अनुमान क्यों सुधारता है?
मैं एक माइक्रोएरे डेटासेट पर एक क्लासिफायरियर के रूप में एक यादृच्छिक वन एल्गोरिथ्म लागू कर रहा हूं जो विभिन्न विशेषताओं के साथ दो ज्ञात समूहों में विभाजित हैं। प्रारंभिक रन के बाद मैं सुविधाओं के महत्व को देखता हूं और 5, 10 और 20 सबसे महत्वपूर्ण विशेषताओं के साथ …

3
अनुदैर्ध्य बड़े डेटा को कैसे मॉडल करें?
परंपरागत रूप से हम अनुदैर्ध्य डेटा को मॉडल करने के लिए मिश्रित मॉडल का उपयोग करते हैं, जैसे डेटा: id obs age treatment_lvl yield 1 0 11 M 0.2 1 1 11.5 M 0.5 1 2 12 L 0.6 2 0 17 H 1.2 2 1 18 M 0.9 हम …

3
R: मैं gbm और randomForest के आंशिक निर्भरता भूखंडों में क्या देखते हैं?
दरअसल, मुझे लगा कि मैं समझ गया था कि आंशिक निर्भरता की साजिश के साथ कोई क्या दिखा सकता है, लेकिन एक बहुत ही सरल काल्पनिक उदाहरण का उपयोग करते हुए, मैं बल्कि हैरान रह गया। कोड की निम्न हिस्सा में मैं तीन स्वतंत्र चर (उत्पन्न एक , ख , …

1
बेतरतीब जंगल और भविष्यवाणी
मैं यह समझने की कोशिश कर रहा हूं कि रैंडम फॉरेस्ट कैसे काम करता है। मेरे पास इस बात की समझ है कि पेड़ कैसे बनते हैं लेकिन यह समझ नहीं आता कि कैसे बेतरतीब वन बैग के नमूने पर भविष्यवाणियां करते हैं। किसी ने मुझे एक सरल विवरण दे …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.