random-forest पर टैग किए गए जवाब

रैंडम वन एक मशीन-सीखने की विधि है जो कई निर्णय पेड़ों के आउटपुट के संयोजन पर आधारित है।

2
डमी चर के साथ फ़ीचर महत्व
मैं यह समझने की कोशिश कर रहा हूं कि कैसे मैं एक श्रेणीबद्ध चर के फीचर महत्व को प्राप्त कर सकता हूं जिसे डमी चर में तोड़ दिया गया है। मैं scikit-learn का उपयोग कर रहा हूं, जो आपके लिए R या h2o करने के लिए श्रेणीबद्ध चर को नहीं …

1
क्या मॉडल की तुलना करने के लिए आर-स्क्वायर मूल्य उचित है?
मैं ऑटोमोबाइल वर्गीकृत विज्ञापन साइटों पर उपलब्ध कीमतों और सुविधाओं का उपयोग करते हुए ऑटोमोबाइल की कीमतों की भविष्यवाणी करने के लिए सबसे अच्छे मॉडल की पहचान करने की कोशिश कर रहा हूं। इसके लिए मैंने स्किकिट-लर्न लाइब्रेरी और न्यूरल नेटवर्क मॉडल से पाइब्रेन और न्यूरोलैब के कुछ मॉडलों का …

3
SVM से अलग, एल्गोरिदम को फीचर स्केलिंग की क्या आवश्यकता है?
मैं कई एल्गोरिदम के साथ काम कर रहा हूं: रैंडमफॉरस्ट, डिसिजनट्रीज, नाइवेबेज, एसवीएम (कर्नेल = लीनियर और आरबीएफ), केएनएन, एलडीए और एक्सजीबोस्ट। एसवीएम को छोड़कर सभी बहुत तेज थे। यही कारण है कि जब मुझे पता चला कि इसे तेजी से काम करने के लिए फीचर स्केलिंग की जरूरत है। …

1
एक यादृच्छिक जंगल में, बड़ा% IncMSE बेहतर या बदतर है?
एक बार जब मैंने आर में (रिग्रेशन) रैंडम फॉरेस्ट मॉडल बनाया है, तो कॉल rf$importanceमुझे प्रत्येक प्रेडिक्टर चर के लिए दो उपाय प्रदान करता है, %IncMSEऔर IncNodePurity। क्या यह व्याख्या कि छोटे %IncMSEमूल्यों के साथ भविष्यवक्ता चर, बड़े %IncMSEमूल्यों वाले भविष्यवक्ता चर की तुलना में अधिक महत्वपूर्ण है ? कैसे …

2
रैंडम फ़ॉरेस्ट के साथ फ़ीचर चयन
मेरे पास ज्यादातर वित्तीय चर (120 विशेषताएं, 4k उदाहरण) के साथ एक डेटासेट है जो ज्यादातर अत्यधिक सहसंबद्ध और बहुत शोर (तकनीकी संकेतक, उदाहरण के लिए) हैं, इसलिए मैं मॉडल प्रशिक्षण (बाइनरी वर्गीकरण) के साथ अधिकतम 20-30 के बारे में चयन करना चाहूंगा - वृद्धि कमी)। मैं फीचर रैंकिंग के …

5
आर में यादृच्छिक जंगलों के साथ वर्गीकरण के लिए, असंतुलित वर्ग आकारों के लिए कैसे समायोजित किया जाना चाहिए?
मैं जिस परियोजना पर काम कर रहा हूं, उसके लिए विभिन्न वर्गीकरण विधियों की खोज कर रहा हूं, और रैंडम वन की कोशिश करने में दिलचस्पी रखता हूं। मैं अपने आप को शिक्षित करने की कोशिश कर रहा हूं जैसे मैं साथ जाता हूं, और सीवी समुदाय द्वारा प्रदान की …

2
कई आउटपुट के साथ एक यादृच्छिक वन संभव / व्यावहारिक होगा?
रैंडम वन (RFs) एक प्रतिस्पर्धी डेटा मॉडलिंग / खनन विधि है। एक RF मॉडल में एक आउटपुट होता है - आउटपुट / पूर्वानुमान चर। आरएफ के साथ कई आउटपुट मॉडलिंग के लिए भोली दृष्टिकोण प्रत्येक आउटपुट चर के लिए एक आरएफ का निर्माण होगा। इसलिए हमारे पास एन स्वतंत्र मॉडल …

3
वर्ग की संभाव्यता का अनुमान ``ैंड्रैंडफ़ॉरफेस्ट` कैसे करता है?
randomForestजब मैं उपयोग करता हूं तो पैकेज की कक्षा की संभावनाओं का अनुमान कैसे लगाया जाता है predict(model, data, type = "prob")? मैं संभावनाओं का अनुमान लगाने rangerके probability = Tतर्क का उपयोग करके यादृच्छिक जंगलों के प्रशिक्षण के लिए उपयोग कर रहा था । rangerप्रलेखन में कहते हैं कि …

2
किन परिस्थितियों में ग्रेडिएंट बूस्टिंग मशीन आउटपरफॉर्म रैंडम फॉरेस्ट करती हैं?
क्या फ्रेडमैन की ग्रेडिंग बूस्टिंग मशीन ब्रेमेन के रैंडम फॉरेस्ट से बेहतर प्रदर्शन हासिल कर सकती है ? यदि हां, तो किन स्थितियों में या किस तरह का डेटा सेट gbm को बेहतर बना सकता है?

4
कम वर्गीकरण सटीकता, आगे क्या करना है?
इसलिए, मैं ML क्षेत्र में नौसिखिया हूं और मैं कुछ वर्गीकरण करने की कोशिश करता हूं। मेरा लक्ष्य एक खेल घटना के परिणाम की भविष्यवाणी करना है। मैंने कुछ ऐतिहासिक डेटा एकत्र किए हैं और अब एक क्लासिफायरियर को प्रशिक्षित करने का प्रयास करता हूं। मुझे लगभग 1200 नमूने मिले, …

1
भारित यादृच्छिक वन के लिए आर पैकेज? classwt विकल्प?
मैं एक अत्यंत असंतुलित डेटा सेट के परिणाम की भविष्यवाणी करने के लिए रैंडम फ़ॉरेस्ट का उपयोग करने की कोशिश कर रहा हूं (अल्पसंख्यक वर्ग की दर लगभग 1% या उससे कम है)। क्योंकि पारंपरिक रैंडम फ़ॉरेस्ट एल्गोरिथ्म अल्पसंख्यक वर्गों पर विशेष ध्यान देने के बजाय समग्र त्रुटि दर को …
16 r  random-forest 

2
क्या यादृच्छिक वन को स्केल या केंद्रित करने के लिए इनपुट चर की आवश्यकता होती है?
मेरे इनपुट चर के विभिन्न आयाम हैं। कुछ चर दशमलव हैं जबकि कुछ सैकड़ों हैं। क्या यादृच्छिक वन का उपयोग करते समय डेटा को आयामहीन बनाने के लिए इन इनपुट चर को केंद्र (घटाना औसत) या स्केल (मानक विचलन द्वारा विभाजित) करना आवश्यक है?

2
यादृच्छिक जंगलों के लिए रिपोर्ट करने के लिए प्रशिक्षण त्रुटि का क्या उपाय है?
मैं वर्तमान randomForestमें आर में पैकेज का उपयोग करके एक वर्गीकरण समस्या के लिए यादृच्छिक जंगलों को फिट कर रहा हूं , और इन मॉडलों के लिए प्रशिक्षण त्रुटि की रिपोर्ट करने के तरीके के बारे में अनिश्चित हूं । मेरी प्रशिक्षण त्रुटि 0% के करीब है जब मैं इसे …

1
एक लामर मॉडल के लिए किस बहुविध तुलना पद्धति का उपयोग किया जाता है: लसीन्स या ग्लेहट?
मैं एक मिश्रित प्रभाव मॉडल का उपयोग करके निर्धारित डेटा का विश्लेषण कर रहा हूं जिसमें एक निश्चित प्रभाव (स्थिति) और दो यादृच्छिक प्रभाव (विषय डिजाइन और जोड़ी के कारण प्रतिभागी) हैं। मॉडल lme4पैकेज के साथ उत्पन्न किया गया था exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp):। इसके बाद, मैंने निश्चित प्रभाव (स्थिति) के बिना मॉडल …

2
थैला त्रुटि से बाहर यादृच्छिक जंगलों में सीवी अनावश्यक बनाता है?
मैं यादृच्छिक जंगलों के लिए काफी नया हूं। अतीत में, मैंने हमेशा किसी भी ओवरफिटिंग का पता लगाने के लिए फिट बनाम ट्रेन के खिलाफ फिट बनाम टेस्ट की सटीकता की तुलना की है। लेकिन मैंने अभी यहाँ पढ़ा है कि: "यादृच्छिक जंगलों में, परीक्षण सेट त्रुटि का निष्पक्ष अनुमान …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.