random-forest पर टैग किए गए जवाब

रैंडम वन एक मशीन-सीखने की विधि है जो कई निर्णय पेड़ों के आउटपुट के संयोजन पर आधारित है।

3
यादृच्छिक वन वर्गीकरण से पहले उच्च-आयामी पाठ डेटा पर पीसीए?
क्या यह रैंडम फ़ॉरेस्ट क्लासिफिकेशन करने से पहले पीसीए करने के लिए समझ में आता है? मैं उच्च आयामी पाठ डेटा के साथ काम कर रहा हूं, और मैं आयामीता के अभिशाप से बचने में मदद करने के लिए सुविधा में कमी करना चाहता हूं, लेकिन पहले से ही किसी …

5
रैंडम फॉरेस्ट एंड डिसीजन ट्री एलगोरिदम
एक यादृच्छिक जंगल निर्णय की अवधारणा के बाद निर्णय पेड़ों का एक संग्रह है। जब हम एक निर्णय वृक्ष से अगले निर्णय वृक्ष की ओर बढ़ते हैं तो अंतिम निर्णय वृक्ष द्वारा सीखी गई जानकारी आगे कैसे बढ़ती है? क्योंकि, मेरी समझ के अनुसार, एक प्रशिक्षित मॉडल की तरह कुछ …

3
रैंडम फ़ॉरेस्ट क्लासिफ़ायर के लिए इष्टतम पैरामीटर क्या होना चाहिए?
वर्तमान में मैं एक द्विआधारी वर्गीकरण समस्या के लिए MATLAB पर आरएफ टूलबॉक्स का उपयोग कर रहा हूं डेटा सेट: 50000 नमूने और 250 से अधिक विशेषताएं तो पेड़ों को उगाने के लिए प्रत्येक विभाजन पर पेड़ों की संख्या और बेतरतीब ढंग से चुनी गई विशेषता क्या होनी चाहिए? क्या …

4
क्या गैर-रेखीय मॉडल का उपयोग करते समय बहु-संपुष्टि के बारे में चिंतित होना चाहिए?
मान लें कि हमारे पास ज्यादातर वर्गीकरण विशेषताओं के साथ एक द्विआधारी वर्गीकरण समस्या है। हम इसे सीखने के लिए कुछ गैर-रैखिक मॉडल (जैसे XGBoost या रैंडम फ़ॉरेस्ट) का उपयोग करते हैं। क्या बहु-संप्रभुता के बारे में अभी भी चिंतित होना चाहिए? क्यों? यदि उपरोक्त उत्तर सही है, तो किसी …

1
यादृच्छिक वन का मूल्यांकन करें: OOB बनाम CV
जब हम एक यादृच्छिक वन की गुणवत्ता का आकलन करते हैं, उदाहरण के लिए एयूसी का उपयोग करते हुए, क्या इन मात्राओं को आउट ऑफ बैग नमूने पर या क्रॉस सत्यापन के होल्ड आउट पर गणना करना अधिक उपयुक्त है? मैंने सुना है कि OOB नमूनों पर इसकी गणना करने …

3
यादृच्छिक वन और बूस्टिंग पैरामीट्रिक या गैर पैरामीट्रिक हैं?
उत्कृष्ट सांख्यिकीय मॉडलिंग को पढ़ने से : दो संस्कृतियों (ब्रेमेन 2001) , हम पारंपरिक सांख्यिकीय मॉडल (जैसे, रैखिक प्रतिगमन) और मशीन लर्निंग एल्गोरिदम (जैसे, बगिंग, रैंडम फ़ॉरेस्ट, बूस्टेड पेड़ ...) के बीच सभी अंतर को जब्त कर सकते हैं। ब्रेमेन डेटा मॉडल (पैरामीट्रिक) की आलोचना करता है क्योंकि वे इस …

3
बहु-स्तरीय / श्रेणीबद्ध-संरचित डेटा पर यादृच्छिक वन
मैं मशीन लर्निंग, कार्ट-तकनीक और पसंद करने के लिए काफी नया हूं, और मुझे उम्मीद है कि मेरा भोलापन बहुत स्पष्ट नहीं है। रैंडम फ़ॉरेस्ट मल्टी-लेवल / पदानुक्रमित डेटा संरचनाओं को कैसे संभालता है (उदाहरण के लिए जब क्रॉस-लेवल इंटरेक्शन रुचि का हो)? यही है, डेटा कई पदानुक्रमित स्तरों पर …

2
रैंडम फ़ॉरेस्ट मॉडल का उपयोग करते समय अपने वेरिएबल्स को कब लॉग / एक्सप करें?
मैं कई विशेषताओं के आधार पर कीमतों की भविष्यवाणी करने के लिए यादृच्छिक वनों का उपयोग करके प्रतिगमन कर रहा हूं। कोड Scikit-learn का उपयोग करके पायथन में लिखा गया है। आप कैसे तय करते हैं कि आपको प्रतिगमन मॉडल को फिट करने के लिए उपयोग करने से पहले exp/ …

6
यादृच्छिक वन: परीक्षण सेट में नए कारक स्तरों को कैसे संभालना है?
मैं आर में एक यादृच्छिक वन मॉडल का उपयोग करके भविष्यवाणियां करने की कोशिश कर रहा हूं। हालाँकि, मुझे त्रुटि मिलती है क्योंकि प्रशिक्षण सेट की तुलना में कुछ कारकों का परीक्षण सेट में भिन्न मूल्य है। उदाहरण के लिए, एक कारक Cat_2में मान हैं 34, 68, 76, आदि, परीक्षण …

3
वहाँ एक सूत्र या यादृच्छिक यादृच्छिक के लिए सही sampSize का निर्धारण करने के लिए नियम है?
मैं एक randomForest के साथ खेल रहा हूँ और पाया है कि आम तौर पर sampSize बढ़ने से बेहतर प्रदर्शन होता है। क्या कोई नियम / सूत्र / आदि है जो बताता है कि इष्टतम sampSize क्या होना चाहिए या क्या यह परीक्षण और त्रुटि है? मुझे लगता है कि …
13 r  random-forest 

1
रैंडम फॉरेस्ट में, पेड़ के स्तर के बजाय नोड स्तर पर सुविधाओं का एक यादृच्छिक सबसेट क्यों चुना जाता है?
मेरा प्रश्न: रैंडम फ़ॉरेस्ट प्रत्येक पेड़ के बजाय नोड स्तर पर बंटवारे के लिए सुविधाओं के यादृच्छिक सबसेट पर विचार क्यों करता है ? पृष्ठभूमि: यह एक इतिहास का सवाल है। टिन कम हो ने 1998 में प्रत्येक पेड़ को उगाने के लिए सुविधाओं के एक सबसेट का चयन करके …

1
किनेक्ट यादृच्छिक जंगलों का उपयोग कैसे करता है?
मैं इस साइट पर पढ़ता हूं कि जाहिरा तौर पर Kinect किसी तरह से मशीन सीखने के लिए यादृच्छिक जंगलों के एल्गोरिथ्म का उपयोग करता है । क्या कोई समझा सकता है कि इसके लिए यादृच्छिक जंगलों का उपयोग क्या है, और उनका दृष्टिकोण कैसे काम करता है?

2
क्या यादृच्छिक वन बहुत छोटे डेटा सेट के लिए उपयुक्त है?
मेरे पास मासिक डेटा की 24 पंक्तियों को मिलाकर डेटा सेट है। जीडीपी, एयरपोर्ट आगमन, महीना और कुछ अन्य सुविधाएं हैं। आश्रित चर एक लोकप्रिय पर्यटन स्थल पर आगंतुकों की संख्या है। क्या रैंडम फॉरेस्ट ऐसी समस्या के लिए उपयुक्त होगा? डेटा गैर सार्वजनिक हैं इसलिए मैं एक नमूना पोस्ट …

2
यादृच्छिक जंगलों में निकटता से क्या मतलब है?
मैं यादृच्छिक जंगलों में शब्द निकटता भर में आया था। लेकिन मुझे यह समझ में नहीं आया कि यादृच्छिक जंगलों में क्या होता है। यह वर्गीकरण उद्देश्यों के लिए कैसे मदद करता है?

2
निर्णय पेड़ों के लिए श्रेणीबद्ध विशेषताओं को कोड करने के लिए सर्वोत्तम अभ्यास?
जब रैखिक प्रतिगमन के लिए श्रेणीगत विशेषताओं को कोडित किया जाता है, तो एक नियम होता है: डमी की संख्या कुल स्तरों की संख्या (संपार्श्विकता से बचने के लिए) से एक कम होनी चाहिए। क्या डिसीजन ट्रीज़ (बैगेड, बूस्टेड) ​​के लिए एक समान नियम मौजूद है? मैं यह इसलिए पूछ …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.