अधिक एकल निर्णय पेड़ जोड़कर ऑन लाइन यादृच्छिक वन


13

रैंडम फॉरेस्ट (RF) डिसीजन ट्रीज (DT) के एक पहनावा द्वारा बनाया जाता है। बैगिंग का उपयोग करके, प्रत्येक डीटी को एक अलग डेटा सब्मिट में प्रशिक्षित किया जाता है। इसलिए, नए डेटा पर अधिक निर्णय तनाव को जोड़कर एक ऑन-लाइन यादृच्छिक वन को लागू करने का कोई तरीका है?

उदाहरण के लिए, हमारे पास 10K नमूने हैं और 10 DT के ट्रेन हैं। फिर हमें 1K नमूने मिलते हैं, और प्रशिक्षण के बजाय फिर से पूर्ण आरएफ, हम एक नया डीटी जोड़ते हैं। भविष्यवाणी अब बायेसियन औसत 10 + 1 डीटी के द्वारा की जाती है।

इसके अलावा, यदि हम पिछले सभी डेटा को रखते हैं, तो नए डीटी के मुख्य रूप से नए डेटा में प्रशिक्षित किया जा सकता है, जहां एक नमूना लेने की संभावना का भार इस बात पर निर्भर करता है कि कितनी बार पहले ही उठाया जा चुका है।

जवाबों:


8

नहीं है इस विषय पर हाल ही में एक कागज ( ऑन लाइन रैंडम वन कंप्यूटर दृष्टि से आ रही,)। यहां एक कार्यान्वयन , और एक प्रस्तुति है: 10 मिनट में ऑनलाइन यादृच्छिक वन


आपके द्वारा उल्लिखित कार्यान्वयन मोंड्रियन वनों ( arxiv.org/abs/1406.2673 ) की तरह पेड़ उगाने की रणनीति का अनुसरण करता है । इसलिए, पेड़ों की संख्या स्थिर है जबकि विभाजन की संख्या बढ़ जाती है। मेरा प्रश्न पहले से प्रशिक्षित पेड़ों से अछूते रहते हुए नए नमूनों के लिए पेड़ों की संख्या बढ़ाने पर केंद्रित है।
tashuhka

1
इस तरह ? क्या आप भी पेड़ों को गिराना नहीं चाहते हैं?
एमेरे

धन्यवाद। यह वही है जो मैं देख रहा हूँ। इस मामले में, समय-भिन्न संकेतों के सुविधा चयन के लिए उपयोग आरएफ। हालांकि, विधि का विशिष्ट कार्यान्वयन और वैधता काफी अस्पष्ट है, क्या आप जानते हैं कि क्या उन्होंने कुछ भी प्रकाशित किया (Google ने मदद नहीं की)?
तशुहका


लिंक के लिए धन्यवाद! मैं देख सकता हूं कि वे वास्तव में पेड़ उगाने की रणनीति का उपयोग करके सभी पिछले पेड़ों को अपडेट करते हैं, और मैं पुराने पेड़ों को अछूता रखते हुए नए डेटा के साथ नए डीटी बनाने में दिलचस्पी रखता हूं।
tashuhka
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.