रैंडम वन (RFs) एक प्रतिस्पर्धी डेटा मॉडलिंग / खनन विधि है।
एक RF मॉडल में एक आउटपुट होता है - आउटपुट / पूर्वानुमान चर।
आरएफ के साथ कई आउटपुट मॉडलिंग के लिए भोली दृष्टिकोण प्रत्येक आउटपुट चर के लिए एक आरएफ का निर्माण होगा। इसलिए हमारे पास एन स्वतंत्र मॉडल हैं, और जहां आउटपुट चर के बीच सहसंबंध है, हमारे पास निरर्थक / डुप्लिकेट मॉडल संरचना होगी। यह वास्तव में बहुत बेकार हो सकता है। एक सामान्य नियम के रूप में अधिक मॉडल चर एक अधिक ओवरफिट मॉडल (कम सामान्यीकरण) का अर्थ है। यकीन नहीं है कि अगर यह यहाँ लागू होता है, लेकिन यह संभव है।
सिद्धांत रूप में हम कई आउटपुट के साथ एक आरएफ हो सकता है। भविष्यवाणी चर अब एक वेक्टर (n-tuple) है। प्रत्येक निर्णय ट्री में निर्णय नोड्स अब थ्रेशोल्ड वेक्टर के आधार पर लक्ष्य / भविष्यवाणी वैक्टर के सेट को विभाजित कर रहे हैं, मुझे लगता है कि इस सीमा को एन-डायमेंशनल स्पेस में एक प्लेन माना जाता है और इसलिए हम यह निर्धारित कर सकते हैं कि थ्रेशोल्ड के किस तरफ वेक्टर प्रत्येक लक्ष्य वैक्टर पर है।
निर्णय विभाजन के प्रत्येक पक्ष के लिए इष्टतम भविष्यवाणी मूल्य प्रत्येक पक्ष पर वैक्टर के लिए गणना (सेंटीरोइड) है।
एकल चरों के साथ काम करते समय इष्टतम विभाजन बिंदु ढूँढना तुच्छ और कम्प्यूटेशनल रूप से तेज़ / कुशल है। एक n-tuple के लिए हम इष्टतम विभाजन नहीं पा सकते हैं (या कम से कम यह N के रूप में बढ़ जाता है)। ग्रेडिएंट ट्रैवर्सल)।
क्या यह वास्तव में काम करेगा? यही है, क्या यह बिना सामान्यीकरण के प्रशिक्षण जोड़े को मैप करेगा? क्या यह तकनीक पहले से ही एक अलग नाम के तहत मौजूद है?
आप यह भी विचार कर सकते हैं कि यह कैसे प्रतिबंधित नेट्ट्ज मशीनों (आरबीएम) और डीप बिलीफ नेटवर्क्स जैसे तंत्रिका जाल से संबंधित है।