मैं कहूंगा, चुनाव आपके पास कितना डेटा है और आपका उद्देश्य क्या है, इस पर बहुत निर्भर करता है। कुछ "अंगूठे के नियम"।
रैंडम फ़ॉरेस्ट आंतरिक रूप से मल्टीक्लास समस्याओं के लिए अनुकूल है, जबकि एसवीएम आंतरिक रूप से दो-स्तरीय है। बहुरंगी समस्या के लिए आपको इसे कई बाइनरी वर्गीकरण समस्याओं में कम करना होगा।
रैंडम फॉरेस्ट संख्यात्मक और श्रेणीबद्ध विशेषताओं के मिश्रण के साथ अच्छी तरह से काम करता है। जब सुविधाएँ विभिन्न पैमानों पर होती हैं, तो यह भी ठीक है। मोटे तौर पर, रैंडम फ़ॉरेस्ट के साथ आप डेटा का उपयोग कर सकते हैं जैसे वे हैं। एसवीएम "मार्जिन" को अधिकतम करता है और इस प्रकार विभिन्न बिंदुओं के बीच "दूरी" की अवधारणा पर निर्भर करता है। यह तय करना है कि "दूरी" सार्थक है या नहीं। नतीजतन, श्रेणीबद्ध विशेषताओं के लिए एक-गर्म एन्कोडिंग एक अवश्य है। आगे, न्यूनतम-अधिकतम या अन्य स्केलिंग प्रीप्रोसेसिंग कदम पर अत्यधिक अनुशंसित है।
nmn×nn2
एक वर्गीकरण समस्या के लिए यादृच्छिक वन आपको कक्षा से संबंधित होने की संभावना देता है। एसवीएम आपको सीमा से दूरी देता है, आपको अभी भी इसे किसी तरह संभावना में बदलने की आवश्यकता है यदि आपको संभावना की आवश्यकता है।
उन समस्याओं के लिए, जहां एसवीएम लागू होता है, यह आमतौर पर रैंडम फॉरेस्ट से बेहतर प्रदर्शन करता है।
एसवीएम आपको "सपोर्ट वैक्टर" प्रदान करता है, जो कि कक्षाओं के बीच की सीमा के निकटतम प्रत्येक कक्षा के अंक हैं। वे व्याख्या के लिए खुद से दिलचस्पी ले सकते हैं।