यह पहली बार है जब मैं वास्तव में एक प्रश्न का उत्तर देता हूं, इसलिए मुझे इस पर पिन न करें .. लेकिन मुझे लगता है कि मैं आपके प्रश्न का उत्तर दे सकता हूं:
यदि आप वास्तव में केवल मॉडल प्रदर्शन में रुचि रखते हैं और व्याख्यात्मकता वन जैसी चीज में नहीं हैं, तो वास्तव में अक्सर एक बहुत अच्छा शिक्षण एल्गोरिथ्म होता है, लेकिन निम्नलिखित मामलों में थोड़ा खराब प्रदर्शन करते हैं:
1.) जब प्रशिक्षण नमूनों की संख्या के संबंध में आयाम (सुविधाओं की संख्या) बहुत अधिक है, तो उन मामलों में एक नियमित रैखिक प्रतिगमन या एसवीएम बेहतर होगा।
2.) मामले में डेटा में उच्च आदेश अभ्यावेदन / विचारात्मक संरचनाएं हैं, जैसे कंप्यूटर दृष्टि समस्याओं में। उन कंप्यूटर विज़न के मामलों में एक संवेगात्मक तंत्रिका नेटवर्क एक यादृच्छिक वन को नष्ट कर देगा (सामान्य तौर पर अगर ज्ञान है तो उसे सीखने में शामिल किया जा सकता है जो एक बेहतर चीज है)।
कहा जा रहा है कि रैंडम फॉरेस्ट एक बहुत अच्छा शुरुआती बिंदु है। मैं अपने मशीन लर्निंग कौशल के लिए जिस व्यक्ति की प्रशंसा करता हूं, उनमें से एक हमेशा एक यादृच्छिक जंगल और एक नियमित रूप से रैखिक रेजिस्टर सीखने के साथ शुरू होता है।
हालांकि, अगर आप सबसे अच्छा संभव प्रदर्शन चाहते हैं, तो मेरा मानना है कि आजकल के तंत्रिका नेटवर्क उर्फ। डीप लर्निंग एक बहुत ही आकर्षक दृष्टिकोण की तरह लग रहा है। डेटा-चैलेंज वेबसाइटों पर अधिक से अधिक विजेता, जैसे कागल प्रतियोगिता के लिए डीप लर्निंग मॉडल का उपयोग करते हैं। तंत्रिका नेटवर्क का एक अन्य समर्थक यह है कि वे बहुत बड़ी संख्या में नमूनों को संभाल सकते हैं (> 10 ^ 6 एक बार स्टोकेस्टिक ग्रेडिएंट अवरोही का उपयोग करके उन्हें प्रशिक्षित कर सकते हैं, एक समय में डेटा के बिट्स खिलाते हैं)। व्यक्तिगत रूप से मुझे यह डीप लर्निंग के लिए एक बहुत ही आकर्षक प्रो लगता है।