इसलिए, मैं ML क्षेत्र में नौसिखिया हूं और मैं कुछ वर्गीकरण करने की कोशिश करता हूं। मेरा लक्ष्य एक खेल घटना के परिणाम की भविष्यवाणी करना है। मैंने कुछ ऐतिहासिक डेटा एकत्र किए हैं और अब एक क्लासिफायरियर को प्रशिक्षित करने का प्रयास करता हूं। मुझे लगभग 1200 नमूने मिले, उनमें से 0.2 मैं परीक्षण उद्देश्यों के लिए अलग हो गया, अन्य जिनको मैंने अपने सहपाठियों के साथ ग्रिड खोज (क्रॉस-वैधीकरण शामिल) में रखा। मैंने इस समय एसवीएम को रेखीय, आरबीएफ और बहुपद गुठली और यादृच्छिक वन के साथ आज़माया है। दुर्भाग्य से, मैं सटीकता को 0.5 से अधिक बड़ा नहीं कर सकता (वर्ग के यादृच्छिक विकल्प के समान)। क्या इसका मतलब है कि मैं इस तरह की जटिल घटना के परिणाम की भविष्यवाणी नहीं कर सकता? या मुझे कम से कम 0.7-0.8 सटीकता मिल सकती है? यदि यह संभव है, तो मुझे अगले में क्या देखना चाहिए?
- अधिक डेटा प्राप्त करें? (मैं 5 बार तक डेटासेट बढ़ा सकता हूं)
- अलग-अलग क्लासीफायर ट्राई करें? (लॉजिस्टिक रिग्रेशन, केएनएन आदि)
- मेरी सुविधा सेट का पुनर्मूल्यांकन करें? क्या कोई एमएल-टूल विश्लेषण करने के लिए है, जो कि सुविधाओं को समझ में आता है और जो नहीं करते हैं? हो सकता है, मुझे अपना फीचर सेट कम करना चाहिए (वर्तमान में मेरे पास 12 सुविधाएँ हैं)?