मेरे पास 12 सकारात्मक प्रशिक्षण सेट हैं (कैंसर कोशिकाओं को कार्रवाई के 12 अलग-अलग तंत्रों के साथ दवाओं के साथ इलाज किया जाता है)। इन सकारात्मक प्रशिक्षण सेटों में से प्रत्येक के लिए, मैं एक सपोर्ट-वेक्टर मशीन को प्रशिक्षित करना चाहता हूं ताकि इसे प्रयोग से प्राप्त समान आकार के नकारात्मक सेट से अलग किया जा सके। प्रत्येक सेट में 1000 और 6000 सेल होते हैं, और प्रत्येक सेल में 476 विशेषताएं (छवि विशेषताएं) होती हैं, जिनमें से प्रत्येक को रैखिक रूप से स्केल किया जाता है [0, 1]।
मैं LIBSVM और गाऊसी RGB कर्नेल का उपयोग करता हूं । पांच-गुना क्रॉसवॉलिडेशन का उपयोग करते हुए, मैंने log∈ C -5 [-5, 15] और log∈-₂ [-15, 3] के लिए एक ग्रिड खोज की है। परिणाम इस प्रकार हैं:
मुझे निराशा हुई कि सभी 12 वर्गीकरण समस्याओं के लिए उच्च सटीकता देने वाले मापदंडों का एक भी सेट नहीं है। मुझे यह भी आश्चर्य हुआ कि ग्रिड आम तौर पर उच्च सटीकता वाले क्षेत्र नहीं दिखाते हैं जो कम सटीकता वाले होते हैं। क्या इसका यह मतलब है कि मुझे खोज पैरामीटर स्थान का विस्तार करने की आवश्यकता है, या क्या ग्रिड खोज एक संकेत है कि कुछ और गलत है?