एक SVM ग्रिड खोज को उच्च सटीकता वाले क्षेत्र को कम सटीकता के साथ दिखाना चाहिए?


12

मेरे पास 12 सकारात्मक प्रशिक्षण सेट हैं (कैंसर कोशिकाओं को कार्रवाई के 12 अलग-अलग तंत्रों के साथ दवाओं के साथ इलाज किया जाता है)। इन सकारात्मक प्रशिक्षण सेटों में से प्रत्येक के लिए, मैं एक सपोर्ट-वेक्टर मशीन को प्रशिक्षित करना चाहता हूं ताकि इसे प्रयोग से प्राप्त समान आकार के नकारात्मक सेट से अलग किया जा सके। प्रत्येक सेट में 1000 और 6000 सेल होते हैं, और प्रत्येक सेल में 476 विशेषताएं (छवि विशेषताएं) होती हैं, जिनमें से प्रत्येक को रैखिक रूप से स्केल किया जाता है [0, 1]।

मैं LIBSVM और गाऊसी RGB कर्नेल का उपयोग करता हूं । पांच-गुना क्रॉसवॉलिडेशन का उपयोग करते हुए, मैंने log∈ C -5 [-5, 15] और log∈-₂ [-15, 3] के लिए एक ग्रिड खोज की है। परिणाम इस प्रकार हैं:

ग्रिड खोज के परिणाम

मुझे निराशा हुई कि सभी 12 वर्गीकरण समस्याओं के लिए उच्च सटीकता देने वाले मापदंडों का एक भी सेट नहीं है। मुझे यह भी आश्चर्य हुआ कि ग्रिड आम तौर पर उच्च सटीकता वाले क्षेत्र नहीं दिखाते हैं जो कम सटीकता वाले होते हैं। क्या इसका यह मतलब है कि मुझे खोज पैरामीटर स्थान का विस्तार करने की आवश्यकता है, या क्या ग्रिड खोज एक संकेत है कि कुछ और गलत है?


2
पुन: निराशा: आप प्रत्येक समस्या की अपेक्षा एक ही पैरामीटर के लिए नहीं करेंगे , इसलिए आप हाइपरपरमेटर्स (लॉग गामा और सी) के लिए अच्छे मूल्यों को साझा करने के लिए समस्याओं की अपेक्षा क्यों करेंगे ?
संयुग्मप्यारी

@Conjugate पिछला: प्रशिक्षण सेट एक ही प्रयोग के सबसेट हैं, और नकारात्मक प्रशिक्षण सेट समान जनसंख्या से सैंपल किए जाते हैं, इसलिए मुझे उम्मीद थी कि एक ही RBF कर्नेल चौड़ाई। प्रभावी होगी। क्योंकि समान पृष्ठभूमि (नकारात्मक) आबादी से सकारात्मक सेटों में भेदभाव किया जा रहा है, मुझे उम्मीद थी कि आदर्श दंड सी भी समान होगा। यदि यह मामला नहीं है, तो यह एसवीएम को लागू करने के लिए वास्तव में कठिन बनाता है। उदाहरण के लिए, कोमल बूस्टिंग, धुन करने में बहुत आसान लगती है।
वेबजॉर्न लोजोसा

अहा। लेकिन यह मुझे लगता है कि यद्यपि भौतिक अर्थों में यह एक ही प्रयोग है, फिर भी आप सांख्यिकीय अर्थों में अलग और अलग समस्याओं पर हमला कर रहे हैं। विशेष रूप से अगर प्रत्येक उपचार के लिए नकारात्मक मामलों को फिर से व्यवस्थित किया जाता है।
कंजुगेटपायर 19

1
बीटीडब्ल्यू, ग्रिड खोज अक्षम है, नेल्डर-मीड सिम्प्लेक्स ऑप्टिमाइज़ेशन एल्गोरिथ्म बहुत प्रभावी है, क्योंकि ढाल वंशज अनुकूलन विधियां हैं। ग्रिड खोज सरल है, लेकिन थोड़ा "क्रूर बल" है।
डिक्रान मार्सुपियल

@Vebjorn लोजोसा (एक साल बाद), 5 मान कितना बिखरा हुआ है, अंतिम (सी, गामा) पर कहते हैं? क्या 12 प्लॉट सभी समान हैं, जैसे 50% .. 100% सही भविष्यवाणी? धन्यवाद
Denis

जवाबों:


9

हाइपर-मापदंडों के लिए इष्टतम मान अलग-अलग सीखने के लिए अलग-अलग होंगे, आपको उन्हें हर समस्या के लिए अलग से ट्यून करने की आवश्यकता है।

आपको एक भी इष्टतम नहीं मिलने का कारण है कर्नेल पैरामीटर और रेग्युलराइजेशन पैरामीटर दोनों मॉडल की जटिलता को नियंत्रित करते हैं। यदि C छोटा है, तो आपको एक चिकनी मॉडल मिलता है, इसी तरह अगर कर्नेल व्यापक है, तो आपको एक चिकनी मॉडल मिलेगा (जैसा कि आधार फ़ंक्शन बहुत स्थानीय नहीं हैं)। इसका मतलब यह है कि सी के विभिन्न संयोजनों और कर्नेल की चौड़ाई समान प्रदर्शन के साथ समान मॉडल की ओर ले जाती है, (यही वजह है कि आपको कई भूखंडों में विकर्ण सुविधा मिलती है)।

इष्टतम प्रशिक्षण सेट के विशेष नमूने पर भी निर्भर करता है। क्रॉस-वेलिडेशन त्रुटि को ओवर-फिट करना संभव है, इसलिए क्रॉस-वैलिडेशन द्वारा हाइपर-मापदंडों को चुनना वास्तव में प्रदर्शन को खराब कर सकता है यदि आप अशुभ हैं। इसके बारे में कुछ चर्चा के लिए Cawley और टैलबोट देखें ।

तथ्य यह है कि हाइपर-मापदंडों के लिए मूल्यों का एक व्यापक पठार है जहां आपको समान रूप से अच्छे मूल्य मिलते हैं वास्तव में समर्थन वेक्टर मशीनों की एक अच्छी विशेषता है क्योंकि यह सुझाव देता है कि वे मॉडल चयन में अति-फिटिंग के लिए कमजोर नहीं हैं। यदि आपके पास इष्टतम मूल्यों पर एक तेज चोटी थी, तो यह एक बुरी बात होगी क्योंकि चोटी को एक परिमित डेटासेट का उपयोग करके खोजना मुश्किल होगा जो कि उस चोटी का अविश्वसनीय संकेत प्रदान करेगा जहां वास्तव में रहता है।


BTW मैं ग्रिड-खोज का उपयोग करके मॉडल चयन में ओवर-फिटिंग पर एक अध्ययन कर रहा हूं, जो कि मेरे विचार से कहीं अधिक दिलचस्प है। यहां तक ​​कि कुछ अति-मापदंडों के साथ, आप अभी भी मॉडल चयन मानदंड को ओवर-फिट कर सकते हैं यदि आप एक ग्रिड पर अनुकूलन करते हैं कि यह बहुत अच्छा है!
डिक्रान मार्सुपियल

मैं अब अनुकरण कार्य के अंत की ओर बढ़ रहा हूं, उम्मीद है कि मैं एक या दो महीने में कागज जमा कर
सकूंगा

अगर वह समाप्त हो गया है तो मैं उस पेपर को पढ़ना चाहूंगा? मैं ग्रिड खोज ऑप्टिमाइज़ेशन में कुछ अजीब स्पाइक्स आदि के साथ आया हूं जो कि यहां चर्चा करने के समान है।
बिग्रीन

सभी सिमुलेशन काम अब पूरा हो गया है, मैं इस समय केवल एक साथ पेपर डाल रहा हूं (ज्यादातर यह सुनिश्चित करना कि यह पूरी तरह से प्रतिलिपि प्रस्तुत करने योग्य है)। मैंने सभी ग्रिडों को सहेज लिया है, इसलिए कुछ रीनलिसिस अन्य सवालों पर ध्यान देना संभव होना चाहिए, जो मैंने उस समय नहीं सोचा था।
डिक्रान मार्सुपियल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.