एसवीएम इष्टतम सी और गामा मापदंडों का निर्धारण करने के लिए कौन सी खोज सीमा है?


32

मैं वर्गीकरण के लिए एसवीएम का उपयोग कर रहा हूं और मैं रैखिक और आरबीएफ गुठली के लिए इष्टतम मापदंडों को निर्धारित करने की कोशिश कर रहा हूं। रैखिक कर्नेल के लिए मैं C को निर्धारित करने के लिए क्रॉस-वेरिफ़ाइड पैरामीटर चयन का उपयोग करता हूं और RBF कर्नेल के लिए मैं C और गामा निर्धारित करने के लिए ग्रिड खोज का उपयोग करता हूं।

मेरे पास 20 (संख्यात्मक) विशेषताएं हैं और 70 प्रशिक्षण उदाहरण हैं जिन्हें 7 वर्गों में वर्गीकृत किया जाना चाहिए।

सी और गामा मापदंडों के लिए इष्टतम मान निर्धारित करने के लिए मुझे किस खोज रेंज का उपयोग करना चाहिए?

जवाबों:


31

की जाँच करें SVM वर्गीकरण करने के लिए एक व्यावहारिक गाइड कुछ संकेत दिए गए, विशेष रूप से पेज 5 के लिए।

हम पर एक "ग्रिड खोज" की सिफारिश और γ पार सत्यापन का उपयोग करते हुए। ( C , γ ) के विभिन्न युग्मों को आजमाया जाता है और सबसे अच्छा क्रॉस-वैरिफिकेशन सटीकता के साथ चुना जाता है। हमने पाया की तेजी से बढ़ रही दृश्यों की कोशिश कर रहा है कि सी और γ , उदाहरण के लिए अच्छा पैरामीटर की पहचान करने के लिए (एक व्यावहारिक विधि है सी = 2 - 5 , 2 - 3 , ... , 2 15 , γ = 2 - 15 , 2 - 13 ,Cγ(C,γ)Cγ )।C=25,23,,215;γ=215,213,,23

पहले अपने डेटा को सामान्य करने के लिए याद रखें और यदि आप कर सकते हैं, तो अधिक डेटा इकट्ठा करें क्योंकि इसके लुक से आपकी समस्या बहुत कम हो सकती है।


क्या पीयर परीक्षण मैन्युअल रूप से किया जाना चाहिए? इसे प्राप्त करने के लिए एक पुस्तकालय नहीं है?
x-rw

11

चैपल और ज़िएन द्वारा इस पत्र के खंड 2.3.2 की जाँच करें । वे के लिए एक अच्छा खोज श्रेणी का चयन करने के लिए एक अच्छा अनुमानी है RBF गिरी की और सी SVM के लिए। मैं उद्धृत करता हूंσC

शेष मुक्त मापदंडों (जैसे, सीवी द्वारा) के अच्छे मूल्यों को निर्धारित करने के लिए, सही पैमाने पर खोज करना महत्वपूर्ण है। इसलिए हम और σ के लिए डिफ़ॉल्ट मान ठीक करते हैं, जिसमें परिमाण का सही क्रम है। एक में स्तरीय समस्या उपयोग हम 1 / जोड़ो में दूरी की quantile डी ρ मैं जे के लिए एक डिफ़ॉल्ट के रूप में सभी डेटा अंकों की σC के लिए डिफॉल्ट , फ़ीचर स्पेस में आनुभविक विचलन s 2 का व्युत्क्रम है, जिसकी गणना s 2 = 1 से की जा सकती हैCσc1/cDijρσCs2 एक सेn×nगिरी मैट्रिक्सकश्मीरs2=1niKii1n2i,jKijn×nK

बाद में, वे गुणकों का उपयोग करते हैं (उदाहरण के लिए 2k के लिए ) एक में खोज सीमा के रूप में डिफ़ॉल्ट मान के पार सत्यापन का उपयोग कर ग्रिड से खोज करते हैं। मेरे लिए हमेशा बहुत अच्छा काम किया।k{2,...,2}

बेशक, हमने @ciri ने कहा, डेटा को सामान्य करना आदि हमेशा एक अच्छा विचार है।


मुझे लगता है कि कई बराबर आरबीएफ कर्नेल योग हैं। गामा के साथ एक और सिग्मा के साथ दूसरा, गामा = 1 / 2sigma ^ 2। क्या उपरोक्त गरिमा में गामा गामा, सिग्मा या सिग्मा ^ 2 के अनुरूप है? मुझे उसी हीरस्टिक के अन्य विवरण मिले हैं जो गामा के लिए हैं।
मशीनरी

12σ2

@ फैबी पीयर टेस्टिंग मैन्युअल रूप से किया जाना चाहिए? इसे प्राप्त करने के लिए एक पुस्तकालय नहीं है?
x-rw
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.