क्या ऐसे अनुप्रयोग हैं जहां SVM अभी भी श्रेष्ठ है?


10

एसवीएम एल्गोरिथ्म काफी पुराना है - यह 1960 के दशक में विकसित किया गया था, लेकिन 1990 और 2000 के दशक में बेहद लोकप्रिय था। यह मशीन सीखने के पाठ्यक्रमों का एक शास्त्रीय (और काफी सुंदर) हिस्सा है।

आज ऐसा लगता है कि मीडिया प्रसंस्करण (चित्र, ध्वनि आदि) में तंत्रिका नेटवर्क पूरी तरह से हावी हैं, जबकि अन्य क्षेत्रों में ग्रेडिएंट बूस्टिंग में बहुत मजबूत स्थिति है।

इसके अलावा, हालिया डेटा प्रतियोगिताओं में मैं कोई एसवीएम-आधारित समाधान नहीं देखता हूं।

मैं आवेदन उदाहरणों की तलाश कर रहा हूं जहां एसवीएम अभी भी अत्याधुनिक परिणाम देता है (2016 के अनुसार)।

अद्यतन: मैं कुछ उदाहरण देना चाहूंगा जो मैं एसवीएम की व्याख्या करते समय छात्रों / सहकर्मियों को दे सकता हूं ताकि यह विशुद्ध रूप से सैद्धांतिक या पदावनत दृष्टिकोण की तरह न दिखे।


3
किस अर्थ में श्रेष्ठ? कुछ प्रदर्शन मीट्रिक? एक गहरी तंत्रिका जाल को प्रशिक्षित करने के लिए कंप्यूटर की पर्याप्त मात्रा की आवश्यकता होती है, लेकिन मैं अपने लैपटॉप पर एक सेवा योग्य एसवीएम को प्रशिक्षित कर सकता हूं।
साइकोरैक्स का कहना है कि मोनिका

@ user777 मेरा मतलब है कि आवेदन क्षेत्र के लिए उपयुक्त वर्गीकरण / प्रतिगमन मीट्रिक, निश्चित रूप से। डीएल के लिए कम्प्यूटेशनल जटिलता वाला मुद्दा महत्वपूर्ण है, लेकिन यह इस सवाल के दायरे से बाहर है।
अल्लेओ

जवाबों:


11

कागज के अनुसार क्या हमें वास्तविक विश्व वर्गीकरण समस्याओं को हल करने के लिए सैकड़ों क्लासिफायर की आवश्यकता है? रैंडम फ़ॉरेस्ट और ग्रैडिएंट बूटिंग मशीनों के साथ एसवीएम 120+ डेटासेट के बड़े सेट (मीट्रिक के रूप में सटीकता का उपयोग करके) के लिए शीर्ष प्रदर्शन वर्गीकरण एल्गोरिदम में से हैं।

मैंने कुछ संशोधनों के साथ उनके प्रयोगों को दोहराया और मुझे ये तीनों क्लासिफायर दूसरों की तुलना में बेहतर प्रदर्शन करते हैं, लेकिन जैसा कि कोई मुफ्त लंच प्रमेय कहता है कि हमेशा एक समस्या होती है जहां कुछ अन्य एल्गोरिदम इन तीनों की तुलना में बेहतर प्रदर्शन करते हैं।

तो हां, मैं कहूंगा कि एसवीएम (गॉसियन कर्नेल के साथ - जो कि मैंने उपयोग किया है) अभी भी गैर-मीडिया संबंधित डेटासेट के लिए एक प्रासंगिक एल्गोरिथ्म है।


हाय, प्रतिक्रिया के लिए धन्यवाद! मैंने यह दिलचस्प अध्ययन देखा है। जहां तक ​​मैं समझता हूं, यह विचार यह देखना था कि बिना किसी गंभीर ट्यूनिंग के कितना क्लासिफायर देता है (जबकि डेटा एनालिस्ट को ट्यूनिंग एमओओ करना चाहिए )। क्षेत्र-संबंधी अध्ययन अधिक रुचि वाला होगा।
अल्लेओ

1
मुझे याद है कि डेलगाडो एट सभी ने सबसे अच्छा हाइपरपैरेटर्स के लिए बहुत विस्तृत खोज नहीं की थी, लेकिन अगर उन्होंने कुछ खोज की। सवाल (जिसके लिए मेरे पास कोई जवाब नहीं है) क्या यह है कि सबसे अच्छा हाइपरपैरामीटर के लिए अधिक महीन दाने वाली खोज से अलग-अलग परिणाम सामने आएंगे। अगर यह सच है, तो इसका मतलब यह होगा कि एसवीएम के लिए प्रतिस्पर्धा करने वाले एल्गोरिदम सामान्य रूप से विशेष हाइपरपैरेटर्स के लिए सटीकता में एक बहुत तेज चोटी है, जो मुझे लगता है कि एल्गोरिथ्म के लिए एक नकारात्मक कारक है।
जैक्स वेनर

इसके अलावा एक छोटी सी टिप्पणी है कि UCI डेटासेट (परीक्षण के लिए उपयोग किया जाता है) ज्यादातर काफी छोटा होता है। मुझे आश्चर्य है कि अगर यह बूस्टिंग के खराब परिणामों के लिए स्पष्टीकरण हो सकता है? अधिकांश कागल चुनौतियों (बहुत अधिक डेटा के साथ) जीबी के बेहतर प्रदर्शन को प्रदर्शित करता है।
ऐलियो

मैं मानता हूं कि डेटा सेट छोटे हैं। बड़े डेटासेट के लिए मैं इस समय रैंडम फ़ॉरेस्ट का उपयोग कर रहा हूं - जैसे ही मैं हाइपरपैरेटर्स के साथ अधिक आरामदायक हूं जीबीएम का उपयोग करना शुरू कर दूंगा - मुझे नहीं पता कि जीबीएम उनके लिए कितना समझदार है।
जैक्स वेनर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.