जैसा कि HighBandwidth सुझाव देता है, यह निर्भर करता है कि आप एक रैखिक एसवीएम या एक गैर-रैखिक एक का उपयोग कर रहे हैं (यदि एक कर्नेल का उपयोग नहीं किया जाता है तो यह एसवीएम के बजाय एक अधिकतम मार्जिन रैखिक क्लासिफायरियर है)।
एक अधिकतम मार्जिन लीनियर क्लासिफायरिफायर किसी भी अन्य लीनियर क्लासिफायरियर से अलग नहीं होता है, यदि डेटा जनरेट करने की प्रक्रिया का मतलब है कि विशेषताओं के बीच बातचीत होती है, तो उन इंटरैक्शन शर्तों को प्रदान करने से प्रदर्शन में सुधार होने की संभावना है। अधिकतम मार्जिन लीनियर क्लासिफायरिफ़ायर रिज रिग्रेशन की तरह है, पेनल्टी टर्म में मामूली अंतर के साथ जिसे ओवरफिटिंग (नियमितीकरण पैरामीटर के लिए उपयुक्त मान) से बचने के लिए डिज़ाइन किया गया है, और ज्यादातर मामलों में रिज रिग्रेशन और मैक्सिमम मार्जिन क्लासिफायर समान प्रदर्शन देगा।
आपको लगता है कि बातचीत के मामले की संभावना है महत्वपूर्ण होने के लिए है, तो आप उन्हें एक SVM की सुविधा अंतरिक्ष में बहुपद गिरी का उपयोग करके लागू कर सकते हैं , जो दे देंगे एक सुविधा स्थान जिसमें प्रत्येक अक्ष d या उससे कम के एक मोनोमियल का प्रतिनिधित्व करता है , पैरामीटर c विभिन्न आदेशों के मोनोमियल के सापेक्ष भार को प्रभावित करता है। तो एक बहुपद कर्नेल के साथ एक एसवीएम विशेषता अंतरिक्ष में एक बहुपद मॉडल को फिट करने के बराबर है, जो उन इंटरैक्शन को स्पष्ट रूप से शामिल करता है।क( एक्स , एक्स') = ( एक्स ⋅ एक्स'+ c )घdc
पर्याप्त सुविधाओं को देखते हुए, कोई भी रैखिक क्लासिफायरवर डेटा को तुच्छ रूप से फिट कर सकता है । IIRC एक एक में "सामान्य स्थिति 'में अंक n - 1nn−1हाइपर-प्लेन (cf VC आयाम) द्वारा डायनामिक स्पेस को किसी भी तरह से अलग किया जा सकता है। ऐसा करने से आम तौर पर गंभीर अति-फिटिंग होती है, और इसलिए इससे बचा जाना चाहिए। अधिकतम मार्जिन क्लासिफिकेशन का बिंदु इस ओवर-फिटिंग को एक दंड शब्द जोड़कर सीमित करना है, जिसका अर्थ है कि सबसे बड़ा पृथक्करण संभव है (जिसे मिसकैरेज का उत्पादन करने के लिए किसी भी प्रशिक्षण उदाहरण से सबसे बड़े विचलन की आवश्यकता होगी)। इसका मतलब है कि आप डेटा को बहुत अधिक ओवर-फिटिंग के बिना बहुत उच्च आयामी स्थान (जहां एक रैखिक मॉडल बहुत शक्तिशाली है) में बदल सकते हैं।
K(x,x′)=exp−γ∥x−x′∥2
हालाँकि यह केवल कहानी का हिस्सा है। व्यवहार में, हम आम तौर पर एक नरम-मार्जिन एसवीएम का उपयोग करते हैं, जहां मार्जिन की कमी का उल्लंघन करने की अनुमति दी जाती है, और एक नियमितीकरण पैरामीटर होता है जो मार्जिन को अधिकतम करने के बीच व्यापार-बंद को नियंत्रित करता है (जो कि एक दंड शब्द है, जिसका उपयोग उसी के समान है रिज रिग्रेशन) और स्लैक वैरिएबल का परिमाण (जो प्रशिक्षण नमूने पर नुकसान के समान है)। फिर हम रेगुलरेशन पैरामीटर को ट्यून करके ओवर-फिटिंग से बचते हैं, उदाहरण के लिए क्रॉस-वैरिडेशन एरर (या लीव-वन-आउट एरर पर कुछ बाध्य) को कम करके, जैसा कि हम रिज रिग्रेशन के मामले में करते हैं।
इसलिए जबकि SVM प्रशिक्षण सेट को तुच्छ रूप से वर्गीकृत कर सकता है , यह आमतौर पर केवल तभी होता है जब नियमितीकरण और कर्नेल पैरामीटर को बुरी तरह से चुना जाता है। किसी भी कर्नेल मॉडल के साथ अच्छे परिणाम प्राप्त करने की कुंजी एक उपयुक्त कर्नेल चुनने में है, और फिर डेटा से बचने के लिए कर्नेल और नियमितीकरण मापदंडों को पूरा करने या डेटा को कम करने के लिए।