यदि आप एसवीएम हल करने वाली अनुकूलन समस्या को देखते हैं:
minw,ξ,b{12∥w∥2+C∑ni=1ξi}
st
सभी के लिएyi(w⋅xi−b)≥1−ξi, ξi≥0,i=1,…n
समर्थन वैक्टर उन जहां संबंधित । दूसरे शब्दों में, वे डेटा पॉइंट हैं जो या तो मिसकॉलिफ़ाइड हैं, या सीमा के करीब हैं।xiξi>0
अब इस समस्या के समाधान की तुलना तब करते हैं जब आपके पास सुविधाओं का एक पूरा सेट होता है, उस स्थिति में जहां आप कुछ सुविधाओं को फेंक देते हैं। फीचर को दूर रखना कार्यात्मक रूप से फीचर को बनाए रखने के बराबर है, लेकिन फीचर लिए एक जोड़ना जिसे हम त्यागना चाहते हैं। wj=0j
जब आप इन दो अनुकूलन समस्याओं की तुलना करते हैं, और गणित के माध्यम से काम करते हैं, तो यह पता चलता है कि सुविधाओं की संख्या और समर्थन वैक्टर की संख्या के बीच कोई कठिन संबंध नहीं है। कुछ भी हो सकता था।
एक साधारण मामले के बारे में सोचना उपयोगी है। एक 2-मंद मामले की कल्पना करें, जहां आपकी नकारात्मक और सकारात्मक विशेषताएं क्रमशः (-1, -1) और (1,1) के आसपास घुलमिल जाती हैं, और 3 समर्थन वाले वैक्टर के साथ हाइपरप्लेन को अलग करने वाले विकर्ण के साथ अलग होती हैं। अब y- अक्ष सुविधा को छोड़ने की कल्पना करें, इसलिए अब आपका डेटा x- अक्ष पर अनुमानित है। यदि डेटा अभी भी वियोज्य हैं, तो x = 0 पर कहें, आपको संभवतः केवल 2 समर्थन वैक्टर के साथ छोड़ दिया जाएगा, प्रत्येक पक्ष पर एक, इसलिए y-सुविधा को जोड़ने से समर्थन वैक्टर की संख्या बढ़ जाएगी। हालाँकि, यदि डेटा अब अलग नहीं होते हैं, तो आपको प्रत्येक बिंदु के लिए कम से कम एक समर्थन वेक्टर मिलेगा जो कि x = 0 के गलत पक्ष पर है, जिस स्थिति में y-सुविधा को जोड़ने से समर्थन वैक्टर की संख्या कम हो जाएगी।
इसलिए, यदि यह अंतर्ज्ञान सही है, यदि आप बहुत ही उच्च-आयामी सुविधा वाले स्थानों में काम कर रहे हैं, या एक कर्नेल का उपयोग कर रहे हैं जो उच्च आयामी सुविधा वाले स्थान पर मैप करता है, तो आपका डेटा अलग होने की संभावना है, इसलिए एक सुविधा को जोड़ना होगा बस एक और समर्थन वेक्टर जोड़ने के लिए। हालांकि, यदि आपका डेटा वर्तमान में वियोज्य नहीं है, और आप एक ऐसी सुविधा जोड़ते हैं, जो वियोज्यता में काफी सुधार करती है, तो आपको समर्थन वैक्टर की संख्या में कमी देखने की अधिक संभावना है।