एसवीएम, दोनों वर्गीकरण और प्रतिगमन के लिए, एक फ़ंक्शन को लागत फ़ंक्शन के माध्यम से अनुकूलित करने के बारे में हैं, हालांकि अंतर लागत मॉडलिंग में निहित है।
वर्गीकरण के लिए उपयोग किए जाने वाले समर्थन वेक्टर मशीन के इस चित्रण पर विचार करें।
चूंकि हमारा लक्ष्य दो वर्गों का एक अच्छा पृथक्करण है, इसलिए हम एक सीमा बनाने की कोशिश करते हैं जो उन उदाहरणों के बीच जितना संभव हो उतना मार्जिन छोड़ता है जो इसके सबसे करीब हैं (सपोर्ट वैक्टर), इस मार्जिन में गिरने की घटनाओं के साथ एक संभावना है, पूरी तरह से एक उच्च लागत (एक नरम मार्जिन SVM के मामले में) की लागत।
प्रतिगमन के मामले में, लक्ष्य एक वक्र ढूंढना है जो इसे करने के लिए अंकों के विचलन को कम करता है। एसवीआर के साथ, हम एक मार्जिन का भी उपयोग करते हैं, लेकिन एक पूरी तरह से अलग लक्ष्य के साथ - हम ऐसे उदाहरणों की परवाह नहीं करते हैं जो वक्र के चारों ओर एक निश्चित मार्जिन के भीतर हैं, क्योंकि वक्र उन्हें कुछ हद तक अच्छी तरह से फिट बैठता है। यह मार्जिन SVR के पैरामीटर द्वारा परिभाषित किया गया है । ऐसे उदाहरण जो मार्जिन के भीतर आते हैं, उनमें कोई भी लागत नहीं लगती है, इसलिए हम नुकसान को 'एप्सिलॉन-असंवेदनशील' के रूप में संदर्भित करते हैं।ϵ
निर्णय समारोह के दोनों पक्षों के लिए हम एक ढीला चर प्रत्येक परिभाषित करते हैं, , के विचलन के बाहर के लिए खाते में -zone।ξ+,ξ−ϵ
यह हमें अनुकूलन समस्या देता है (ई। अल्पायडीन, मशीन लर्निंग का परिचय, द्वितीय संस्करण देखें)
min12||w||2+C∑t(ξ++ξ−)
का विषय है
rt−(wTx+w0)≤ϵ+ξt+(wTx+w0)−rt≤ϵ+ξt−ξt+,ξt−≥0
एक प्रतिगमन SVM के मार्जिन के बाहर के उदाहरणों की लागत ऑप्टिमाइज़ेशन में होती है, इसलिए ऑप्टिमाइज़ेशन के भाग के रूप में इस लागत को कम करने का लक्ष्य हमारे निर्णय फ़ंक्शन को परिष्कृत करता है, लेकिन वास्तव में मार्जिन को अधिकतम नहीं करता है क्योंकि यह SVM वर्गीकरण में मामला होगा।
यह आपके प्रश्न के पहले दो भागों का जवाब देना चाहिए था।
अपने तीसरे प्रश्न के बारे में: जैसा कि आप अब तक उठा सकते हैं, एसवीआर के मामले में एक अतिरिक्त पैरामीटर है। एक नियमित एसवीएम के पैरामीटर अभी भी बने हुए हैं, इसलिए दंड शब्द साथ-साथ कर्नेल द्वारा आवश्यक अन्य पैरामीटर, जैसे RBF कर्नेल के मामले में Gamma।ϵCγ