SVM = टेम्प्लेट मिलान कैसे होते हैं?


10

मैंने एसवीएम के बारे में पढ़ा और सीखा कि वे एक अनुकूलन समस्या को हल कर रहे हैं और अधिकतम मार्जिन विचार बहुत उचित था।

अब, गुठली का उपयोग करके वे गैर-रेखीय पृथक्करण सीमाएं भी पा सकते हैं जो महान थी।

अब तक, मुझे वास्तव में यह पता नहीं है कि एसवीएम (एक विशेष कर्नेल मशीन) और कर्नेल मशीन तंत्रिका नेटवर्क से कैसे संबंधित हैं?

यहाँ यान येकुन => की टिप्पणियों पर विचार करें :

kernel methods were a form of glorified template matching

और यहाँ भी :

उदाहरण के लिए, कुछ लोग कर्नेल के तरीकों से चकाचौंध थे क्योंकि यह प्यारा गणित है जो इसके साथ जाता है। लेकिन, जैसा कि मैंने अतीत में कहा है, अंत में, कर्नेल मशीन उथले नेटवर्क हैं जो "शानदार टेम्पलेट मिलान" करते हैं। इसमें कुछ भी गलत नहीं है (एसवीएम एक शानदार तरीका है), लेकिन इसकी सख्त सीमाएं हैं जिनसे हम सभी को अवगत होना चाहिए।

तो मेरे सवाल हैं:

  1. SVM तंत्रिका नेटवर्क से कैसे संबंधित है? यह एक उथला नेटवर्क कैसे है?
  2. SVM एक अच्छी तरह से परिभाषित उद्देश्य फ़ंक्शन के साथ एक अनुकूलन समस्या हल करता है, यह टेम्पलेट मिलान कैसे कर रहा है? यहाँ कौन सा टेम्प्लेट है जिससे किसी इनपुट का मिलान किया जाता है?

मुझे लगता है कि इन टिप्पणियों को उच्च आयामी रिक्त स्थान, तंत्रिका जाल और कर्नेल मशीनों की गहन समझ की आवश्यकता है लेकिन अब तक मैं कोशिश कर रहा हूं और इसके पीछे के तर्क को समझ नहीं सका। लेकिन दो बहुत अलग मिलीलीटर तकनीकों के बीच कनेक्शन को नोट करना निश्चित रूप से दिलचस्प है।

संपादित करें: मुझे लगता है कि तंत्रिका दृष्टिकोण से एसवीएम को समझना बहुत अच्छा होगा। मैं उपरोक्त दो प्रश्नों के गहन गणित समर्थित उत्तर की तलाश कर रहा हूं, ताकि वास्तव में एसवीएम और न्यूरल नेट के बीच की कड़ी को समझ सकें, दोनों कर्नेल ट्रिक के साथ रैखिक एसवीएम और एसवीएम के मामले में।


SVM एक उचित कर्नेल दिए गए प्रशिक्षण के लिए काफी आसान और तेज़ हैं। कुछ कार्यों के लिए गहरे तंत्रिका जाल की आवश्यकता नहीं होती है।
व्लादिस्लाव डोभालगिक्स

@xeon हाय, क्या आप उत्तर पर एक नज़र डाल सकते हैं, मुझे लगता है कि इसमें सुधार की आवश्यकता है। धन्यवाद।
राफेल

जवाबों:


7
  1. SVM तंत्रिका नेटवर्क से कैसे संबंधित है? यह एक उथला नेटवर्क कैसे है?

SVM एक सिंगल लेयर न्यूरल नेटवर्क है जिसमें हिंग लॉस के साथ लॉस फंक्शन और एक्सक्लूसिवली लीनियर ऐक्टिवेशन है। अवधारणा को पिछले थ्रेड्स में बदल दिया गया है, जैसे कि यह एक: सिंगल लेयर न्यूरल नेटवर्क्स रिलेव एक्टिविटी के साथ एसवीएम के बराबर?

  1. SVM एक अच्छी तरह से परिभाषित उद्देश्य फ़ंक्शन के साथ एक अनुकूलन समस्या हल करता है, यह टेम्पलेट मिलान कैसे कर रहा है? यहाँ कौन सा टेम्प्लेट है जिससे किसी इनपुट का मिलान किया जाता है?

ग्राम मैट्रिक्स (कर्नेल मैट्रिक्स, यदि आप पसंद करते हैं) समानता का एक उपाय है। जैसा कि SVM विरल समाधानों की अनुमति देता है, भविष्यवाणी आपके नमूने की तुलना टेम्पलेट्स, अर्थात समर्थन वैक्टर से करने की बात बन जाती है।


उत्तर के लिए धन्यवाद, कृपया कुछ गणित के साथ थोड़ा और समझाएं। यह वास्तव में बहुत अच्छा होगा :)
राफेल

मुझे कमोबेश यही बात समझ में आती है कि मिलान करने वाली बात क्या है, लेकिन मुझे यह कथन नहीं मिला: जैसा कि एसवीएम विरल समाधानों की अनुमति देता है .. क्या विरल समाधानों को यहां कुछ भी करने को मिला है? परिभाषा के अनुसार भविष्यवाणी टेम्प्लेट के साथ एक तौल समानता द्वारा की जाती है, इसलिए मुझे नहीं लगता कि स्पार्सिटी कहां से आती है। इसके अलावा, कृपया काज हानि सक्रियण फ़ंक्शन के बारे में कुछ पंक्तियाँ जोड़ें। बहुत बहुत धन्यवाद :)
राफेल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.