Ep-SVR और nu-SVR (और कम से कम वर्ग SVR) के बीच अंतर


11

मैं यह पता लगाने की कोशिश कर रहा हूं कि एसवीआर किस तरह के डेटा के लिए अनुकूल है।

मैं 4 प्रकार के SVR जानता हूँ:

  • एप्सिलॉन
  • न्यू
  • कम से कम वर्ग और
  • रैखिक।

मैं समझता हूँ कि रैखिक SVR L1 Reg के साथ कमोबेश लसो की तरह है, लेकिन शेष 3 तकनीकों में क्या अंतर है?

जवाबों:


11

में -SVR, पैरामीटर ν समर्थन वैक्टर आप डेटासेट में नमूनों की कुल संख्या के संबंध में अपने समाधान में रखने के लिए इच्छा की संख्या के अनुपात में निर्धारित करने के लिए प्रयोग किया जाता है। में ν पैरामीटर -SVR ενννϵ अनुकूलन समस्या सूत्रीकरण में पेश किया जाता है और यह स्वचालित रूप से (अधिकतम) आप के लिए अनुमान है।

हालांकि, में -SVR आप कैसे डाटासेट बन समर्थन वैक्टर से कई डेटा वैक्टर, यह कुछ हो सकता है पर कोई नियंत्रण नहीं है, यह कई हो सकता है। फिर भी, आप कितना त्रुटि आप अपने मॉडल के लिए अनुमति देगा के कुल नियंत्रण है, और निर्दिष्ट परे कुछ भी होगा ε के अनुपात में दंडित किया जाएगा सीϵϵC , जो नियमितीकरण पैरामीटर है।

मैं जो चाहता हूं, उसके आधार पर मैं दोनों के बीच चयन करता हूं। अगर मैं वास्तव में एक छोटे समाधान (कम समर्थन वाले वैक्टर) के लिए बेताब हूं, तो मैं -SVR चुनता हूं और एक सभ्य मॉडल प्राप्त करने की उम्मीद करता हूं । लेकिन अगर मैं वास्तव में अपने मॉडल में त्रुटि की मात्रा को नियंत्रित करना चाहता हूं और सर्वश्रेष्ठ प्रदर्शन के लिए जाना चाहता हूं, तो मैं ϵ -VVR चुनता हूं और आशा करता हूं कि मॉडल बहुत जटिल नहीं है (बहुत सारे सपोर्ट वैक्टर)।νϵ


5

के बीच अंतर -SVR और ν -SVR कैसे प्रशिक्षण समस्या parametrized जाता है। दोनों लागत समारोह में एक प्रकार का काज हानि का उपयोग करते हैं। Ν पैरामीटर में ν -SVM जिसके परिणामस्वरूप मॉडल में समर्थन वैक्टर की मात्रा को नियंत्रित करने के लिए इस्तेमाल किया जा सकता। उपयुक्त मापदंडों को देखते हुए, ठीक वही समस्या हल हो गई है। 1ϵννν

कम वर्गों में SVR दूसरे वर्गों से भिन्न होता है, जो काज हानि के बजाय लागत फ़ंक्शन में चुकता अवशिष्टों का उपयोग करता है।

ν


आपके उत्तर के लिए धन्यवाद मार्क। तो क्या हम हमारे पास मौजूद डेटासेट के आधार पर उपयुक्त विधि को अलग कर सकते हैं? यदि हां, तो क्या आप मुझे कुछ संकेत दे सकते हैं? मेरे पास 200 अलग-अलग आउटपुट के साथ 40000 नमूने हैं। तो यह 200 अद्वितीय नमूनों के 200 सेटों के रूप में सोचा जा सकता है। सभी 40000 के लिए इनपुट अलग-अलग हैं, बस उत्पादन 200 नमूनों के लिए अद्वितीय है।
शरथ चंद्र

0

मुझे पाब्लो और मार्क दोनों जवाब पसंद हैं। एक अतिरिक्त बिंदु:

मार्क द्वारा उद्धृत पेपर में लिखा है (धारा 4)

νϵϵϵy

[...]

ϵyϵ[1,+1]ϵ[0,1]νϵ

ϵϵν

तुम क्या सोचते हो?

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.