मॉडल चयन और क्रॉस सत्यापन के विषय पर CrossValidated कई धागे हैं। यहाँ कुछ है:
- आंतरिक बनाम बाहरी क्रॉस-मान्यता और मॉडल चयन
- @ DikranMarsupial की सुविधा चयन और क्रॉस-मान्यता के लिए शीर्ष उत्तर
हालांकि, उन थ्रेड्स के उत्तर काफी सामान्य हैं और ज्यादातर मुद्दों को हाइलीकरण और मॉडल चयन को पार करने के लिए विशेष दृष्टिकोण के साथ उजागर करते हैं।
चीजों को यथासंभव ठोस बनाने के लिए, उदाहरण के लिए कहें कि हम एक आरवीएफ कर्नेल के साथ एक SVM के साथ काम कर रहे हैं: , और है कि मैं सुविधाओंएक्सऔर लेबलy केएक डाटासेट है, और है कि मैं चाहता हूँ
- मेरे मॉडल ( C और C) के सर्वोत्तम संभव मान ज्ञात )
- SVM को मेरे डेटासेट के साथ प्रशिक्षित करें (अंतिम तैनाती के लिए)
- इस त्रुटि के आसपास सामान्यीकरण त्रुटि और अनिश्चितता (विचरण) का अनुमान लगाएं
ऐसा करने के लिए, मैं व्यक्तिगत रूप से, एक ग्रिड खोज करते हैं जैसे मैं के हर संभव संयोजन की कोशिश करेगा और γ । सादगी के लिए, हम निम्नलिखित सीमाओं को मान सकते हैं:
अधिक विशेष रूप से, मेरे पूर्ण डेटासेट का उपयोग मैं निम्नलिखित करता हूं:
- हर ( , γ ) जोड़ी के लिए, मैं अपने डेटासेट पर K -fold क्रॉस सत्यापन (जैसे K = 10 ) के पुनरावृत्तियों (जैसे 100 यादृच्छिक दोहराव) को दोहराता हूं, अर्थात मैं K - 1 फोल्ड पर अपने SVM को प्रशिक्षित करता हूं और त्रुटि का मूल्यांकन करता हूं। सभी K सिलवटों के माध्यम से पुनरावृति गुना बाईं ओर । कुल मिलाकर, मैं 100 x 10 = 1000 परीक्षण त्रुटियों को इकट्ठा करता हूं।
- ऐसे प्रत्येक (के लिए , γ ) जोड़ी, मेरा मतलब है और उन 1000 परीक्षण त्रुटियों के विचरण की गणना μ एम , σ एम ।
अब मैं सर्वश्रेष्ठ मॉडल (सर्वोत्तम कर्नेल पैरामीटर) चुनना चाहता हूं जिसका उपयोग मैं अपने अंतिम SVM को संपूर्ण डेटासेट पर प्रशिक्षित करने के लिए करूंगा। मेरी समझ है कि मॉडल था कि चुनने है सबसे कम त्रुटि मतलब और विचरण और σ एम सही विकल्प हो सकता है, और इस मॉडल की है कि μ एम हैं σ एम मॉडल के सामान्यीकरण त्रुटि पूर्वाग्रह और विचरण के मेरे सबसे अच्छे अनुमान जब साथ प्रशिक्षण कर रहे हैं पूर्ण डेटासेट।
लेकिन, ऊपर दिए गए थ्रेड्स में उत्तर पढ़ने के बाद, मुझे यह आभास हो रहा है कि तैनाती और / या अपनी त्रुटि (सामान्यीकरण प्रदर्शन) का अनुमान लगाने के लिए सर्वश्रेष्ठ SVM चुनने की यह विधि त्रुटिपूर्ण है, और यह चुनने के बेहतर तरीके हैं सर्वश्रेष्ठ SVM और इसकी त्रुटि की रिपोर्ट करना। यदि ऐसा है, तो वो क्या हैं? कृपया मुझे एक ठोस जवाब की तलाश है।
इस समस्या से चिपके हुए, मैं विशेष रूप से सबसे अच्छा मॉडल कैसे चुन सकता हूं और इसकी सामान्यीकरण त्रुटि का ठीक से अनुमान लगा सकता हूं ?