क्रॉस सत्यापन के बारे में अच्छा साहित्य


10

क्या कोई क्रॉस सत्यापन की तकनीक सीखना शुरू करने के लिए एक अच्छी किताब / वेबपेज जानता है?

जवाबों:



5

यदि क्रॉस-सत्यापन का उपयोग मॉडल / सुविधा चयन के लिए किया जाना है, तो यह ध्यान में रखने योग्य है कि क्रॉस-वैधीकरण आंकड़े को ओवर-फिट करना और खराब प्रदर्शन करने वाले मॉडल के साथ समाप्त होना संभव है, और अनुकूलित क्रॉस-वैधीकरण आंकड़ा एक गंभीर आशावादी प्रदर्शन अनुमान हो सकता है। इसके प्रभाव आश्चर्यजनक रूप से बड़े हो सकते हैं। एक मॉडल चयन सेटिंग में एक उदाहरण के लिए एक सुविधा चयन सेटिंग में Cawley और टैलबोट इसके उदाहरण के लिए Ambroise और McLachlan देखें ।


इसका उल्लेख करना अच्छा है, लेकिन यह दोगुना होना चाहिए कि वे सीवी के दुरुपयोग या ओवरट्रस्टिंग के उदाहरण हैं, न कि विधि की कुछ कमियां।

1
वास्तव में, हालांकि यह एक ऐसा तरीका है जिसमें इसका आमतौर पर दुरुपयोग किया जाता है - इसलिए क्रॉस-वैधीकरण के बारे में सीखते समय जागरूक होना जरूरी है! अधिक क्रॉस-वेलिडेशन अक्सर एक अच्छा समाधान होता है, अर्थात नेस्ट क्रॉस-वेलिडेशन, या जैसा कि स्टोन इसे "डबल-क्रॉस" सत्यापन कहते हैं। समस्या किसी भी सुविधा या मॉडल चयन मानदंड को बहुत प्रभावित करती है जो एक मॉडल प्राप्त करने के लिए अनुकूलित है; इस अर्थ में क्रॉस-वैलिडेशन के बारे में कुछ खास नहीं है।
डिक्रान मार्सुपियल

0

मैं Payam Refaeilzadeh, Lei Tang और Huan लियू द्वारा क्रॉस-वैलिडेशन की भी सिफारिश करूंगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.