मेरे पास क्रॉस-सत्यापन प्रक्रिया के बारे में एक प्रश्न है। मैं कर्सरा पर मशीन लर्निंग के एक कोर्स के बीच में हूं। विषय में से एक क्रॉस-मान्यता के बारे में है। मुझे इसका पालन करना थोड़ा कठिन लगा। मुझे पता है कि हमें सीवी की आवश्यकता क्यों है क्योंकि हम चाहते हैं कि हमारे मॉडल भविष्य (अज्ञात) डेटा पर अच्छा काम करें और सीवी को ओवरफिटिंग से बचाता है। हालांकि, प्रक्रिया ही भ्रामक है।
जो मैंने समझा है, वह यह है कि मैंने डेटा को 3 सबसेट में विभाजित किया है: प्रशिक्षण, सत्यापन और परीक्षण। ट्रेन और मान्यता एक मॉडल की इष्टतम जटिलता को खोजने के लिए है। जो मुझे समझ में नहीं आता वह तीसरा सबसेट है। मैं समझता हूं कि मैं मॉडल के लिए कई सुविधाएँ लेता हूँ, इसे प्रशिक्षित करता हूँ और सत्यापन उपसमुच्चय पर इसे मान्य करता हूँ और संरचना बदलने पर न्यूनतम लागत फ़ंक्शन की तलाश करता हूँ। जब मुझे यह मिला, तो मैं टेस्ट सब्मिट पर मॉडल का परीक्षण करता हूं। यदि मुझे पहले से ही वैधता के उपसमुच्चय पर न्यूनतम लागत समारोह मिल गया है, तो मुझे इसे फिर से परीक्षण उपसमुच्चय पर परीक्षण करने की आवश्यकता क्यों होगी ???
क्या कोई मेरे लिए यह स्पष्ट कर सकता है?
धन्यवाद