परीक्षण सेट और क्रॉस सत्यापन सेट के अलग-अलग उद्देश्य हैं। यदि आप किसी एक को छोड़ देते हैं, तो आप इसके लाभ खो देते हैं:
आप अपने मॉडल के प्रदर्शन को सही ढंग से मापने के लिए सेट किए गए क्रॉस सत्यापन का उपयोग नहीं कर सकते, क्योंकि आप अपने मापदंडों के सैकड़ों विविधताओं से अधिक संभव रूप से सर्वोत्तम संभावित मीट्रिक प्राप्त करने के लिए जानबूझकर अपने परिणामों को ट्यून करेंगे । इसलिए क्रॉस वैधीकरण परिणाम बहुत आशावादी है।
उसी कारण से, आप क्रॉस सत्यापन सेट को ड्रॉप नहीं कर सकते हैं और हाइपर मापदंडों का चयन करने के लिए परीक्षण सेट का उपयोग कर सकते हैं, क्योंकि तब आप बहुत अधिक गारंटी देते हैं कि आपका मॉडल कितना अच्छा है। आदर्श दुनिया में आप एक बार सेट किए गए परीक्षण का उपयोग करते हैं, या विभिन्न प्रयोगों की तुलना करने के लिए इसे "तटस्थ" फैशन में उपयोग करते हैं।
यदि आप सत्यापन को पार करते हैं, तो सबसे अच्छा मॉडल ढूंढें, फिर ट्रेन में परीक्षण डेटा जोड़ें, यह है संभव है (और कुछ स्थितियों में संभवतः काफी संभावना है) आपके मॉडल में सुधार होगा। हालाँकि, आपके पास यह सुनिश्चित करने का कोई तरीका नहीं है कि क्या वास्तव में ऐसा हुआ है, और यदि ऐसा है, तो भी आपके पास कोई निष्पक्ष अनुमान नहीं है कि नया प्रदर्शन क्या है।
कई कागज़ प्रतियोगिताओं को देखने से, मेरा अनुभव यह है कि परीक्षण द्वारा निर्धारित परीक्षण का उपयोग करना एक वास्तविक बात है, और यह उन प्रतियोगिताओं को बड़े पैमाने पर प्रभावित करता है। अक्सर प्रतियोगियों का एक समूह होता है, जिन्होंने सार्वजनिक लीडरबोर्ड पर चढ़कर परीक्षण में अपने सर्वश्रेष्ठ मॉडल का चयन किया है (सार्वजनिक लीडरबोर्ड प्रभावी रूप से एक परीक्षण सेट है), जबकि उनके क्रॉस सत्यापन पर पूरी तरह से नहीं किया जा रहा है। । । जब अंत में एक नया परीक्षण सेट पेश किया जाता है तो ये प्रतियोगी लीडरबोर्ड को गिरा देते हैं।
एक दृष्टिकोण जो उचित है, परीक्षण से पहले आपके द्वारा पाए गए हाइपर-पारमों का उपयोग करके पुन: प्रशिक्षित करने के लिए (ट्रेन + सीवी) डेटा का फिर से उपयोग करना है। इस तरह से आप अधिक डेटा पर प्रशिक्षण प्राप्त करते हैं, और आपको अभी भी अंत में प्रदर्शन का एक स्वतंत्र माप प्राप्त होता है।
यदि आप क्रॉस सत्यापन से अधिक बाहर निकलना चाहते हैं, तो सामान्य दृष्टिकोण k- गुना क्रॉस सत्यापन है । काग्ले प्रतियोगिताओं में एक आम चाल k- गुना क्रॉस सत्यापन का उपयोग करना है, और डेटा को एक बड़े (ट्रेन + cv) प्रशिक्षण सेट में फिर से संयोजित करने के बजाय, cv परिणामों को मेटा-मॉडल में जोड़ना या स्टैक करना है।
अंत में, हमेशा जांचें कि सत्यापन और परीक्षण के लिए आपके विभाजन आपके डेटा सेट के भीतर संभावित सहसंबंध के खिलाफ मजबूत हैं।