मेरा मुख्य प्रश्न यह समझने की कोशिश करना है कि प्रशिक्षण / सत्यापन / परीक्षण सेट (यदि यह इस तरह के संदर्भ में बिल्कुल फिट बैठता है) के संदर्भ में k- गुना क्रॉस-वैलिडेशन कैसे फिट बैठता है।
आमतौर पर, लोग डेटा को एक प्रशिक्षण, सत्यापन और परीक्षण सेट में विभाजित करने की बात करते हैं - एंड्रयू एनजी पाठ्यक्रम के अनुसार 60/20/20 के अनुपात में कहते हैं - जिससे सत्यापन सेट का उपयोग मॉडल प्रशिक्षण के लिए इष्टतम मापदंडों की पहचान करने के लिए किया जाता है।
हालाँकि, यदि कोई डेटा की मात्रा अपेक्षाकृत कम होने के कारण अधिक प्रतिनिधि सटीकता माप प्राप्त करने की उम्मीद में k- गुना क्रॉस-वैधीकरण का उपयोग करना चाहता था, तो इस 60/20/20 विभाजन में k- गुना क्रॉस-वेलिडेशन वास्तव में क्या करता है परिदृश्य?
उदाहरण के लिए, क्या इसका मतलब यह होगा कि हम वास्तव में प्रशिक्षण और परीक्षण सेट (डेटा का 80%) को संयोजित करेंगे और हमारे सटीकता माप प्राप्त करने के लिए उन पर के-गुना क्रॉस सत्यापन करेंगे (प्रभावी रूप से एक स्पष्ट 'परीक्षण सेट' होने के साथ त्याग देंगे? यदि ऐसा है, तो हम किस प्रशिक्षित मॉडल का उपयोग उत्पादन में a) करते हैं, और ख) सत्यापन सेट के खिलाफ उपयोग करने और इष्टतम प्रशिक्षण मापदंडों की पहचान करने के लिए? उदाहरण के लिए, ए और बी के लिए एक संभावित उत्तर सबसे अच्छा-गुना मॉडल का उपयोग करना है।