मैं k- गुना सत्यापन के बारे में पढ़ रहा हूं, और मैं यह सुनिश्चित करना चाहता हूं कि मैं समझता हूं कि यह कैसे काम करता है।
मुझे पता है कि होल्डआउट पद्धति के लिए, डेटा को तीन सेटों में विभाजित किया जाता है, और परीक्षण सेट का उपयोग केवल मॉडल के प्रदर्शन का आकलन करने के लिए किया जाता है, जबकि सत्यापन सेट का उपयोग हाइपरपैरमीटर ट्यूनिंग के लिए किया जाता है, आदि।
के-फोल्ड विधि में, क्या हम अभी भी बहुत अंत के लिए एक परीक्षण सेट करते हैं, और केवल प्रशिक्षण और हाइपरपैरेट ट्यूनिंग के लिए शेष डेटा का उपयोग करते हैं, अर्थात हम शेष डेटा को के फोल्ड में विभाजित करते हैं, और फिर प्रशिक्षण के बाद औसत सटीकता का उपयोग करते हैं। प्रत्येक तह के साथ (या जो भी प्रदर्शन मीट्रिक हम अपने हाइपरपैरमीटर को ट्यून करने के लिए चुनते हैं)? या हम एक अलग परीक्षण सेट का उपयोग नहीं करते हैं, और बस संपूर्ण डेटासेट को k सिलवटों में विभाजित करते हैं (यदि यह मामला है, तो मुझे लगता है कि हम कश्मीर तह पर औसत सटीकता को हमारी अंतिम सटीकता मानते हैं)?