मैं अक्सर लोगों को नेस्टेड क्रॉस सत्यापन के विशेष मामले के रूप में 5x2 क्रॉस-सत्यापन के बारे में बात करते हुए देखता हूं ।
मैं पहली संख्या मानता हूं (यहां: 5) आंतरिक लूप में सिलवटों की संख्या को संदर्भित करता है और दूसरी संख्या (यहां: 2) बाहरी लूप में सिलवटों की संख्या को संदर्भित करता है? तो, यह "पारंपरिक" मॉडल चयन और मूल्यांकन दृष्टिकोण से कैसे अलग है? "पारंपरिक" से मेरा मतलब है
- डेटासेट को एक अलग प्रशिक्षण (जैसे, 80%) और परीक्षण सेट में विभाजित करें
- प्रशिक्षण सेट पर हाइपरपैरेट ट्यूनिंग और मॉडल चयन के लिए k- गुना क्रॉस-वैधीकरण (जैसे, k = 10) का उपयोग करें
- परीक्षण सेट का उपयोग करके चयनित मॉडल के सामान्यीकरण प्रदर्शन का मूल्यांकन करें
क्या 5x2 बिल्कुल समान नहीं है सिवाय इसके कि परीक्षण और प्रशिक्षण सेट का आकार बराबर है यदि k = 2?