हाल ही में मैं एक पेपर पर आया हूं जो एक विशिष्ट डेटासेट पर k-NN क्लासिफायर का उपयोग करने का प्रस्ताव करता है। लेखकों ने विभिन्न k मानों के लिए k-fold क्रॉस सत्यापन करने के लिए उपलब्ध सभी डेटा नमूनों का उपयोग किया और सबसे अच्छा हाइपरमीटर व्यास कॉन्फ़िगरेशन के क्रॉस सत्यापन परिणामों की रिपोर्ट की।
मेरी जानकारी के लिए, यह परिणाम पक्षपाती है, और उन्हें हाइपरपरिमेट ऑप्टिमाइज़ेशन का उपयोग नहीं करने वाले नमूनों पर एक सटीकता अनुमान प्राप्त करने के लिए एक अलग परीक्षण सेट को बनाए रखना चाहिए था।
क्या मैं सही हू? क्या आप कुछ संदर्भ (अधिमानतः शोध पत्र) प्रदान कर सकते हैं जो क्रॉस सत्यापन के इस दुरुपयोग का वर्णन करते हैं?