हालांकि निजी परीक्षण सेट के परिणामों का उपयोग मॉडल को और अधिक परिष्कृत करने के लिए नहीं किया जा सकता है, लेकिन क्या मॉडल का चयन निजी परीक्षण सेट परिणामों के आधार पर नहीं किया जा रहा है? क्या आप अकेले उस प्रक्रिया के माध्यम से, निजी परीक्षण सेट पर ओवरफिटिंग नहीं करेंगे?
के अनुसार "छद्म गणित और वित्तीय charlatanism: backtest Overfitting के प्रभाव से बाहर का नमूना प्रदर्शन पर" बेली et.al. द्वारा एक ही डेटासेट पर मूल्यांकन किए गए बड़ी संख्या में मॉडलों में से सर्वश्रेष्ठ का चयन करते समय "ओवरफिट" करना अपेक्षाकृत आसान है। क्या ऐसा कागल के निजी लीडरबोर्ड के साथ नहीं हो रहा है?
- निजी लीडरबोर्ड पर सबसे अच्छा प्रदर्शन करने वाले मॉडल के लिए सांख्यिकीय औचित्य क्या हैं जो मॉडल से आउट-ऑफ-सैंपल डेटा को सामान्य करते हैं?
- क्या कंपनियां वास्तव में विजेता मॉडल का उपयोग करती हैं, या केवल "गेम के नियम" प्रदान करने के लिए निजी लीडरबोर्ड है, और कंपनियां वास्तव में उस अंतर्दृष्टि में अधिक रुचि रखती हैं जो समस्या की चर्चा से उत्पन्न होती है?