परीक्षण डेटा पर EDA को लागू करना गलत है।
प्रशिक्षण सर्वश्रेष्ठ मॉडल बनाने के लिए सही उत्तरों को देखने की प्रक्रिया है। यह प्रक्रिया केवल प्रशिक्षण डेटा पर चलने वाले कोड तक सीमित नहीं है। ईडीए से जानकारी का उपयोग करके यह तय करने के लिए कि कौन से मॉडल का उपयोग करना है, मापदंडों को ट्वीक करना, और इसके बाद प्रशिक्षण प्रक्रिया का हिस्सा है और इसलिए इसे परीक्षण डेटा तक पहुंच की अनुमति नहीं दी जानी चाहिए। तो अपने आप को सच होने के लिए, अपने मॉडल के प्रदर्शन की जांच करने के लिए केवल परीक्षण डेटा का उपयोग करें।
इसके अलावा, अगर आपको लगता है कि मॉडल परीक्षण के दौरान अच्छा प्रदर्शन नहीं करता है और फिर आप अपने मॉडल को समायोजित करने के लिए वापस जाते हैं, तो यह भी अच्छा नहीं है। इसके बजाय, अपने प्रशिक्षण डेटा को दो में विभाजित करें। प्रशिक्षण के लिए एक का उपयोग करें और दूसरे को अपने मॉडल (परीक्षणों) का परीक्षण और ट्विक करने के लिए उपयोग करें। देखें कि परीक्षण सेट और सत्यापन सेट के बीच अंतर क्या है?