मान लीजिए कि मैंने प्रशिक्षण सेट पर कई मॉडलों को प्रशिक्षित किया, परीक्षण सेट पर क्रॉस सत्यापन सेट और मापा प्रदर्शन का उपयोग करके सबसे अच्छा एक का चयन करें। इसलिए अब मेरे पास एक अंतिम सर्वश्रेष्ठ मॉडल है। क्या मुझे प्रशिक्षण सेट पर प्रशिक्षित अपने सभी उपलब्ध डेटा या जहाज समाधान पर इसे वापस लेना चाहिए? यदि बाद में, तो क्यों?
अद्यतन: जैसा कि @ P.Windridge ने उल्लेख किया है, मूल रूप से सत्यापन के बिना एक मॉडल को शिपिंग करने का मतलब है एक मुकर गया मॉडल शिपिंग। लेकिन हम परीक्षण सेट के प्रदर्शन की रिपोर्ट कर सकते हैं और उसके बाद मॉडल को पूर्ण डेटा पर फिर से पकड़ना उचित प्रदर्शन की अपेक्षा करते हुए बेहतर प्रदर्शन करते हैं - क्योंकि हम अपने सर्वश्रेष्ठ मॉडल और अधिक डेटा का उपयोग करते हैं। ऐसी कार्यप्रणाली से क्या समस्याएं पैदा हो सकती हैं?