मुझे लगता है कि क्रॉस-वेलिडेशन के उद्देश्य की समझ में आप अभी भी कुछ याद कर रहे हैं।
आइए कुछ शब्दावली को सीधे प्राप्त करें, आम तौर पर जब हम कहते हैं कि 'एक मॉडल' हम यह बताने के लिए एक विशेष पद्धति का उल्लेख करते हैं कि कुछ इनपुट डेटा किस तरह से संबंधित है जिसे हम भविष्यवाणी करने की कोशिश कर रहे हैं। हम आम तौर पर अलग-अलग मॉडल के रूप में उस पद्धति के विशेष उदाहरणों का उल्लेख नहीं करते हैं। तो आप कह सकते हैं कि 'मेरे पास एक रेखीय प्रतिगमन मॉडल है' लेकिन आप प्रशिक्षित गुणांक के दो अलग-अलग सेटों को अलग-अलग मॉडल नहीं कहेंगे। कम से कम मॉडल चयन के संदर्भ में नहीं।
तो, जब आप K- गुना क्रॉस सत्यापन करते हैं, तो आप परीक्षण कर रहे हैं कि आपका मॉडल कितनी अच्छी तरह से कुछ डेटा द्वारा प्रशिक्षित करने में सक्षम है और फिर डेटा का अनुमान नहीं लगाया है। हम इसके लिए क्रॉस सत्यापन का उपयोग करते हैं क्योंकि यदि आप अपने पास मौजूद सभी डेटा का उपयोग करके प्रशिक्षण लेते हैं, तो आपके पास परीक्षण के लिए कोई भी नहीं बचा है। आप ऐसा एक बार कर सकते हैं, कह सकते हैं कि 80% डेटा का उपयोग करके प्रशिक्षित करें और 20% का परीक्षण करें, लेकिन क्या होगा यदि आप परीक्षण करने के लिए 20% का उपयोग करते हैं, तो उन बिंदुओं का एक गुच्छा होता है जो विशेष रूप से आसान होते हैं (या विशेष रूप से कठिन) भविष्यवाणी करना? हम सीखने और भविष्यवाणी करने की मॉडल क्षमता के सर्वोत्तम अनुमान के साथ नहीं आए हैं।
हम सभी डेटा का उपयोग करना चाहते हैं। इसलिए 80/20 के विभाजन के उपरोक्त उदाहरण को जारी रखने के लिए, हम मॉडल को 5% पर 80% डेटा और 20% पर परीक्षण करके 5 गुना क्रॉस सत्यापन करेंगे। हम सुनिश्चित करते हैं कि प्रत्येक डेटा बिंदु ठीक एक बार सेट किए गए 20% परीक्षण में समाप्त हो। इसलिए हमने प्रत्येक डेटा बिंदु का उपयोग किया है, हमें यह समझने में योगदान देना होगा कि हमारा मॉडल कुछ डेटा से सीखने और अपने नए डेटा की भविष्यवाणी करने के कार्य को कितनी अच्छी तरह से करता है।
लेकिन क्रॉस-वैलिडेशन का उद्देश्य हमारे अंतिम मॉडल के साथ नहीं आना है। हम किसी भी वास्तविक भविष्यवाणी को करने के लिए अपने प्रशिक्षित मॉडल के इन 5 उदाहरणों का उपयोग नहीं करते हैं। इसके लिए हम उन सभी डेटा का उपयोग करना चाहते हैं जिन्हें हमें सबसे अच्छे मॉडल के साथ लाना है। क्रॉस-वैलिडेशन का उद्देश्य मॉडल की जाँच है, न कि मॉडल बिल्डिंग।
अब, मान लें कि हमारे पास दो मॉडल हैं, एक रैखिक प्रतिगमन मॉडल और एक तंत्रिका नेटवर्क कहते हैं। हम कैसे कह सकते हैं कि कौन सा मॉडल बेहतर है? हम K- गुना क्रॉस-सत्यापन कर सकते हैं और देख सकते हैं कि कौन सा परीक्षण सेट बिंदुओं की भविष्यवाणी करने में बेहतर साबित होता है। लेकिन एक बार जब हमने बेहतर प्रदर्शन करने वाले मॉडल का चयन करने के लिए क्रॉस-वैलिडेशन का उपयोग किया है, तो हम सभी डेटा पर उस मॉडल (चाहे वह रैखिक प्रतिगमन या तंत्रिका नेटवर्क हो) को प्रशिक्षित करते हैं। हम अपने अंतिम पूर्वानुमान मॉडल के लिए क्रॉस-वैलिडेशन के दौरान प्रशिक्षित वास्तविक मॉडल उदाहरणों का उपयोग नहीं करते हैं।
ध्यान दें कि एक तकनीक है जिसे बूटस्ट्रैप एकत्रीकरण कहा जाता है (आमतौर पर 'बैगिंग' को छोटा किया जाता है) जो एक तरह से निर्मित मॉडल उदाहरणों का उपयोग करता है, जो एक पहनावा मॉडल बनाने के लिए क्रॉस-वैरिफिकेशन के समान होता है, लेकिन यह एक उन्नत तकनीक है जो दायरे से परे है अपने सवाल यहाँ