जवाबों:
हर्गिज नहीं। हालाँकि, क्रॉस सत्यापन आपको यह आकलन करने में मदद करता है कि आपका तरीका कितना अधिक है।
उदाहरण के लिए, यदि आपके प्रशिक्षण डेटा का प्रतिगमन R-squared 0.50 है और क्रॉस-रेवेटेड आर-वर्ग 0.48 है, तो आपके पास शायद ही कोई ओवरफिटिंग हो और आपको अच्छा महसूस हो। दूसरी ओर, यदि क्रॉस-रेवेटेड आर-स्क्वेर्ड यहां केवल 0.3 है, तो आपके मॉडल के प्रदर्शन का एक बड़ा हिस्सा ओवरफिटिंग के कारण आता है न कि सच्चे रिश्तों से। ऐसे मामले में आप या तो कम प्रदर्शन को स्वीकार कर सकते हैं या कम ओवरफिटिंग के साथ विभिन्न मॉडलिंग रणनीतियों की कोशिश कर सकते हैं।
क्रॉस-वैलिडेशन एक अच्छा, लेकिन सही नहीं है, ओवर-फिटिंग को कम करने की तकनीक है।
क्रॉस-वैलिडेशन बाहरी डेटा के लिए अच्छा प्रदर्शन नहीं करेगा यदि आपके पास जो डेटा है वह उस डेटा का प्रतिनिधि नहीं है जिसे आप भविष्यवाणी करने की कोशिश कर रहे हैं!
यहां दो ठोस परिस्थितियां हैं जब क्रॉस-वैलिडेशन में खामियां हैं:
इसके अलावा, मैं स्टैनफोर्ड कोर्स से इन वीडियो को सांख्यिकीय शिक्षा में शामिल कर सकता हूं। ये वीडियो काफी गहराई में जाते हैं कि प्रभावी ढंग से क्रॉस-वैल्यूएशन का उपयोग कैसे करें
क्रॉस-वैलिडेशन और बूटस्ट्रैप (14:01)