मेरे पास कुछ डेटा है और मैं इस डेटा से एक मॉडल (एक रैखिक प्रतिगमन मॉडल कहना) का निर्माण करना चाहता हूं। अगले चरण में, मैं मॉडल पर लीव-वन-आउट क्रॉस-वैलिडेशन (LOOCV) लागू करना चाहता हूं ताकि देखें कि यह कितना अच्छा प्रदर्शन करता है।
अगर मुझे LOOCV सही समझ में आता है, तो मैं इस नमूने (प्रशिक्षण सेट) को छोड़कर प्रत्येक नमूने का उपयोग करके अपने प्रत्येक नमूने (परीक्षण सेट) के लिए एक नया मॉडल बनाता हूं। फिर मैं परीक्षण सेट की भविष्यवाणी करने और त्रुटियों की गणना करने के लिए मॉडल का उपयोग करता हूं ।
अगले चरण में मैं चुने गए फ़ंक्शन का उपयोग करके उत्पन्न सभी त्रुटियों को एकत्रित करता हूं, उदाहरण के लिए चुकता त्रुटि। मैं इन मूल्यों का उपयोग मॉडल की गुणवत्ता (या फिट की भलाई) पर न्याय करने के लिए कर सकता हूं।
प्रश्न: वह मॉडल कौन सा मॉडल है, जिसके लिए ये गुणवत्ता-मूल्य लागू होते हैं, इसलिए यदि मुझे LOOCV से उत्पन्न मेट्रिक्स मेरे मामले के लिए उपयुक्त हैं तो मुझे कौन सा मॉडल चुनना चाहिए? LOOCV ने विभिन्न मॉडलों (जहां नमूना आकार है) को देखा; मुझे कौन सा मॉडल चुनना चाहिए?
- क्या यह मॉडल है जो सभी नमूनों का उपयोग करता है? इस मॉडल की गणना LOOCV प्रक्रिया के दौरान कभी नहीं की गई थी!
- क्या यह मॉडल है जिसमें कम से कम त्रुटि है?