क्रॉस-वैलिडेशन द्वारा अपने पेपर रैखिक मॉडल चयन में , जुन शाओ दर्शाता है कि बहुभिन्नरूपी रैखिक प्रतिगमन में चर चयन की समस्या के लिए, छुट्टी-एक-आउट क्रॉस सत्यापन (एलओओसीवी) की विधि 'एसिम्पटोट असंगत' है। सादे अंग्रेजी में, यह बहुत अधिक चर वाले मॉडल का चयन करता है। एक सिमुलेशन अध्ययन में, शाओ दिखाता है कि 40 से अधिक टिप्पणियों के लिए भी, LOOCV अन्य क्रॉस-सत्यापन तकनीकों को कमजोर कर सकता है।
यह कागज कुछ विवादास्पद है, और कुछ हद तक नजरअंदाज किया गया है (इसके प्रकाशन के 10 साल बाद, मेरे केमोमेट्रिक्स सहयोगियों ने कभी इसके बारे में नहीं सुना था और चर चयन के लिए LOOCV का उपयोग खुशी से कर रहे थे ...)। एक विश्वास भी है (मैं इसका दोषी हूं), कि इसके परिणाम मूल सीमित दायरे से कुछ हद तक आगे हैं।
प्रश्न, फिर: ये परिणाम कितने दूर तक फैलते हैं? क्या वे निम्नलिखित समस्याओं पर लागू होते हैं?
- लॉजिस्टिक रिग्रेशन / जीएलएम के लिए परिवर्तनीय चयन?
- फिशर एलडीए वर्गीकरण के लिए परिवर्तनीय चयन?
- परिमित (या अनंत) कर्नेल स्थान के साथ SVM का उपयोग करके परिवर्तनीय चयन?
- वर्गीकरण में मॉडल की तुलना, एसवीएम को विभिन्न गुठली का उपयोग करते हुए कहते हैं?
- रैखिक प्रतिगमन में मॉडल की तुलना, रिज प्रतिगमन के लिए एमएलआर की तुलना कहते हैं?
- आदि।