यह कहें कि मेरे पास एक वर्गीकरण समस्या, और लिए दो सीखने के तरीके हैं , और मैं उनके सामान्यीकरण प्रदर्शन का अनुमान लगाता हूं जैसे कि बार-बार क्रॉस सत्यापन या बूटस्ट्रैपिंग। इस प्रक्रिया से मैं एक मिल स्कोर के वितरण और (जैसे एक मॉडल के लिए आरओसी एयूसी मानों का वितरण) इन पुनरावृत्ति भर में प्रत्येक विधि के लिए।
इन वितरणों को देखते हुए, यह हो सकता है, लेकिन उस (यानी का अपेक्षित सामान्यीकरण प्रदर्शन से अधिक है , लेकिन इस अनुमान के बारे में अधिक अनिश्चितता है)।
मुझे लगता है कि इसे प्रतिगमन में पूर्वाग्रह-विचलन दुविधा कहा जाता है ।
क्या गणितीय तरीकों मैं तुलना करने के लिए उपयोग कर सकते हैं और और अंत में जो मॉडल के बारे में उपयोग करने के लिए एक सूचित निर्णय लेने?
नोट: सादगी के लिए, मैं यहां दो विधियों और का उल्लेख कर रहा हूं, लेकिन मैं उन विधियों में रुचि रखता हूं, जिनका उपयोग ~ 1000 सीखने के तरीकों (जैसे ग्रिड खोज से) के स्कोर के वितरण और अंततः करने के लिए किया जा सकता है मॉडल का उपयोग करने के बारे में एक अंतिम निर्णय।