बार-बार के-गुना क्रॉस-सत्यापन के रिपोर्टिंग संस्करण


17

मैं बार-बार के-फोल्ड क्रॉस सत्यापन का उपयोग कर रहा हूं और क्रॉस वेलिडेशन के विभिन्न रनों के सिलसिले में भव्य माध्य के रूप में गणना (मूल्यांकन मीट्रिक उदा, संवेदनशीलता, विशिष्टता) का मतलब बता रहा हूं।

हालांकि, मुझे यकीन नहीं है कि मुझे विचरण की रिपोर्ट कैसे देनी चाहिए। मैंने यहां कई सवालों को दोहराया है, जो कि बार-बार क्रॉस-वेलिडेशन पर चर्चा करते हैं, हालांकि, कोई भी नहीं है कि मैं बार-बार क्रॉस वेरिफिकेशन परीक्षणों में स्पष्ट रूप से विचरण के सवाल का जवाब देता हूं।

मैं समझता हूं कि कुल विचरण मॉडल 1 और 2) सीमित नमूना आकार की अस्थिरता के कारण है।

ऐसा लगता है कि बार-बार के-फोल्ड क्रॉस सत्यापन के लिए विचरण की गणना के लिए 4 अलग-अलग दृष्टिकोण हैं:

1) क्रॉस सत्यापन के रन के दौरान अनुमानित औसत प्रदर्शन मीट्रिक (जैसे, सटीकता) का विचरण, विचरण का एक वैध अनुमान है?

2) रन-विशिष्ट संस्करण (पूल पार परीक्षण के एक रन के विभिन्न सिलवटों में गणना की जाती है) द्वारा पूलित विचरण।

3) एक बड़े सदिश में चलने वाले क्रॉस सत्यापन के विभिन्न गुना से वर्गीकरण परिणामों को संक्षिप्त करने के लिए। उदाहरण के लिए, यदि प्रत्येक गुना में परीक्षण डेटा की संख्या 10 है और मेरे पास 10 गुना सीवी है, तो पुनरावृत्ति के लिए परिणामी वेक्टर 100 आकार का होगा। अब, अगर मैं 10 बार अपना क्रॉस-सत्यापन परीक्षण दोहराता हूं, तो मैं करूंगा 100 आकार के 10 वैक्टर हैं, जिनमें से प्रत्येक में 10-गुना सीवी रन से वर्गीकरण के परिणाम हैं। अब, मैं माध्य और विचरण की गणना करता हूं क्योंकि सिंगल रन सीवी के मामले में।

4) मैंने भी (समीकरण 2 और 3 में 1 ) में पढ़ा है कि विचरण बाह्य विचरण और अपेक्षित आंतरिक संलयन का योग है। अगर मैं सही ढंग से समझूं, तो बाहरी विचरण पुनरावृत्ति-विशिष्ट औसत प्रदर्शनों का विचरण है, और आंतरिक विचरण एक क्रॉस वेलिडेशन के रन के विभिन्न सिलवटों में विचरण है।

मैं आपकी मदद और मार्गदर्शन की बहुत सराहना करता हूं जिस पर बार-बार होने वाले क्रॉस-सत्यापन परीक्षण के लिए रिपोर्ट करना उपयुक्त होगा।

धन्यवाद,


"नो फ्री लंच" सिद्धांत की तरह; आप यह सुनिश्चित करने के लिए नहीं कह सकते हैं कि चार में से कोई एक विधि सबसे उपयुक्त है क्योंकि ऐसा लगता है कि आपके द्वारा सूचीबद्ध सभी प्रक्रियाएं उपयुक्त हैं। हालांकि, एक विकल्प दिया गया है, मैं विकल्प 3 के साथ जाऊंगा। इसके पास अधिक डेटा है और जानकारी नहीं खोई गई है जो आपके द्वारा सूचीबद्ध अन्य प्रक्रियाओं के मामले में है।
शिष्य

जवाबों:


2

1 और 3 मुझे अमान्य लगते हैं क्योंकि वे दोहराया रनों के बीच निर्भरता को ध्यान में नहीं रखते हैं। दूसरे शब्दों में, दोहराया के-गुना रन स्वतंत्र डेटा के साथ प्रयोग की वास्तविक पुनरावृत्ति की तुलना में एक दूसरे के समान हैं।

2 एक ही रन के भीतर सिलवटों के बीच निर्भरता को ध्यान में नहीं रखता है।

मुझे 4 के बारे में नहीं पता।

एक संभावित रूप से प्रासंगिक (और हतोत्साहित करने वाला) संदर्भ है बेंगियो और ग्रैंडावेलेट, 2004, "के-फोल्ड क्रॉस-वैलिडेशन के वेरिएंस का कोई निष्पक्ष अनुमानक नहीं"

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.