K- गुना क्रॉस-मान्यता के साथ, क्या आप अंतिम मॉडल बनाने के लिए सभी मॉडल का औसत रखते हैं ?


13

K- गुना क्रॉस सत्यापन करते समय, मैं समझता हूं कि आप उस एक को छोड़कर सभी गुनाओं को इंगित करके सटीकता मीट्रिक प्राप्त करते हैं और पूर्वानुमान बनाते हैं, और फिर इस प्रक्रिया को बार दोहराते हैं । इसके बाद आप अपने सभी उदाहरणों पर सटीकता मेट्रिक्स चला सकते हैं (सटीक, रीकॉल, सही ढंग से वर्गीकृत%), जो समान होना चाहिए जैसे कि आपने हर बार उनकी गणना की और फिर परिणाम को औसत किया (यदि मैं गलत हूं तो मुझे सही करें)।k

अंतिम परिणाम जो आप चाहते हैं वह एक अंतिम मॉडल है।

क्या आप उस मॉडल के साथ समाप्त होने के लिए अनुमानों के अपने सेट को बनाने के लिए प्राप्त मॉडल को औसत करते हैं जिसमें उपरोक्त विधि द्वारा प्राप्त सटीकता मीट्रिक है?k

जवाबों:


15

का उद्देश्य गुना पार सत्यापन एक मॉडल का उत्पादन करने के लिए नहीं है, यह मॉडल की तुलना करना है।k

एक क्रॉस सत्यापन प्रयोग के परिणाम आपको बता सकते हैं कि वेक्टर मशीनें आपके डेटा पर Naive Bayes का समर्थन करती हैं, या इस विशेष डेटा सेट के लिए क्लासिफायर के हाइपर पैरामीटर को c पर सेट किया जाना चाहिए। इस ज्ञान के साथ सशस्त्र, आप तब उपलब्ध डेटा के सभी के साथ एक "उत्पादन" क्लासिफायरियर को प्रशिक्षित करते हैं और इसे अपनी समस्या पर लागू करते हैं।

कई मामलों में, यह भी स्पष्ट नहीं है कि आप कई मॉडलों के औसत के बारे में कैसे जाएंगे। उदाहरण के लिए, तीन निर्णय पेड़ों या निकटतम पड़ोसी क्लासिफायर का औसत क्या है?

यह ध्यान रखना महत्वपूर्ण है कि क्रॉस सत्यापन के परिणाम अनुमान हैं, गारंटी नहीं, और ये अनुमान अधिक मान्य हैं यदि उत्पादन क्लासिफायरियर डेटा की एक समान गुणवत्ता (और मात्रा) के साथ प्रशिक्षित किया जाता है। अनुमान लगाने के लिए इन अनुमानों का उपयोग करने के तरीकों को विकसित करने के लिए उचित मात्रा में काम किया गया है; यह कहना है, एक सांख्यिकीय रूप से ध्वनि करने के लिए, इन आंकड़ों पर विधि A आमतौर पर B से बेहतर है।


2
अनुमान के लिए k- गुना क्रॉस सत्यापन अनुमानों का उपयोग करने पर एक अच्छा संदर्भ क्या है? यदि आप एक अच्छा हिस्सा है, तो मुझे उस पर पढ़ना अच्छा लगेगा।
टेंकलेनॉर्म

1
शुरू करने के लिए एक सभ्य जगह iro.umontreal.ca/~lisa/bib/pub_subject/finance/pointeurs/… हो सकती है, लेकिन विभिन्न दृष्टिकोणों का एक समूह है।
मैट क्रैस

1
एक और बात स्पष्ट करने के लिए: जब हम सभी डेटा का उपयोग करके "प्रोडक्शन" क्लासिफायरफ़ायर ट्रेन करते हैं तो हम कैसे समझते हैं कि कब रोकना है?
एंटोन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.