cross-validation पर टैग किए गए जवाब

मॉडल की फिटिंग के दौरान बार-बार डेटा के सबसेट को रोकना ताकि रोक दिया गया डेटा के सबसेट पर मॉडल के प्रदर्शन को निर्धारित किया जा सके।

10
होल्ड-आउट सत्यापन बनाम क्रॉस-सत्यापन
मेरे लिए, ऐसा लगता है कि होल्ड-आउट सत्यापन बेकार है। यही है, मूल डेटासेट को दो-भागों (प्रशिक्षण और परीक्षण) में विभाजित करना और परीक्षण स्कोर का सामान्यीकरण उपाय के रूप में उपयोग करना, कुछ हद तक बेकार है। K- गुना क्रॉस-वैधीकरण सामान्यीकरण के बेहतर सन्निकटन देता है (क्योंकि यह हर …

5
सांख्यिकीय शिक्षा में iid धारणा के महत्व पर
सांख्यिकीय सीखने में, परोक्ष या स्पष्ट रूप से, एक हमेशा मानता है कि प्रशिक्षण सेट D={X,y}D={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \} से बना है NNN इनपुट / प्रतिक्रिया tuples (Xi,yi)(Xi,yi)({\bf{X}}_i,y_i) कि कर रहे हैं स्वतंत्र रूप से एक ही संयुक्त वितरण से तैयार P(X,y)P(X,y)\mathbb{P}({\bf{X}},y) साथ p(X,y)=p(y|X)p(X)p(X,y)=p(y|X)p(X) p({\bf{X}},y) = p( …

3
स्तरीकृत क्रॉस-सत्यापन को समझना
स्तरीकृत क्रॉस-वेलिडेशन और क्रॉस-वैलिडेशन के बीच अंतर क्या है ? विकिपीडिया कहता है: में स्तरीकृत कश्मीर गुना पार सत्यापन , परतों का चयन किया जाता है, ताकि मतलब प्रतिक्रिया मूल्य सभी परतों में लगभग बराबर है। एक द्विबीजपत्री वर्गीकरण के मामले में, इसका मतलब है कि प्रत्येक तह में लगभग …

6
उच्च आयाम ( ) में रिज रिग्रेशन बेकार है ? ओएलएस ओवरफिट करने में कैसे विफल हो सकता है?
भविष्यवक्ताओं और नमूना आकार साथ एक अच्छी पुरानी प्रतिगमन समस्या पर विचार करें । सामान्य ज्ञान यह है कि ओएलएस आकलनकर्ता ओवरफिट करेगा और आम तौर पर रिज रिग्रेशन अनुमानक द्वारा बेहतर प्रदर्शन करेगा:यह एक इष्टतम नियमितीकरण पैरामीटर खोजने के लिए क्रॉस-मान्यता का उपयोग करने के लिए मानक है । …

1
यदि प्रशिक्षण लक्ष्य है तो मानकीकरण / प्रशिक्षण और सामान्यीकरण कैसे लागू करें?
क्या मैं एक ही समय में अपने सभी डेटा या सिलवटों को बदल देता हूं (यदि CV लागू है)? जैसे (allData - mean(allData)) / sd(allData) क्या मैं ट्रेनसेट और टेस्टसेट को अलग-अलग करूंगा? जैसे (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) या क्या मैं ट्रेनसेट को बदल …

2
परतों में का इष्टतम संख्या पार सत्यापन गुना: हमेशा सबसे अच्छा विकल्प है छुट्टी-एक-बाहर सीवी?
कम्प्यूटिंग पावर विचारों को एक तरफ करने के लिए, क्या यह मानने के कोई कारण हैं कि क्रॉस-वैलिडेशन में सिलवटों की संख्या बढ़ने से बेहतर मॉडल चयन / सत्यापन होता है (यानी कि सिलवटों की संख्या जितनी अधिक होगी)? चरम पर तर्क लेते हुए छुट्टी-एक-बाहर पार सत्यापन जरूरी बेहतर मॉडल …

4
क्रॉस-वैधीकरण तकनीकों का संग्रह
मैं सोच रहा था कि किसी को भी उनके बीच के मतभेदों की चर्चा के साथ क्रॉस-वैलिडेशन तकनीकों के एक संग्रह के बारे में पता हो और उनमें से प्रत्येक का उपयोग करने के लिए एक गाइड हो। विकिपीडिया में सबसे आम तकनीकों की एक सूची है, लेकिन अगर अन्य …

3
क्रॉस-मान्यता का उपयोग करते समय एक मानक त्रुटि नियम के लिए अनुभवजन्य औचित्य
क्या कोई अनुभवजन्य अध्ययन पारसीमोनी के पक्ष में एक मानक त्रुटि नियम के उपयोग को सही ठहरा रहा है? जाहिर है कि यह डेटा के डेटा-जनरेशन प्रोसेस पर निर्भर करता है, लेकिन डेटासेट के एक बड़े कॉर्पस का विश्लेषण करने वाली कोई भी चीज़ बहुत दिलचस्प होगी। क्रॉस-वेलिडेशन के माध्यम …

3
का प्रसरण
TL, DR: ऐसा प्रतीत होता है कि, बार-बार की गई सलाह के विपरीत, लीव-वन-आउट क्रॉस वैरिडेशन (LOO-CV) - यानीकश्मीरकश्मीरK साथ Fold CVकश्मीरकश्मीरK(एनएनN की संख्या केबराबर)प्रशिक्षण टिप्पणियों का) - सामान्यीकरण त्रुटि का अनुमान लगाता है जोकिसी भी K के लिएसबसे कम परिवर्तनशील है, न कि सबसे अधिक चर,मॉडल / एल्गोरिथ्म, डेटासेट, …

7
क्या पारगमन के लिए सत्यापन का उपयोग किया जा सकता है?
सभी संदर्भों में मैं क्रॉस-वैलिडेशन से परिचित हूं यह पूरी तरह से भविष्य कहनेवाला सटीकता बढ़ाने के लक्ष्य के साथ उपयोग किया जाता है। क्या चरों के बीच निष्पक्ष संबंधों का अनुमान लगाने में क्रॉस वैधीकरण के तर्क को बढ़ाया जा सकता है? जबकि रिचर्ड बर्क का यह पेपर "अंतिम" …

5
समय-श्रृंखला विश्लेषण को क्रॉस-मान्य करना
मैं आर में कैरेट पैकेज का उपयोग वर्गीकरण और प्रतिगमन के लिए भविष्य कहनेवाला मॉडल बनाने के लिए कर रहा हूं । कैरेट क्रॉस सत्यापन या बूट स्टैपिंग द्वारा मॉडल हाइपर-मापदंडों को ट्यून करने के लिए एक एकीकृत इंटरफ़ेस प्रदान करता है। उदाहरण के लिए, यदि आप वर्गीकरण के लिए …

1
जब नेस्टेड क्रॉस-मान्यता वास्तव में आवश्यक है और व्यावहारिक अंतर बना सकती है?
मॉडल चयन करने के लिए क्रॉस-वैलिनेशन का उपयोग करते समय (जैसे कि हाइपरपरमेटर ट्यूनिंग) और सबसे अच्छे मॉडल के प्रदर्शन का आकलन करने के लिए, किसी को नेस्टेड क्रॉस-वैलेडेशन का उपयोग करना चाहिए । बाहरी लूप मॉडल के प्रदर्शन का आकलन करने के लिए है, और आंतरिक लूप सर्वश्रेष्ठ मॉडल …

2
मुझे कैसे पता चलेगा कि क्रॉस सत्यापन का कौन सा तरीका सबसे अच्छा है?
मैं यह पता लगाने की कोशिश कर रहा हूं कि मेरी स्थिति के लिए कौन सी क्रॉस सत्यापन विधि सबसे अच्छी है। निम्नलिखित डेटा समस्या (आर) के माध्यम से काम करने के लिए सिर्फ एक उदाहरण है, लेकिन मेरे वास्तविक Xडेटा ( xmat) एक दूसरे के साथ सहसंबंधित हैं और …

3
पीसीए और ट्रेन / परीक्षण विभाजित
मेरे पास एक डेटासेट है जिसके लिए मेरे पास बाइनरी लेबल के कई सेट हैं। लेबलों के प्रत्येक सेट के लिए, मैं एक क्लासिफायरियर को प्रशिक्षित करता हूं, इसे क्रॉस-वैलिडेशन द्वारा मूल्यांकन करता हूं। मैं प्रमुख घटक विश्लेषण (पीसीए) का उपयोग करके आयामीता कम करना चाहता हूं। मेरा सवाल यह …

2
मॉडल चयन और क्रॉस-सत्यापन: सही तरीका
मॉडल चयन और क्रॉस सत्यापन के विषय पर CrossValidated कई धागे हैं। यहाँ कुछ है: आंतरिक बनाम बाहरी क्रॉस-मान्यता और मॉडल चयन @ DikranMarsupial की सुविधा चयन और क्रॉस-मान्यता के लिए शीर्ष उत्तर हालांकि, उन थ्रेड्स के उत्तर काफी सामान्य हैं और ज्यादातर मुद्दों को हाइलीकरण और मॉडल चयन को …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.