cross-validation पर टैग किए गए जवाब

मॉडल की फिटिंग के दौरान बार-बार डेटा के सबसेट को रोकना ताकि रोक दिया गया डेटा के सबसेट पर मॉडल के प्रदर्शन को निर्धारित किया जा सके।

1
कब / कहाँ कार्यात्मक डेटा विश्लेषण का उपयोग करें?
मैं कार्यात्मक डेटा विश्लेषण (एफडीए) के लिए बहुत नया हूं । मैं पढ़ रहा हु: रामसे, जेम्स ओ।, और सिल्वरमैन, बर्नार्ड डब्ल्यू। (2006), फ़ंक्शनल डेटा एनालिसिस, 2 डी एड, स्प्रिंगर, न्यूयॉर्क। हालांकि, मैं अभी भी बहुत स्पष्ट नहीं हूं कि एफडीए का उपयोग कहां / कब करना है? क्या कोई …

2
"बूटस्ट्रैप वेलिडेशन" के लिए प्रक्रिया क्या है (उर्फ "रेज़म्पलिंग क्रॉस-वेलिडेशन")?
"बूटस्ट्रैप वेलिडेशन" / "रीसम्प्लिंग क्रॉस-वेलिडेशन" मेरे लिए नया है, लेकिन इस प्रश्न के उत्तर से चर्चा की गई थी । मैं इसे इकट्ठा करता हूं इसमें 2 प्रकार के डेटा शामिल हैं: वास्तविक डेटा और सिम्युलेटेड डेटा, जहां सिम्युलेटेड डेटा का एक सेट वास्तविक डेटा से उत्पन्न होता है, जब …

2
कॉक्स आनुपातिक खतरों के मॉडल के साथ क्रॉस-सत्यापन कैसे करें?
मान लीजिए मैंने एक डेटासेट (मॉडल बिल्डिंग डेटासेट) में किसी विशेष बीमारी की घटना के लिए एक भविष्यवाणी मॉडल का निर्माण किया है और अब यह जांचना चाहता हूं कि मॉडल एक नए डेटासेट (सत्यापन डेटासेट) में कितनी अच्छी तरह काम करता है। लॉजिस्टिक रिग्रेशन के साथ बनाए गए मॉडल …

2
छुट्टी-एक-आउट क्रॉस-सत्यापन का उच्च संस्करण
मैं बार-बार पढ़ता हूं कि "लीव-वन-आउट" क्रॉस-वैरिफिकेशन में प्रशिक्षण सिलेंडों के बड़े ओवरलैप के कारण उच्च विचरण है। हालाँकि मुझे समझ नहीं आया कि ऐसा क्यों है: क्या क्रॉस-वेलिडेशन का प्रदर्शन बिल्कुल स्थिर (कम विचरण) नहीं होना चाहिए क्योंकि प्रशिक्षण सेट लगभग समान हैं? या क्या मुझे पूरी तरह से …

1
क्या होगा अगर उच्च मान्यता सटीकता लेकिन अनुसंधान में कम परीक्षण सटीकता?
मशीन लर्निंग अनुसंधान में सत्यापन के बारे में मेरा एक विशिष्ट प्रश्न है। जैसा कि हम जानते हैं, मशीन लर्निंग शासन शोधकर्ताओं को प्रशिक्षण के आंकड़ों पर अपने मॉडल को प्रशिक्षित करने, सत्यापन सेट द्वारा उम्मीदवार मॉडल से चुनने और परीक्षण सेट पर सटीकता की रिपोर्ट करने के लिए कहता …

2
जैकनाइफ बनाम एलओओसीवी
क्या वास्तव में जैकनाइफ के बीच कोई अंतर है और एक को पार करने की वैधता को छोड़ दें? प्रक्रिया समान लगती है क्या मुझे कुछ याद आ रहा है?

2
स्किटिट-लर्न बूटस्ट्रैप फ़ंक्शन टेस्ट सेट को फिर से क्यों करता है?
मॉडल मूल्यांकन के लिए बूटस्ट्रैपिंग का उपयोग करते समय, मैंने हमेशा सोचा कि आउट-ऑफ-बैग नमूने सीधे परीक्षण सेट के रूप में उपयोग किए जाते थे। हालाँकि, ऐसा प्रतीत नहीं होता है कि हटाए गए डरावने-सीखने केBootstrap दृष्टिकोण के लिए मामला है , जो आउट-ऑफ-द-बैग डेटा सब्मिट से ड्राइंग से परीक्षण …

3
डेटा वृद्धि और ट्रेन-मान्य विभाजन कैसे करें?
मैं मशीन लर्निंग का उपयोग करके छवि वर्गीकरण कर रहा हूं। मान लीजिए कि मेरे पास कुछ प्रशिक्षण डेटा (चित्र) हैं और डेटा को प्रशिक्षण और सत्यापन सेटों में विभाजित करेगा। और मैं यादृच्छिक घुमाव और शोर इंजेक्शन द्वारा डेटा को बढ़ाना (मूल से नई छवियां बनाना) भी चाहता हूं। …

3
एक जीवित विश्लेषण समस्या में प्रशिक्षण, परीक्षण, सत्यापन
मैं यहां विभिन्न सूत्र ब्राउज़ कर रहा हूं, लेकिन मुझे नहीं लगता कि मेरे सटीक प्रश्न का उत्तर दिया गया है। मेरे पास ~ 50,000 छात्रों का डेटासेट है और उनके छोड़ने का समय है। मैं बड़ी संख्या में संभावित कोवरिएट्स के साथ आनुपातिक खतरों के प्रतिगमन का प्रदर्शन करने …

4
सार्वजनिक स्वास्थ्य नीति अनुसंधान में मामले के अध्ययन क्या हैं जहां अविश्वसनीय / भ्रमित / अमान्य अध्ययन या मॉडल का दुरुपयोग किया गया था?
मैं एक मौजूदा सार्वजनिक स्वास्थ्य मुद्दे पर एक साहित्य समीक्षा का मसौदा तैयार कर रहा हूं जहां डेटा को भ्रमित किया गया है: सार्वजनिक स्वास्थ्य / महामारी विज्ञान की शिक्षा में उपयोग किए जाने वाले सामान्य ऐतिहासिक केस-स्टडीज कहां हैं जहां अवैध या उलझे हुए संबंध या अंतर्विरोध जानबूझकर या …

2
अनुकूलन: आंकड़ों में सभी बुराई की जड़?
मैंने पहले अभिव्यक्ति को सुना है: "आँकड़ों में अनुकूलन सभी बुराई की जड़ है"। उदाहरण के लिए, इस धागे में शीर्ष उत्तर मॉडल चयन के दौरान बहुत अधिक आक्रामक तरीके से अनुकूलन के खतरे के संदर्भ में यह बयान देता है। मेरा पहला प्रश्न निम्नलिखित है: क्या यह उद्धरण विशेष …

6
10-गुना क्रॉस सत्यापन करने के लिए सेट किए गए डेटा को कैसे विभाजित किया जाए
ताला लगा हुआ । यह सवाल और इसके जवाब बंद हैं क्योंकि यह सवाल ऑफ-टॉपिक है लेकिन इसका ऐतिहासिक महत्व है। यह वर्तमान में नए उत्तरों या इंटरैक्शन को स्वीकार नहीं कर रहा है। अब मेरे पास एक Rडेटा फ़्रेम (प्रशिक्षण) है, क्या कोई मुझे बता सकता है कि 10-गुना …

3
R. बूट पैकेज में cv.glm में लागत कार्य क्या है?
मैं लीव-वन-आउट पद्धति का उपयोग करके क्रॉस सत्यापन कर रहा हूं। मेरे पास एक द्विआधारी प्रतिक्रिया है और आर, और cv.glm फ़ंक्शन के लिए बूट पैकेज का उपयोग कर रहा हूं । मेरी समस्या यह है कि मैं इस फ़ंक्शन में "लागत" भाग को पूरी तरह से नहीं समझता। मैं …

2
मशीन सीखने के लिए समय श्रृंखला का आदेश देना
क्रॉस-मान्यता और समय श्रृंखला के बारे में आरजे हाइंडमैन के "रिसर्च टिप्स" में से एक को पढ़ने के बाद , मैं अपने एक पुराने प्रश्न पर वापस आया कि मैं यहां तैयार करने की कोशिश करूंगा। विचार यह है कि वर्गीकरण या प्रतिगमन समस्याओं में, डेटा के आदेश महत्वपूर्ण नहीं …

2
एआईसी, बीआईसी और जीसीवी: दंडित प्रतिगमन विधियों में निर्णय लेने के लिए सबसे अच्छा क्या है?
मेरी सामान्य समझ है AIC मॉडल के फिट की अच्छाई और मॉडल की जटिलता के बीच व्यापार बंद से संबंधित है। AIC=2k−2ln(L)AIC=2k−2ln(L)AIC =2k -2ln(L) kkk = मॉडल में मापदंडों की संख्या LLL = संभावना बायसियन सूचना मानदंड बीआईसी एआईसी के साथ निकटता से संबंधित है। एआईसी बीआईसी की तुलना में …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.