सांख्यिकी और बिग डेटा cross-validation

1

कब / कहाँ कार्यात्मक डेटा विश्लेषण का उपयोग करें?

मैं कार्यात्मक डेटा विश्लेषण (एफडीए) के लिए बहुत नया हूं । मैं पढ़ रहा हु: रामसे, जेम्स ओ।, और सिल्वरमैन, बर्नार्ड डब्ल्यू। (2006), फ़ंक्शनल डेटा एनालिसिस, 2 डी एड, स्प्रिंगर, न्यूयॉर्क। हालांकि, मैं अभी भी बहुत स्पष्ट नहीं हूं कि एफडीए का उपयोग कहां / कब करना है? क्या कोई …

15 statistical-significance cross-validation nonparametric

2

"बूटस्ट्रैप वेलिडेशन" के लिए प्रक्रिया क्या है (उर्फ "रेज़म्पलिंग क्रॉस-वेलिडेशन")?

"बूटस्ट्रैप वेलिडेशन" / "रीसम्प्लिंग क्रॉस-वेलिडेशन" मेरे लिए नया है, लेकिन इस प्रश्न के उत्तर से चर्चा की गई थी । मैं इसे इकट्ठा करता हूं इसमें 2 प्रकार के डेटा शामिल हैं: वास्तविक डेटा और सिम्युलेटेड डेटा, जहां सिम्युलेटेड डेटा का एक सेट वास्तविक डेटा से उत्पन्न होता है, जब …

15 cross-validation bootstrap validation resampling

2

कॉक्स आनुपातिक खतरों के मॉडल के साथ क्रॉस-सत्यापन कैसे करें?

मान लीजिए मैंने एक डेटासेट (मॉडल बिल्डिंग डेटासेट) में किसी विशेष बीमारी की घटना के लिए एक भविष्यवाणी मॉडल का निर्माण किया है और अब यह जांचना चाहता हूं कि मॉडल एक नए डेटासेट (सत्यापन डेटासेट) में कितनी अच्छी तरह काम करता है। लॉजिस्टिक रिग्रेशन के साथ बनाए गए मॉडल …

15 predictive-models cross-validation survival roc

2

छुट्टी-एक-आउट क्रॉस-सत्यापन का उच्च संस्करण

मैं बार-बार पढ़ता हूं कि "लीव-वन-आउट" क्रॉस-वैरिफिकेशन में प्रशिक्षण सिलेंडों के बड़े ओवरलैप के कारण उच्च विचरण है। हालाँकि मुझे समझ नहीं आया कि ऐसा क्यों है: क्या क्रॉस-वेलिडेशन का प्रदर्शन बिल्कुल स्थिर (कम विचरण) नहीं होना चाहिए क्योंकि प्रशिक्षण सेट लगभग समान हैं? या क्या मुझे पूरी तरह से …

15 variance cross-validation bias

1

क्या होगा अगर उच्च मान्यता सटीकता लेकिन अनुसंधान में कम परीक्षण सटीकता?

मशीन लर्निंग अनुसंधान में सत्यापन के बारे में मेरा एक विशिष्ट प्रश्न है। जैसा कि हम जानते हैं, मशीन लर्निंग शासन शोधकर्ताओं को प्रशिक्षण के आंकड़ों पर अपने मॉडल को प्रशिक्षित करने, सत्यापन सेट द्वारा उम्मीदवार मॉडल से चुनने और परीक्षण सेट पर सटीकता की रिपोर्ट करने के लिए कहता …

15 machine-learning cross-validation reproducible-research

2

जैकनाइफ बनाम एलओओसीवी

क्या वास्तव में जैकनाइफ के बीच कोई अंतर है और एक को पार करने की वैधता को छोड़ दें? प्रक्रिया समान लगती है क्या मुझे कुछ याद आ रहा है?

15 cross-validation jackknife

2

स्किटिट-लर्न बूटस्ट्रैप फ़ंक्शन टेस्ट सेट को फिर से क्यों करता है?

मॉडल मूल्यांकन के लिए बूटस्ट्रैपिंग का उपयोग करते समय, मैंने हमेशा सोचा कि आउट-ऑफ-बैग नमूने सीधे परीक्षण सेट के रूप में उपयोग किए जाते थे। हालाँकि, ऐसा प्रतीत नहीं होता है कि हटाए गए डरावने-सीखने केBootstrap दृष्टिकोण के लिए मामला है , जो आउट-ऑफ-द-बैग डेटा सब्मिट से ड्राइंग से परीक्षण …

15 cross-validation bootstrap random-forest scikit-learn bagging

3

डेटा वृद्धि और ट्रेन-मान्य विभाजन कैसे करें?

मैं मशीन लर्निंग का उपयोग करके छवि वर्गीकरण कर रहा हूं। मान लीजिए कि मेरे पास कुछ प्रशिक्षण डेटा (चित्र) हैं और डेटा को प्रशिक्षण और सत्यापन सेटों में विभाजित करेगा। और मैं यादृच्छिक घुमाव और शोर इंजेक्शन द्वारा डेटा को बढ़ाना (मूल से नई छवियां बनाना) भी चाहता हूं। …

14 machine-learning classification cross-validation dataset data-augmentation

3

एक जीवित विश्लेषण समस्या में प्रशिक्षण, परीक्षण, सत्यापन

मैं यहां विभिन्न सूत्र ब्राउज़ कर रहा हूं, लेकिन मुझे नहीं लगता कि मेरे सटीक प्रश्न का उत्तर दिया गया है। मेरे पास ~ 50,000 छात्रों का डेटासेट है और उनके छोड़ने का समय है। मैं बड़ी संख्या में संभावित कोवरिएट्स के साथ आनुपातिक खतरों के प्रतिगमन का प्रदर्शन करने …

14 cross-validation survival train

4

सार्वजनिक स्वास्थ्य नीति अनुसंधान में मामले के अध्ययन क्या हैं जहां अविश्वसनीय / भ्रमित / अमान्य अध्ययन या मॉडल का दुरुपयोग किया गया था?

मैं एक मौजूदा सार्वजनिक स्वास्थ्य मुद्दे पर एक साहित्य समीक्षा का मसौदा तैयार कर रहा हूं जहां डेटा को भ्रमित किया गया है: सार्वजनिक स्वास्थ्य / महामारी विज्ञान की शिक्षा में उपयोग किए जाने वाले सामान्य ऐतिहासिक केस-स्टडीज कहां हैं जहां अवैध या उलझे हुए संबंध या अंतर्विरोध जानबूझकर या …

14 cross-validation reliability epidemiology biostatistics

2

अनुकूलन: आंकड़ों में सभी बुराई की जड़?

मैंने पहले अभिव्यक्ति को सुना है: "आँकड़ों में अनुकूलन सभी बुराई की जड़ है"। उदाहरण के लिए, इस धागे में शीर्ष उत्तर मॉडल चयन के दौरान बहुत अधिक आक्रामक तरीके से अनुकूलन के खतरे के संदर्भ में यह बयान देता है। मेरा पहला प्रश्न निम्नलिखित है: क्या यह उद्धरण विशेष …

14 cross-validation optimization overfitting

6

10-गुना क्रॉस सत्यापन करने के लिए सेट किए गए डेटा को कैसे विभाजित किया जाए

ताला लगा हुआ । यह सवाल और इसके जवाब बंद हैं क्योंकि यह सवाल ऑफ-टॉपिक है लेकिन इसका ऐतिहासिक महत्व है। यह वर्तमान में नए उत्तरों या इंटरैक्शन को स्वीकार नहीं कर रहा है। अब मेरे पास एक Rडेटा फ़्रेम (प्रशिक्षण) है, क्या कोई मुझे बता सकता है कि 10-गुना …

14 cross-validation

3

R. बूट पैकेज में cv.glm में लागत कार्य क्या है?

मैं लीव-वन-आउट पद्धति का उपयोग करके क्रॉस सत्यापन कर रहा हूं। मेरे पास एक द्विआधारी प्रतिक्रिया है और आर, और cv.glm फ़ंक्शन के लिए बूट पैकेज का उपयोग कर रहा हूं । मेरी समस्या यह है कि मैं इस फ़ंक्शन में "लागत" भाग को पूरी तरह से नहीं समझता। मैं …

14 r cross-validation

2

मशीन सीखने के लिए समय श्रृंखला का आदेश देना

क्रॉस-मान्यता और समय श्रृंखला के बारे में आरजे हाइंडमैन के "रिसर्च टिप्स" में से एक को पढ़ने के बाद , मैं अपने एक पुराने प्रश्न पर वापस आया कि मैं यहां तैयार करने की कोशिश करूंगा। विचार यह है कि वर्गीकरण या प्रतिगमन समस्याओं में, डेटा के आदेश महत्वपूर्ण नहीं …

14 time-series machine-learning cross-validation

2

एआईसी, बीआईसी और जीसीवी: दंडित प्रतिगमन विधियों में निर्णय लेने के लिए सबसे अच्छा क्या है?

मेरी सामान्य समझ है AIC मॉडल के फिट की अच्छाई और मॉडल की जटिलता के बीच व्यापार बंद से संबंधित है। AIC=2k−2ln(L)AIC=2k−2ln(L)AIC =2k -2ln(L) kkk = मॉडल में मापदंडों की संख्या LLL = संभावना बायसियन सूचना मानदंड बीआईसी एआईसी के साथ निकटता से संबंधित है। एआईसी बीआईसी की तुलना में …

14 cross-validation lasso aic ridge-regression bic

cross-validation पर टैग किए गए जवाब