सांख्यिकी और बिग डेटा cross-validation

5

आप कैसे तय करते हैं कि आपकी ट्रेन, सत्यापन और परीक्षण प्रतिशत क्या हैं?

प्रशिक्षण, सत्यापन और परीक्षण सेट में अपने लेबल किए गए डेटा को विभाजित करते समय, मैंने 50/25/25 से 85/5/10 तक सब कुछ सुना है। मुझे यकीन है कि यह इस बात पर निर्भर करता है कि आप अपने मॉडल का उपयोग कैसे करने जा रहे हैं और अपने सीखने के …

10 machine-learning cross-validation

1

अनोवा (और ड्रॉप 1) जीएलएमएम के लिए अलग-अलग उत्तर क्यों प्रदान करते हैं?

मेरे पास फॉर्म का GLMM है: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) जब मैं उपयोग करता हूं drop1(model, test="Chi"), तो मुझे Anova(model, type="III")कार के पैकेज से उपयोग करने की तुलना में अलग-अलग परिणाम मिलते हैं या summary(model)। ये उत्तरार्द्ध दो ही जवाब …

10 r anova glmm r mixed-model bootstrap sample-size cross-validation roc auc sampling stratification random-allocation logistic stata interpretation proportion r regression multiple-regression linear-model lm r cross-validation cart rpart logistic generalized-linear-model econometrics experiment-design causality instrumental-variables random-allocation predictive-models data-mining estimation contingency-tables epidemiology standard-deviation mean ancova psychology statistical-significance cross-validation synthetic-data poisson-distribution negative-binomial bioinformatics sequence-analysis distributions binomial classification k-means distance unsupervised-learning euclidean correlation chi-squared spearman-rho forecasting excel exponential-smoothing binomial sample-size r change-point wilcoxon-signed-rank ranks clustering matlab covariance covariance-matrix normal-distribution simulation random-generation bivariate standardization confounding z-statistic forecasting arima minitab poisson-distribution negative-binomial poisson-regression overdispersion probability self-study markov-process estimation maximum-likelihood classification pca group-differences chi-squared survival missing-data contingency-tables anova proportion

2

प्रतिगमन मॉडल के क्रॉस-सत्यापन में मॉडल स्थिरता

एक लॉजिस्टिक रिग्रेशन के कई क्रॉस-वैलिडेशन सिलवटों को देखते हुए, और प्रत्येक रिग्रेशन गुणांक के कई अनुमानों के अनुसार, किसी को एक भविष्यवक्ता (या भविष्यवक्ताओं का सेट) कैसे मापना चाहिए या नहीं, रेजिस्टेंट गुणांक (ओं) के आधार पर स्थिर और सार्थक हैं ? क्या यह रैखिक प्रतिगमन के लिए अलग …

10 regression model-selection cross-validation

4

आर में चर / सुविधा चयन करने के लिए क्रॉस सत्यापन का उपयोग करने का एक तरीका है?

मेरे पास लगभग 70 वैरिएबल के साथ एक डेटा सेट है जिसे मैं कट करना चाहूंगा। मैं जो करना चाह रहा हूं वह निम्नलिखित फैशन में सबसे उपयोगी चर खोजने के लिए सीवी का उपयोग करना है। 1) यादृच्छिक रूप से 20 वेरिएबल्स का चयन करें। 2) सबसे महत्वपूर्ण चर …

10 r cross-validation feature-selection random-forest stepwise-regression

3

क्रॉस सत्यापन के बारे में अच्छा साहित्य

क्या कोई क्रॉस सत्यापन की तकनीक सीखना शुरू करने के लिए एक अच्छी किताब / वेबपेज जानता है?

10 references cross-validation

1

आर में लैस्सो प्रतिगमन को वैधता क्रॉस करें

आर फ़ंक्शन cv.glm (पुस्तकालय: बूट) सामान्यीकृत रैखिक मॉडल के लिए अनुमानित K- गुना क्रॉस-सत्यापन भविष्यवाणी त्रुटि की गणना करता है और डेल्टा लौटाता है। क्या यह लस्सो रिग्रेशन (पुस्तकालय: ग्लमनेट) के लिए इस फ़ंक्शन का उपयोग करने के लिए समझ में आता है और यदि हां, तो इसे कैसे किया …

10 r regression cross-validation lasso glmnet

2

नेस्ट क्रॉस-मान्यता - यह प्रशिक्षण सेट पर केफोल्ड सीवी के माध्यम से मॉडल चयन से कैसे अलग है?

मैं अक्सर लोगों को नेस्टेड क्रॉस सत्यापन के विशेष मामले के रूप में 5x2 क्रॉस-सत्यापन के बारे में बात करते हुए देखता हूं । मैं पहली संख्या मानता हूं (यहां: 5) आंतरिक लूप में सिलवटों की संख्या को संदर्भित करता है और दूसरी संख्या (यहां: 2) बाहरी लूप में सिलवटों …

10 machine-learning cross-validation hyperparameter

2

नेस्टेड क्रॉस-मान्यता का कार्यान्वयन

मैं यह जानने की कोशिश कर रहा हूं कि क्या नेस्टेड क्रॉस-वैलिडेशन की मेरी समझ सही है, इसलिए मैंने यह देखने के लिए यह खिलौना उदाहरण लिखा है कि क्या मैं सही हूं: import operator import numpy as np from sklearn import cross_validation from sklearn import ensemble from sklearn.datasets import …

10 cross-validation python scikit-learn

4

असतत-समय घटना इतिहास (अस्तित्व) आर में मॉडल

मैं आर में एक असतत समय मॉडल फिट करने की कोशिश कर रहा हूं, लेकिन मुझे यकीन नहीं है कि यह कैसे करना है। मैंने पढ़ा है कि आप विभिन्न चर में निर्भर चर को व्यवस्थित कर सकते हैं, प्रत्येक समय-अवलोकन के लिए, और glmएक लॉगिट या क्लॉगलॉग लिंक के …

10 r survival pca sas matlab neural-networks r logistic spatial spatial-interaction-model r time-series econometrics var statistical-significance t-test cross-validation sample-size r regression optimization least-squares constrained-regression nonparametric ordinal-data wilcoxon-signed-rank references neural-networks jags bugs hierarchical-bayesian gaussian-mixture r regression svm predictive-models libsvm scikit-learn probability self-study stata sample-size spss wilcoxon-mann-whitney survey ordinal-data likert group-differences r regression anova mathematical-statistics normal-distribution random-generation truncation repeated-measures variance variability distributions random-generation uniform regression r generalized-linear-model goodness-of-fit data-visualization r time-series arima autoregressive confidence-interval r time-series arima autocorrelation seasonality hypothesis-testing bayesian frequentist uninformative-prior correlation matlab cross-correlation

2

गाम क्रॉस-सत्यापन को भविष्यवाणी की त्रुटि का परीक्षण करने के लिए

मेरा सवाल mgcv आर पैकेज में GAMs से संबंधित है। एक छोटे से नमूने के आकार के कारण मैं छुट्टी-एक-आउट क्रॉस-सत्यापन का उपयोग करके भविष्यवाणी त्रुटि निर्धारित करना चाहता हूं। क्या यह उचित है? क्या कोई पैकेज या कोड है कि मैं यह कैसे कर सकता हूं? errorest()में समारोह ipred …

10 r cross-validation gam mgcv

1

क्रॉस सत्यापन का उपयोग करते समय भविष्यवाणी अंतराल की गणना करना

क्या मानक विचलन अनुमानों के माध्यम से गणना की जाती है: sN=1N∑Ni=1(xi−x¯¯¯)2−−−−−−−−−−−−−√.sN=1N∑i=1N(xi−x¯)2. s_N = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}. ( http://en.wikipedia.org/wiki/Standard_deviation#Sample_standard_deviation ) भविष्यवाणी के लिए सटीकता 10-गुना क्रॉस सत्यापन से नमूना है? मुझे चिंता है कि प्रत्येक गुना के बीच गणना की जाने वाली भविष्यवाणी सटीकता प्रशिक्षण सेटों के बीच …

10 confidence-interval cross-validation prediction prediction-interval

2

आर में बहुभिन्नरूपी परिणामों का अनुकरण कैसे करें?

अधिकांश स्थितियों में, हम केवल एक परिणाम / प्रतिक्रिया चर के साथ सौदा करते हैं जैसे कि y=a+bx+ϵy=a+bx+εy = a + bx +\epsilon। हालांकि, कुछ परिदृश्यों में, विशेष रूप से नैदानिक डेटा में, परिणाम चर उच्च-आयामी / बहुभिन्नरूपी हो सकते हैं। जैसे किY=βx +ϵY=βx+ε\mathsf{Y} = \beta{x} + \mathsf{\epsilon}, कहाँ पे …

10 r cross-validation

2

ऑर्डिनल लॉजिस्टिक रिग्रेशन में ए.यू.सी.

मैं 2 प्रकार के लॉजिस्टिक प्रतिगमन का उपयोग कर रहा हूं - एक द्विआधारी वर्गीकरण के लिए सरल प्रकार है, और दूसरा क्रमिक लॉजिस्टिक प्रतिगमन है। पहले की सटीकता की गणना के लिए, मैंने क्रॉस-मान्यता का उपयोग किया, जहां मैंने प्रत्येक गुना के लिए एयूसी की गणना की और औसत …

10 logistic cross-validation roc auc ordered-logit

1

आप छुट्टी-एक-आउट क्रॉस सत्यापन के लिए आरओसी वक्र कैसे उत्पन्न करते हैं?

5-गुना क्रॉस-वैलिडेशन (उदाहरण के लिए) का प्रदर्शन करते समय, प्रत्येक 5 तह के लिए एक अलग आरओसी वक्र की गणना करना विशिष्ट होता है और अक्सर एक मतलब आरओसी वक्र होता है जिसमें एसटीडी होता है। देव। वक्र मोटाई के रूप में दिखाया गया है। हालाँकि, LOO क्रॉस-मान्यता के लिए, …

10 cross-validation roc

2

क्या RMSE और MAE का समान मूल्य हो सकता है?

मैं आरएमएसई, , एमएई, एमएसई, आदि जैसे क्रॉस सत्यापन और त्रुटि मेट्रिक्स की गणना कर रहा हूं ।R2R2R^2 क्या RMSE और MAE का समान मूल्य हो सकता है?

9 cross-validation rms mae

cross-validation पर टैग किए गए जवाब