सांख्यिकी और बिग डेटा predictive-models

1

हम दुर्लभ घटनाओं की भविष्यवाणी कैसे करते हैं?

मैं एक बीमा जोखिम पूर्वानुमान मॉडल विकसित करने पर काम कर रहा हूं। ये मॉडल "दुर्लभ घटनाओं" जैसे एयरलाइन नो-शो भविष्यवाणी, हार्डवेयर दोष का पता लगाने, आदि जैसे हैं। जैसा कि मैंने अपना डेटा सेट तैयार किया, मैंने वर्गीकरण लागू करने की कोशिश की, लेकिन मैं नकारात्मक मामलों के उच्च …

11 classification predictive-models scikit-learn poisson-process

1

स्पलाइन / स्मूथ रिग्रेशन के साथ नए डेटा की भविष्यवाणी कैसे करें

क्या कोई वैचारिक स्पष्टीकरण दे सकता है कि भविष्यवाणियों के लिए स्मूथ / स्प्लिन का उपयोग करते समय नए डेटा के लिए भविष्यवाणियाँ कैसे की जाती हैं? उदाहरण के लिए, एक मॉडल का उपयोग कर बनाई दिया gamboostमें mboostआर में पैकेज, पी-splines के साथ, कैसे नए डेटा के लिए भविष्यवाणियों …

11 regression machine-learning predictive-models splines

7

मॉडल निर्माण में सामाजिक भेदभाव से बचना

मेरे पास अमेज़ॅन के हालिया भर्ती घोटाले से प्रेरित प्रश्न हैं, जहां उनकी भर्ती प्रक्रिया में महिलाओं के साथ भेदभाव का आरोप लगाया गया था। अधिक जानकारी यहाँ : Amazon.com इंक के मशीन-लर्निंग विशेषज्ञों ने एक बड़ी समस्या को उजागर किया: उनका नया भर्ती इंजन महिलाओं को पसंद नहीं आया। …

10 predictive-models modeling model

1

एक नामांकन पढ़ने के संबंध में स्पष्टीकरण

सूत्र के लिए rms पैकेज के साथ mtcars डेटासेट से बनाया गया एक नामांक निम्नलिखित है: mpg ~ wt + am + qsec मॉडल खुद को 0.85 और पी <0.00001 के आर 2 के साथ अच्छा लगता है > mod Linear Regression Model ols(formula = mpg ~ wt + am …

10 regression multiple-regression data-visualization predictive-models regression-strategies

3

एक रेखीय प्रतिगमन मॉडल या गैर-रेखीय प्रतिगमन मॉडल के बीच निर्णय लेना

एक रैखिक प्रतिगमन मॉडल या गैर-रेखीय प्रतिगमन मॉडल का उपयोग करने के बीच किसी को कैसे तय करना चाहिए? मेरा लक्ष्य वाई की भविष्यवाणी करना है। साधारण और y डेटासेट के मामले में, मैं आसानी से तय कर सकता हूं कि स्कैटर प्लॉट की साजिश रचने के लिए कौन से …

10 regression hypothesis-testing predictive-models nonlinear-regression

1

स्थानिक डेटा के लिए फिटिंग वितरण

पोस्टिंग पार mathoverflow से मेरे सवाल का कुछ आँकड़े विशेष मदद खोजने के लिए। मैं एक भौतिक प्रक्रिया उत्पन्न करने वाले डेटा का अध्ययन कर रहा हूं जो गैर-नकारात्मक मूल्यों के साथ दो आयामों में अच्छी तरह से प्रोजेक्ट करता है। प्रत्येक प्रक्रिया में - y बिंदुओं का एक (अनुमानित) …

10 distributions modeling predictive-models fitting curve-fitting

1

अनोवा (और ड्रॉप 1) जीएलएमएम के लिए अलग-अलग उत्तर क्यों प्रदान करते हैं?

मेरे पास फॉर्म का GLMM है: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) जब मैं उपयोग करता हूं drop1(model, test="Chi"), तो मुझे Anova(model, type="III")कार के पैकेज से उपयोग करने की तुलना में अलग-अलग परिणाम मिलते हैं या summary(model)। ये उत्तरार्द्ध दो ही जवाब …

10 r anova glmm r mixed-model bootstrap sample-size cross-validation roc auc sampling stratification random-allocation logistic stata interpretation proportion r regression multiple-regression linear-model lm r cross-validation cart rpart logistic generalized-linear-model econometrics experiment-design causality instrumental-variables random-allocation predictive-models data-mining estimation contingency-tables epidemiology standard-deviation mean ancova psychology statistical-significance cross-validation synthetic-data poisson-distribution negative-binomial bioinformatics sequence-analysis distributions binomial classification k-means distance unsupervised-learning euclidean correlation chi-squared spearman-rho forecasting excel exponential-smoothing binomial sample-size r change-point wilcoxon-signed-rank ranks clustering matlab covariance covariance-matrix normal-distribution simulation random-generation bivariate standardization confounding z-statistic forecasting arima minitab poisson-distribution negative-binomial poisson-regression overdispersion probability self-study markov-process estimation maximum-likelihood classification pca group-differences chi-squared survival missing-data contingency-tables anova proportion

2

द्विआधारी और निरंतर प्रतिक्रिया को संयोजित करने का सबसे अच्छा तरीका

मैं एक संग्रह एजेंसी के लिए भुगतान राशि की भविष्यवाणी करने के लिए सबसे अच्छे तरीके से आने की कोशिश कर रहा हूं। भुगतान किए जाने पर आश्रित चर केवल गैर-शून्य होता है। जाहिर है, वहाँ शून्य की एक भारी संख्या है क्योंकि अधिकांश लोगों तक नहीं पहुंचा जा सकता …

10 regression predictive-models logistic

3

ऑनलाइन डेटिंग साइटों के लिए आँकड़े

मैं उत्सुक हूं कि एक ऑनलाइन डेटिंग प्रणाली कैसे मैचों का निर्धारण करने के लिए सर्वेक्षण डेटा का उपयोग कर सकती है। मान लीजिए कि उनके पास पिछले मैचों के डेटा हैं (उदाहरण के लिए, 1 = खुशी से विवाहित, 0 = कोई दूसरा दिनांक नहीं)। अगला, मान लें कि …

10 predictive-models

6

प्रेडिक्टिव एनालिटिक्स दर्ज करने के लिए कुछ किताबें / लेख / गाइड सुझाएं?

भविष्य कहनेवाला विश्लेषिकी में प्राप्त करने के लिए आप एक सीएस व्यक्ति / नौसिखिया सांख्यिकीविद् / नौसिखिया गणितज्ञ के लिए क्या शिक्षण सामग्री सुझाएंगे?

10 references predictive-models

2

एक '' महत्वपूर्ण चर '' जो आउट-ऑफ-सैंपल भविष्यवाणियों में सुधार नहीं करता है - व्याख्या कैसे करें?

मेरा एक प्रश्न है कि मुझे लगता है कि बहुत सारे उपयोगकर्ताओं के लिए काफी बुनियादी होगा। (I) रेखीय प्रतिगमन मॉडल का उपयोग करते हुए Im कई व्याख्यात्मक चर के संबंध की जांच करता है और मेरी प्रतिक्रिया चर और (ii) व्याख्यात्मक चर का उपयोग करके मेरे प्रतिक्रिया चर की …

10 statistical-significance predictive-models p-value prediction out-of-sample

2

बायेसियन रैखिक प्रतिगमन में पश्चवर्ती भविष्य कहनेवाला वितरण का मूल्यांकन करें

मैं इस बात पर असमंजस में हूँ कि बायेसियन रेखीय प्रतिगमन के लिए पश्चगामी पूर्वानुमान वितरण का मूल्यांकन कैसे किया जाए, पृष्ठ 3 पर यहाँ बताए गए मूल मामले के अतीत , और नीचे कॉपी किया गया। पी (y~∣ य) = ∫पी (y~| बीटा,σ2) पी ( β,σ2∣ य)पी(y~|y)=∫पी(y~|β,σ2)पी(β,σ2|y) p(\tilde y …

10 regression bayesian predictive-models prediction posterior

4

असतत-समय घटना इतिहास (अस्तित्व) आर में मॉडल

मैं आर में एक असतत समय मॉडल फिट करने की कोशिश कर रहा हूं, लेकिन मुझे यकीन नहीं है कि यह कैसे करना है। मैंने पढ़ा है कि आप विभिन्न चर में निर्भर चर को व्यवस्थित कर सकते हैं, प्रत्येक समय-अवलोकन के लिए, और glmएक लॉगिट या क्लॉगलॉग लिंक के …

10 r survival pca sas matlab neural-networks r logistic spatial spatial-interaction-model r time-series econometrics var statistical-significance t-test cross-validation sample-size r regression optimization least-squares constrained-regression nonparametric ordinal-data wilcoxon-signed-rank references neural-networks jags bugs hierarchical-bayesian gaussian-mixture r regression svm predictive-models libsvm scikit-learn probability self-study stata sample-size spss wilcoxon-mann-whitney survey ordinal-data likert group-differences r regression anova mathematical-statistics normal-distribution random-generation truncation repeated-measures variance variability distributions random-generation uniform regression r generalized-linear-model goodness-of-fit data-visualization r time-series arima autoregressive confidence-interval r time-series arima autocorrelation seasonality hypothesis-testing bayesian frequentist uninformative-prior correlation matlab cross-correlation

2

उच्च आयामी डेटा सेट के लिए गॉसियन प्रक्रिया प्रतिगमन

बस यह देखना चाहता था कि क्या किसी के पास उच्च आयामी डेटा सेटों में गॉसियन प्रक्रिया प्रतिगमन (जीपीआर) को लागू करने का कोई अनुभव है। मैं विभिन्न विरल जीपीआर विधियों (जैसे विरल छद्म-इनपुट जीपीआर) में से कुछ में देख रहा हूं कि उच्च आयामी डेटा सेट के लिए क्या …

10 machine-learning predictive-models large-data gaussian-process

1

रेखीय प्रतिगमन श्रेणीगत चर "छिपा हुआ" मान

यह सिर्फ एक उदाहरण है कि मैं कई बार आया हूं, इसलिए मेरे पास कोई नमूना डेटा नहीं है। R में एक रैखिक प्रतिगमन मॉडल चलाना: a.lm = lm(Y ~ x1 + x2) x1एक सतत चर है। x2श्रेणीबद्ध है और इसके तीन मान हैं "उदा", "मध्यम" और "उच्च"। हालाँकि R …

10 r regression categorical-data regression-coefficients categorical-encoding machine-learning random-forest anova spss r self-study bootstrap monte-carlo r multiple-regression partitioning neural-networks normalization machine-learning svm kernel-trick self-study survival cox-model repeated-measures survey likert correlation variance sampling meta-analysis anova independence sample assumptions bayesian covariance r regression time-series mathematical-statistics graphical-model machine-learning linear-model kernel-trick linear-algebra self-study moments function correlation spss probability confidence-interval sampling mean population r generalized-linear-model prediction offset data-visualization clustering sas cart binning sas logistic causality regression self-study standard-error r distributions r regression time-series multiple-regression python chi-squared independence sample clustering data-mining rapidminer probability stochastic-processes clustering binary-data dimensionality-reduction svd correspondence-analysis data-visualization excel c# hypothesis-testing econometrics survey rating composite regression least-squares mcmc markov-process kullback-leibler convergence predictive-models r regression anova confidence-interval survival cox-model hazard normal-distribution autoregressive mixed-model r mixed-model sas hypothesis-testing mediation interaction

predictive-models पर टैग किए गए जवाब