सांख्यिकी और बिग डेटा cross-validation

1

PROC मिश्रित और l / lmer के बीच अंतर R- स्वतंत्रता की डिग्री में

नोट: यह प्रश्न एक रिपॉजिट है, क्योंकि मेरे पिछले प्रश्न को कानूनी कारणों से हटाना पड़ा था। आर में पैकेज lmeसे फ़ंक्शन के साथ एसएएस से PROC MIXED की तुलना करते समय nlme, मैंने कुछ अंतर भ्रामक मतभेदों पर ठोकर खाई। विशेष रूप से, विभिन्न परीक्षणों में स्वतंत्रता की डिग्री …

12 r mixed-model sas degrees-of-freedom pdf unbiased-estimator distance-functions functional-data-analysis hellinger time-series outliers c++ relative-risk absolute-risk rare-events regression t-test multiple-regression survival teaching multiple-regression regression self-study t-distribution machine-learning recommender-system self-study binomial standard-deviation data-visualization r predictive-models pearson-r spearman-rho r regression modeling r categorical-data data-visualization ggplot2 many-categories machine-learning cross-validation weka microarray variance sampling monte-carlo regression cross-validation model-selection feature-selection elastic-net distance-functions information-theory r regression mixed-model random-effects-model fixed-effects-model dataset data-mining

2

क्रॉस सत्यापन और क्रमिक लॉजिस्टिक प्रतिगमन

मैं ऑर्डिनल लॉजिस्टिक रिग्रेशन के लिए क्रॉस-वैलिडेशन को समझने की कोशिश कर रहा हूं। खेल का उद्देश्य एक विश्लेषण में इस्तेमाल किए गए मॉडल को मान्य करना है ... मैं पहले एक खिलौना डेटा सेट का निर्माण करता हूं: set.seed(1) N <- 10000 # predictors x1 <- runif(N) x2 <- …

12 regression cross-validation ordered-logit rms

2

मुख्य घटकों की संख्या निर्धारित करने के लिए पीसीए के लिए क्रॉस-सत्यापन कैसे करें?

मैं प्रिंसिपल कंपोनेंट एनालिसिस के लिए अपना खुद का फंक्शन लिखने की कोशिश कर रहा हूँ, PCA (बेशक इसमें पहले से ही बहुत कुछ लिखा है लेकिन मैं सिर्फ अपने आप से सामान को लागू करने में दिलचस्पी रखता हूँ)। मैंने जो मुख्य समस्या का सामना किया है, वह क्रॉस-वैलिडेशन …

12 pca cross-validation matlab

1

कैसे पता लगा सकते हैं कि क्या एक गाऊसी प्रक्रिया ओवर-फिटिंग है?

मैं क्रॉस-वैलिडेशन के बजाय डेटा के सीमांत लिलिहुड को अधिकतम करके कई एआरडी कर्नेल के साथ गॉसियन प्रक्रिया का प्रशिक्षण दे रहा हूं। मुझे संदेह है कि यह अति-फिटिंग है। मैं इस संदेह को बायेसियन संदर्भ में कैसे परख सकता हूं?

12 machine-learning cross-validation gaussian-process

3

ट्रेन / टेस्ट / सत्यापन सेट में विभाजित समय श्रृंखला डेटा

ट्रेन / परीक्षण / सत्यापन सेट में टाइम सीरीज़ डेटा को विभाजित करने का सबसे अच्छा तरीका क्या है, जहां हाइपरपरमीटर ट्यूनिंग के लिए सत्यापन सेट का उपयोग किया जाएगा? हमारे पास दैनिक बिक्री डेटा के 3 साल का मूल्य है, और हमारी योजना 2015-2016 को प्रशिक्षण डेटा के रूप …

12 time-series cross-validation validation

2

चकाचौंध के साथ Glmnet पैकेज में Deviance माप की सटीक परिभाषा?

अपने वर्तमान रीसच के लिए मैं एक द्विपद निर्भर चर पर R में glmnet पैकेज के माध्यम से लासो विधि का उपयोग कर रहा हूं। Glmnet में क्रॉस-वैलिडेशन के माध्यम से इष्टतम लैम्ब्डा पाया जाता है और परिणामस्वरूप मॉडल की तुलना विभिन्न उपायों के साथ की जा सकती है, उदाहरण …

12 cross-validation lasso glmnet deviance lars

1

क्या उच्चतम सटीकता प्राप्त करने के लिए यादृच्छिक वन प्रतिगमन में एक बीज निर्धारित करना 'उचित' है?

मेरे पास एक यादृच्छिक वन प्रतिगमन है जो कि skl का उपयोग करके बनाया गया है और मैं ध्यान देता हूं कि मैं अलग-अलग मूल्यों को यादृच्छिक बीज सेट करने के आधार पर अलग-अलग परिणाम देता हूं। अगर मैं यह जानने के लिए LOOCV का उपयोग करता हूं कि कौन …

11 cross-validation random-forest

2

क्या परीक्षण और प्रशिक्षण में डेटा को विभाजित करना विशुद्ध रूप से एक "आँकड़े" चीज है?

मैं एक भौतिक विज्ञान का छात्र हूँ जो मशीन लर्निंग / डेटा साइंस का अध्ययन कर रहा है, इसलिए मुझे इस प्रश्न के लिए किसी भी संघर्ष को शुरू करने का मतलब नहीं है :) हालाँकि, किसी भी भौतिकी स्नातक कार्यक्रम का एक बड़ा हिस्सा प्रयोगशालाओं / प्रयोगों को करना …

11 regression machine-learning cross-validation dataset experiment-design

2

क्या त्रुटि दर नियमितीकरण पैरामीटर लंबो का उत्तल कार्य है?

रिज या लैस्सो में नियमितीकरण पैरामीटर लैम्ब्डा को चुनने में अनुशंसित विधि लैम्ब्डा के विभिन्न मूल्यों की कोशिश करना है, सत्यापन सेट में त्रुटि को मापना और अंत में लैम्बडा के उस मूल्य को चुना जो सबसे कम त्रुटि देता है। यह मेरे लिए क्लैट नहीं है यदि फ़ंक्शन f …

11 cross-validation error regularization validation optimization

4

होल्ड-आउट सेट बनाने के लिए और अधिक उपयुक्त तरीका क्या है: कुछ विषयों को हटाने के लिए या प्रत्येक विषय से कुछ टिप्पणियों को हटाने के लिए?

मेरे पास 26 विशेषताओं और 31000 पंक्तियों के साथ एक डेटासेट है। यह 38 विषयों का डेटासेट है। यह एक बायोमेट्रिक सिस्टम के लिए है। इसलिए मैं विषयों की पहचान करने में सक्षम होना चाहता हूं। परीक्षण सेट होने के लिए, मुझे पता है कि मुझे कुछ मूल्यों को हटाना …

11 machine-learning cross-validation out-of-sample

1

K का एक बड़ा विकल्प मेरा क्रॉस सत्यापन स्कोर कम क्यों है?

के साथ चारों ओर खेलने के बोस्टन आवास डेटासेट और RandomForestRegressor(w / डिफ़ॉल्ट पैरामीटर) में scikit-जानने के लिए, मैं कुछ अजीब देखा: मतलब पार सत्यापन स्कोर में कमी आई के रूप में मैं 10 मेरे पार सत्यापन रणनीति के रूप में था इस प्रकार से परे परतों की संख्या में …

11 machine-learning cross-validation random-forest sample-size scikit-learn

2

जटिल सर्वेक्षण डेटा में LASSO के बाद क्रॉस सत्यापन

मैं निरंतर परिणाम के साथ LASSO का उपयोग करते हुए कुछ उम्मीदवार भविष्यवाणियों पर मॉडल चयन करने की कोशिश कर रहा हूं। लक्ष्य सबसे अच्छा भविष्यवाणी प्रदर्शन के साथ इष्टतम मॉडल का चयन करना है, जो आमतौर पर एलएएसओ से ट्यूनिंग मापदंडों का एक समाधान पथ प्राप्त करने के बाद …

11 cross-validation survey lasso glmnet

3

क्रॉस-मान्य वर्गीकरण सटीकता के लिए आत्मविश्वास अंतराल

मैं एक वर्गीकरण समस्या पर काम कर रहा हूं जो दो इनपुट एक्स-रे छवियों के बीच एक समानता मीट्रिक की गणना करता है। यदि चित्र एक ही व्यक्ति ('सही' का लेबल) के हैं, तो एक उच्च मीट्रिक की गणना की जाएगी; दो अलग-अलग लोगों की इनपुट छवियां ('गलत' का लेबल) …

11 classification confidence-interval cross-validation matlab

1

सटीक सत्यापन का उपयोग करें और क्रॉस सत्यापन का उपयोग करते समय याद रखें

मैंने 2-लेबल वाले डेटा के लिए कई क्लासिफ़ायर का उपयोग करके वर्गीकरण का प्रदर्शन किया है, और मैंने 5-गुना क्रॉस सत्यापन का उपयोग किया है। प्रत्येक तह के लिए मैंने tp, tn, fp और fn की गणना की। फिर मैंने प्रत्येक परीक्षण के लिए सटीकता, सटीक, याद और एफ-स्कोर की …

11 classification cross-validation precision-recall

1

बेयसियन, एमडीएल या क्रॉस-मान्यता की एमएल व्याख्या?

क्या कोई ज्ञात बायेसियन, एमएल या एमडीएल की व्याख्या पार-मान्यता है? क्या मैं विशेष रूप से बनाए गए पूर्व में सही अद्यतन करने के रूप में क्रॉस सत्यापन की व्याख्या कर सकता हूं?

11 bayesian cross-validation maximum-likelihood

cross-validation पर टैग किए गए जवाब