cross-validation पर टैग किए गए जवाब

मॉडल की फिटिंग के दौरान बार-बार डेटा के सबसेट को रोकना ताकि रोक दिया गया डेटा के सबसेट पर मॉडल के प्रदर्शन को निर्धारित किया जा सके।

1
PROC मिश्रित और l / lmer के बीच अंतर R- स्वतंत्रता की डिग्री में
नोट: यह प्रश्न एक रिपॉजिट है, क्योंकि मेरे पिछले प्रश्न को कानूनी कारणों से हटाना पड़ा था। आर में पैकेज lmeसे फ़ंक्शन के साथ एसएएस से PROC MIXED की तुलना करते समय nlme, मैंने कुछ अंतर भ्रामक मतभेदों पर ठोकर खाई। विशेष रूप से, विभिन्न परीक्षणों में स्वतंत्रता की डिग्री …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
क्रॉस सत्यापन और क्रमिक लॉजिस्टिक प्रतिगमन
मैं ऑर्डिनल लॉजिस्टिक रिग्रेशन के लिए क्रॉस-वैलिडेशन को समझने की कोशिश कर रहा हूं। खेल का उद्देश्य एक विश्लेषण में इस्तेमाल किए गए मॉडल को मान्य करना है ... मैं पहले एक खिलौना डेटा सेट का निर्माण करता हूं: set.seed(1) N <- 10000 # predictors x1 <- runif(N) x2 <- …

2
मुख्य घटकों की संख्या निर्धारित करने के लिए पीसीए के लिए क्रॉस-सत्यापन कैसे करें?
मैं प्रिंसिपल कंपोनेंट एनालिसिस के लिए अपना खुद का फंक्शन लिखने की कोशिश कर रहा हूँ, PCA (बेशक इसमें पहले से ही बहुत कुछ लिखा है लेकिन मैं सिर्फ अपने आप से सामान को लागू करने में दिलचस्पी रखता हूँ)। मैंने जो मुख्य समस्या का सामना किया है, वह क्रॉस-वैलिडेशन …

1
कैसे पता लगा सकते हैं कि क्या एक गाऊसी प्रक्रिया ओवर-फिटिंग है?
मैं क्रॉस-वैलिडेशन के बजाय डेटा के सीमांत लिलिहुड को अधिकतम करके कई एआरडी कर्नेल के साथ गॉसियन प्रक्रिया का प्रशिक्षण दे रहा हूं। मुझे संदेह है कि यह अति-फिटिंग है। मैं इस संदेह को बायेसियन संदर्भ में कैसे परख सकता हूं?

3
ट्रेन / टेस्ट / सत्यापन सेट में विभाजित समय श्रृंखला डेटा
ट्रेन / परीक्षण / सत्यापन सेट में टाइम सीरीज़ डेटा को विभाजित करने का सबसे अच्छा तरीका क्या है, जहां हाइपरपरमीटर ट्यूनिंग के लिए सत्यापन सेट का उपयोग किया जाएगा? हमारे पास दैनिक बिक्री डेटा के 3 साल का मूल्य है, और हमारी योजना 2015-2016 को प्रशिक्षण डेटा के रूप …

2
चकाचौंध के साथ Glmnet पैकेज में Deviance माप की सटीक परिभाषा?
अपने वर्तमान रीसच के लिए मैं एक द्विपद निर्भर चर पर R में glmnet पैकेज के माध्यम से लासो विधि का उपयोग कर रहा हूं। Glmnet में क्रॉस-वैलिडेशन के माध्यम से इष्टतम लैम्ब्डा पाया जाता है और परिणामस्वरूप मॉडल की तुलना विभिन्न उपायों के साथ की जा सकती है, उदाहरण …

1
क्या उच्चतम सटीकता प्राप्त करने के लिए यादृच्छिक वन प्रतिगमन में एक बीज निर्धारित करना 'उचित' है?
मेरे पास एक यादृच्छिक वन प्रतिगमन है जो कि skl का उपयोग करके बनाया गया है और मैं ध्यान देता हूं कि मैं अलग-अलग मूल्यों को यादृच्छिक बीज सेट करने के आधार पर अलग-अलग परिणाम देता हूं। अगर मैं यह जानने के लिए LOOCV का उपयोग करता हूं कि कौन …

2
क्या परीक्षण और प्रशिक्षण में डेटा को विभाजित करना विशुद्ध रूप से एक "आँकड़े" चीज है?
मैं एक भौतिक विज्ञान का छात्र हूँ जो मशीन लर्निंग / डेटा साइंस का अध्ययन कर रहा है, इसलिए मुझे इस प्रश्न के लिए किसी भी संघर्ष को शुरू करने का मतलब नहीं है :) हालाँकि, किसी भी भौतिकी स्नातक कार्यक्रम का एक बड़ा हिस्सा प्रयोगशालाओं / प्रयोगों को करना …

2
क्या त्रुटि दर नियमितीकरण पैरामीटर लंबो का उत्तल कार्य है?
रिज या लैस्सो में नियमितीकरण पैरामीटर लैम्ब्डा को चुनने में अनुशंसित विधि लैम्ब्डा के विभिन्न मूल्यों की कोशिश करना है, सत्यापन सेट में त्रुटि को मापना और अंत में लैम्बडा के उस मूल्य को चुना जो सबसे कम त्रुटि देता है। यह मेरे लिए क्लैट नहीं है यदि फ़ंक्शन f …

4
होल्ड-आउट सेट बनाने के लिए और अधिक उपयुक्त तरीका क्या है: कुछ विषयों को हटाने के लिए या प्रत्येक विषय से कुछ टिप्पणियों को हटाने के लिए?
मेरे पास 26 विशेषताओं और 31000 पंक्तियों के साथ एक डेटासेट है। यह 38 विषयों का डेटासेट है। यह एक बायोमेट्रिक सिस्टम के लिए है। इसलिए मैं विषयों की पहचान करने में सक्षम होना चाहता हूं। परीक्षण सेट होने के लिए, मुझे पता है कि मुझे कुछ मूल्यों को हटाना …

1
K का एक बड़ा विकल्प मेरा क्रॉस सत्यापन स्कोर कम क्यों है?
के साथ चारों ओर खेलने के बोस्टन आवास डेटासेट और RandomForestRegressor(w / डिफ़ॉल्ट पैरामीटर) में scikit-जानने के लिए, मैं कुछ अजीब देखा: मतलब पार सत्यापन स्कोर में कमी आई के रूप में मैं 10 मेरे पार सत्यापन रणनीति के रूप में था इस प्रकार से परे परतों की संख्या में …

2
जटिल सर्वेक्षण डेटा में LASSO के बाद क्रॉस सत्यापन
मैं निरंतर परिणाम के साथ LASSO का उपयोग करते हुए कुछ उम्मीदवार भविष्यवाणियों पर मॉडल चयन करने की कोशिश कर रहा हूं। लक्ष्य सबसे अच्छा भविष्यवाणी प्रदर्शन के साथ इष्टतम मॉडल का चयन करना है, जो आमतौर पर एलएएसओ से ट्यूनिंग मापदंडों का एक समाधान पथ प्राप्त करने के बाद …

3
क्रॉस-मान्य वर्गीकरण सटीकता के लिए आत्मविश्वास अंतराल
मैं एक वर्गीकरण समस्या पर काम कर रहा हूं जो दो इनपुट एक्स-रे छवियों के बीच एक समानता मीट्रिक की गणना करता है। यदि चित्र एक ही व्यक्ति ('सही' का लेबल) के हैं, तो एक उच्च मीट्रिक की गणना की जाएगी; दो अलग-अलग लोगों की इनपुट छवियां ('गलत' का लेबल) …

1
सटीक सत्यापन का उपयोग करें और क्रॉस सत्यापन का उपयोग करते समय याद रखें
मैंने 2-लेबल वाले डेटा के लिए कई क्लासिफ़ायर का उपयोग करके वर्गीकरण का प्रदर्शन किया है, और मैंने 5-गुना क्रॉस सत्यापन का उपयोग किया है। प्रत्येक तह के लिए मैंने tp, tn, fp और fn की गणना की। फिर मैंने प्रत्येक परीक्षण के लिए सटीकता, सटीक, याद और एफ-स्कोर की …

1
बेयसियन, एमडीएल या क्रॉस-मान्यता की एमएल व्याख्या?
क्या कोई ज्ञात बायेसियन, एमएल या एमडीएल की व्याख्या पार-मान्यता है? क्या मैं विशेष रूप से बनाए गए पूर्व में सही अद्यतन करने के रूप में क्रॉस सत्यापन की व्याख्या कर सकता हूं?

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.