cross-validation पर टैग किए गए जवाब

मॉडल की फिटिंग के दौरान बार-बार डेटा के सबसेट को रोकना ताकि रोक दिया गया डेटा के सबसेट पर मॉडल के प्रदर्शन को निर्धारित किया जा सके।

2
क्या नियमितीकरण मददगार हो सकता है अगर हम केवल मॉडलिंग में रुचि रखते हैं, पूर्वानुमान में नहीं?
क्या नियमितीकरण मददगार हो सकता है यदि हम मॉडल के मापदंडों का केवल अनुमान लगाने (और व्याख्या) में रुचि रखते हैं, पूर्वानुमान या भविष्यवाणी में नहीं? मैं देखता हूं कि यदि आपका लक्ष्य नए डेटा पर अच्छे पूर्वानुमान लगाना है, तो नियमितीकरण / क्रॉस-वैरिफिकेशन कितना उपयोगी है। लेकिन क्या होगा …

1
क्रॉस-वेलिडेशन (CV) पर आधारित भविष्यवाणी अंतराल
टेक्स्ट बुक्स और यूट्यूब लेक्चर्स में मैंने इसे बढ़ाने के रूप में पुनरावृत्त मॉडल के बारे में बहुत कुछ सीखा, लेकिन मैंने कभी भी एक भविष्यवाणी अंतराल प्राप्त करने के बारे में कुछ नहीं देखा। क्रॉस सत्यापन निम्नलिखित के लिए उपयोग किया जाता है: मॉडल का चयन : अलग-अलग मॉडल …

2
बायेसियन मॉडल में क्रॉस-सत्यापन की स्थिरता
मैं JAGS में के-फोल्ड क्रॉस-वैलिडेशन (k = 5) का उपयोग करके एक बायेसियन HLM फिट कर रहा हूं। मुझे पता है कि पैरामीटर का अनुमान है कि क्या करना चाहते हैं सभी परतों भर में स्थिर रहे हैं। ऐसा करने का सबसे अच्छा तरीका क्या है?ββ\beta एक विचार के कूल्हे …

6
क्या हाइपरपरिमेटिंग डेटासेट के नमूने पर एक बुरा विचार है?
मेरे पास 140000 उदाहरणों और 30 विशेषताओं का एक डेटासेट है, जिसके लिए मैं एक द्विआधारी वर्गीकरण (एसवीएम, लॉजिस्टिक रिग्रेशन, रैंडम फॉरेस्ट आदि) के लिए कई क्लासिफायरशिप प्रशिक्षण दे रहा हूं। कई मामलों में ग्रिड या रैंडम खोज का उपयोग करके पूरे डेटासेट पर हाइपरपैरेट ट्यूनिंग बहुत महंगा है। मैंने …

4
प्रशिक्षण और परीक्षण सेट में डेटा को विभाजित करना पर्याप्त क्यों नहीं है
मुझे पता है कि क्लासिफायर के प्रदर्शन का उपयोग करने के लिए मुझे डेटा को प्रशिक्षण / परीक्षण सेट में विभाजित करना होगा। लेकिन इसे पढ़ना : जब आकलनकर्ताओं के लिए विभिन्न सेटिंग्स ("हाइपरपरमेटर्स") का मूल्यांकन करते हैं, जैसे कि सी सेटिंग जो मैन्युअल रूप से एक एसवीएम के लिए …

1
LOOCV फॉर्मूला का प्रमाण
से सांख्यिकीय लर्निंग के लिए एक परिचय जेम्स द्वारा एट अल।, छुट्टी-एक-बाहर पार सत्यापन (LOOCV) अनुमान से परिभाषित किया गया है जहां ।CV(n)=1n∑i=1nMSEiCV(n)=1n∑i=1nMSEi\text{CV}_{(n)} = \dfrac{1}{n}\sum\limits_{i=1}^{n}\text{MSE}_iMSEi=(yi−y^i)2MSEi=(yi−y^i)2\text{MSE}_i = (y_i-\hat{y}_i)^2 प्रमाण के बिना, समीकरण (5.2) बताता है कि कम से कम वर्गों या बहुपद प्रतिगमन के लिए (चाहे यह केवल एक चर पर …

1
K- गुना क्रॉस-सत्यापन से उलझन मैट्रिक्स कैसे रिपोर्ट की जाती है?
मान लीजिए मैं K = 10 सिलवटों के साथ K- गुना क्रॉस-सत्यापन करता हूं। प्रत्येक गुना के लिए एक भ्रम मैट्रिक्स होगा। परिणामों की रिपोर्ट करते समय, क्या मुझे गणना करना चाहिए कि औसत भ्रम मैट्रिक्स क्या है, या बस भ्रम मैट्रीस का योग है?

5
Cv.glmnet परिणामों में विविधता
मैं cv.glmnetभविष्यवक्ताओं को खोजने के लिए उपयोग कर रहा हूं । मेरे द्वारा उपयोग किया जाने वाला सेटअप इस प्रकार है: lassoResults<-cv.glmnet(x=countDiffs,y=responseDiffs,alpha=1,nfolds=cvfold) bestlambda<-lassoResults$lambda.min results<-predict(lassoResults,s=bestlambda,type="coefficients") choicePred<-rownames(results)[which(results !=0)] यह सुनिश्चित करने के परिणाम प्रतिलिपि प्रस्तुत करने योग्य मैं कर रहे हैं set.seed(1)। परिणाम अत्यधिक परिवर्तनशील हैं। मैं यह देखने के लिए कि …

3
ट्रेन में बैठने और परीक्षण से पहले या बाद में प्रतिष्ठा?
मेरे पास N ~ 5000 के साथ एक डेटा सेट है और लगभग 1/2 कम से कम एक महत्वपूर्ण चर पर गायब है। मुख्य विश्लेषणात्मक विधि कॉक्स आनुपातिक खतरे होंगे। मैं कई प्रतिरूपण का उपयोग करने की योजना बना रहा हूं। मैं ट्रेन और टेस्ट सेट में भी बंट जाऊंगा। …

4
क्रॉस सत्यापन और पैरामीटर ट्यूनिंग
क्या कोई मुझे बता सकता है कि परिणाम के रूप में वास्तव में क्रॉस-सत्यापन विश्लेषण क्या देता है? क्या यह सिर्फ औसत सटीकता है या यह किसी भी मॉडल को दिए गए मापदंडों के साथ देता है? क्योंकि, मैंने कहीं सुना है कि पैरामीटर-ट्यूनिंग के लिए क्रॉस-वैलिडेशन का उपयोग किया …

2
कितनी बार हमें के-गुना सीवी दोहराना चाहिए?
मैं बूटस्ट्रैपिंग और क्रॉस वेलिडेशन के बीच के अंतर को देखते हुए इस धागे पर आया - जिस तरह से महान जवाब और संदर्भ। क्या मैं अब सोच रहा हूँ, अगर मैं बार-बार 10 गुना सीवी कहते हैं प्रदर्शन करने के लिए एक वर्गीकारक की सटीकता, गणना करने के लिए …

1
क्या हम आउटलेर्स को प्रकट करने के लिए एक बाहर का मतलब और मानक विचलन का उपयोग कर सकते हैं?
मान लीजिए कि मैंने सामान्य रूप से डेटा वितरित किया है। डेटा के प्रत्येक तत्व के लिए मैं यह जांचना चाहता हूं कि यह कितने एसडी से मतलब से दूर है। डेटा में एक बहिर्वाह हो सकता है (केवल एक ही हो सकता है, लेकिन यह भी दो या तीन …

5
SVM के सर्वोत्तम रूपक खोजने के लिए तेज़ विधि (जो ग्रिड खोज की तुलना में तेज़ है)
मैं वायु प्रदूषकों के अल्पकालिक पूर्वानुमान करने के लिए एसवीएम मॉडल का उपयोग कर रहा हूं। एक नए मॉडल को प्रशिक्षित करने के लिए मुझे एसवीएम मॉडल (मेरा मतलब सी, गामा और इतने पर) के लिए उपयुक्त मेटापैरमीटर खोजने की आवश्यकता है। Libsvm प्रलेखन (और कई अन्य किताबें जो मैंने …

2
प्लॉट की स्केलिंग का उपयोग क्यों करें?
पर्यवेक्षित अधिगम में संभाव्यता के लिए एक विश्वास स्तर को जांचने के लिए (एक एसवीएम या ओवरसम्प्ट डेटा का उपयोग करके एक निर्णय पेड़ से विश्वास को मैप करने के लिए) एक विधि प्लॉट की स्केलिंग (जैसे, बूस्टिंग के लिए कैलिब्रेटेड संभावनाओं को प्राप्त करना ) का उपयोग करना है। …

3
नेस्टेड क्रॉस सत्यापन में हाइपर पैरामीटर कैसे प्राप्त करें?
मैंने नेस्टेड क्रॉस सत्यापन के लिए निम्नलिखित पोस्ट पढ़ी हैं और अभी भी 100% सुनिश्चित नहीं हूं कि मुझे नेस्टेड क्रॉस सत्यापन के साथ मॉडल चयन के साथ क्या करना है: मॉडल चयन के लिए नेस्टेड क्रॉस सत्यापन मॉडल चयन और क्रॉस-सत्यापन: सही तरीका मेरी उलझन को समझाने के लिए, …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.