सांख्यिकी और बिग डेटा cross-validation

2

क्या नियमितीकरण मददगार हो सकता है अगर हम केवल मॉडलिंग में रुचि रखते हैं, पूर्वानुमान में नहीं?

क्या नियमितीकरण मददगार हो सकता है यदि हम मॉडल के मापदंडों का केवल अनुमान लगाने (और व्याख्या) में रुचि रखते हैं, पूर्वानुमान या भविष्यवाणी में नहीं? मैं देखता हूं कि यदि आपका लक्ष्य नए डेटा पर अच्छे पूर्वानुमान लगाना है, तो नियमितीकरण / क्रॉस-वैरिफिकेशन कितना उपयोगी है। लेकिन क्या होगा …

19 cross-validation econometrics model-selection interpretation regularization

1

क्रॉस-वेलिडेशन (CV) पर आधारित भविष्यवाणी अंतराल

टेक्स्ट बुक्स और यूट्यूब लेक्चर्स में मैंने इसे बढ़ाने के रूप में पुनरावृत्त मॉडल के बारे में बहुत कुछ सीखा, लेकिन मैंने कभी भी एक भविष्यवाणी अंतराल प्राप्त करने के बारे में कुछ नहीं देखा। क्रॉस सत्यापन निम्नलिखित के लिए उपयोग किया जाता है: मॉडल का चयन : अलग-अलग मॉडल …

19 cross-validation boosting prediction-interval

2

बायेसियन मॉडल में क्रॉस-सत्यापन की स्थिरता

मैं JAGS में के-फोल्ड क्रॉस-वैलिडेशन (k = 5) का उपयोग करके एक बायेसियन HLM फिट कर रहा हूं। मुझे पता है कि पैरामीटर का अनुमान है कि क्या करना चाहते हैं सभी परतों भर में स्थिर रहे हैं। ऐसा करने का सबसे अच्छा तरीका क्या है?ββ\beta एक विचार के कूल्हे …

19 bayesian cross-validation

6

क्या हाइपरपरिमेटिंग डेटासेट के नमूने पर एक बुरा विचार है?

मेरे पास 140000 उदाहरणों और 30 विशेषताओं का एक डेटासेट है, जिसके लिए मैं एक द्विआधारी वर्गीकरण (एसवीएम, लॉजिस्टिक रिग्रेशन, रैंडम फॉरेस्ट आदि) के लिए कई क्लासिफायरशिप प्रशिक्षण दे रहा हूं। कई मामलों में ग्रिड या रैंडम खोज का उपयोग करके पूरे डेटासेट पर हाइपरपैरेट ट्यूनिंग बहुत महंगा है। मैंने …

19 machine-learning cross-validation hyperparameter

4

प्रशिक्षण और परीक्षण सेट में डेटा को विभाजित करना पर्याप्त क्यों नहीं है

मुझे पता है कि क्लासिफायर के प्रदर्शन का उपयोग करने के लिए मुझे डेटा को प्रशिक्षण / परीक्षण सेट में विभाजित करना होगा। लेकिन इसे पढ़ना : जब आकलनकर्ताओं के लिए विभिन्न सेटिंग्स ("हाइपरपरमेटर्स") का मूल्यांकन करते हैं, जैसे कि सी सेटिंग जो मैन्युअल रूप से एक एसवीएम के लिए …

18 machine-learning cross-validation

1

LOOCV फॉर्मूला का प्रमाण

से सांख्यिकीय लर्निंग के लिए एक परिचय जेम्स द्वारा एट अल।, छुट्टी-एक-बाहर पार सत्यापन (LOOCV) अनुमान से परिभाषित किया गया है जहां ।CV(n)=1n∑i=1nMSEiCV(n)=1n∑i=1nMSEi\text{CV}_{(n)} = \dfrac{1}{n}\sum\limits_{i=1}^{n}\text{MSE}_iMSEi=(yi−y^i)2MSEi=(yi−y^i)2\text{MSE}_i = (y_i-\hat{y}_i)^2 प्रमाण के बिना, समीकरण (5.2) बताता है कि कम से कम वर्गों या बहुपद प्रतिगमन के लिए (चाहे यह केवल एक चर पर …

18 regression self-study cross-validation least-squares

1

K- गुना क्रॉस-सत्यापन से उलझन मैट्रिक्स कैसे रिपोर्ट की जाती है?

मान लीजिए मैं K = 10 सिलवटों के साथ K- गुना क्रॉस-सत्यापन करता हूं। प्रत्येक गुना के लिए एक भ्रम मैट्रिक्स होगा। परिणामों की रिपोर्ट करते समय, क्या मुझे गणना करना चाहिए कि औसत भ्रम मैट्रिक्स क्या है, या बस भ्रम मैट्रीस का योग है?

18 machine-learning cross-validation accuracy

5

Cv.glmnet परिणामों में विविधता

मैं cv.glmnetभविष्यवक्ताओं को खोजने के लिए उपयोग कर रहा हूं । मेरे द्वारा उपयोग किया जाने वाला सेटअप इस प्रकार है: lassoResults<-cv.glmnet(x=countDiffs,y=responseDiffs,alpha=1,nfolds=cvfold) bestlambda<-lassoResults$lambda.min results<-predict(lassoResults,s=bestlambda,type="coefficients") choicePred<-rownames(results)[which(results !=0)] यह सुनिश्चित करने के परिणाम प्रतिलिपि प्रस्तुत करने योग्य मैं कर रहे हैं set.seed(1)। परिणाम अत्यधिक परिवर्तनशील हैं। मैं यह देखने के लिए कि …

18 r cross-validation feature-selection glmnet

3

ट्रेन में बैठने और परीक्षण से पहले या बाद में प्रतिष्ठा?

मेरे पास N ~ 5000 के साथ एक डेटा सेट है और लगभग 1/2 कम से कम एक महत्वपूर्ण चर पर गायब है। मुख्य विश्लेषणात्मक विधि कॉक्स आनुपातिक खतरे होंगे। मैं कई प्रतिरूपण का उपयोग करने की योजना बना रहा हूं। मैं ट्रेन और टेस्ट सेट में भी बंट जाऊंगा। …

18 cross-validation survival multiple-imputation train

4

क्रॉस सत्यापन और पैरामीटर ट्यूनिंग

क्या कोई मुझे बता सकता है कि परिणाम के रूप में वास्तव में क्रॉस-सत्यापन विश्लेषण क्या देता है? क्या यह सिर्फ औसत सटीकता है या यह किसी भी मॉडल को दिए गए मापदंडों के साथ देता है? क्योंकि, मैंने कहीं सुना है कि पैरामीटर-ट्यूनिंग के लिए क्रॉस-वैलिडेशन का उपयोग किया …

18 cross-validation

2

कितनी बार हमें के-गुना सीवी दोहराना चाहिए?

मैं बूटस्ट्रैपिंग और क्रॉस वेलिडेशन के बीच के अंतर को देखते हुए इस धागे पर आया - जिस तरह से महान जवाब और संदर्भ। क्या मैं अब सोच रहा हूँ, अगर मैं बार-बार 10 गुना सीवी कहते हैं प्रदर्शन करने के लिए एक वर्गीकारक की सटीकता, गणना करने के लिए …

18 cross-validation

1

क्या हम आउटलेर्स को प्रकट करने के लिए एक बाहर का मतलब और मानक विचलन का उपयोग कर सकते हैं?

मान लीजिए कि मैंने सामान्य रूप से डेटा वितरित किया है। डेटा के प्रत्येक तत्व के लिए मैं यह जांचना चाहता हूं कि यह कितने एसडी से मतलब से दूर है। डेटा में एक बहिर्वाह हो सकता है (केवल एक ही हो सकता है, लेकिन यह भी दो या तीन …

17 cross-validation standard-deviation mean outliers

5

SVM के सर्वोत्तम रूपक खोजने के लिए तेज़ विधि (जो ग्रिड खोज की तुलना में तेज़ है)

मैं वायु प्रदूषकों के अल्पकालिक पूर्वानुमान करने के लिए एसवीएम मॉडल का उपयोग कर रहा हूं। एक नए मॉडल को प्रशिक्षित करने के लिए मुझे एसवीएम मॉडल (मेरा मतलब सी, गामा और इतने पर) के लिए उपयुक्त मेटापैरमीटर खोजने की आवश्यकता है। Libsvm प्रलेखन (और कई अन्य किताबें जो मैंने …

17 cross-validation svm

2

प्लॉट की स्केलिंग का उपयोग क्यों करें?

पर्यवेक्षित अधिगम में संभाव्यता के लिए एक विश्वास स्तर को जांचने के लिए (एक एसवीएम या ओवरसम्प्ट डेटा का उपयोग करके एक निर्णय पेड़ से विश्वास को मैप करने के लिए) एक विधि प्लॉट की स्केलिंग (जैसे, बूस्टिंग के लिए कैलिब्रेटेड संभावनाओं को प्राप्त करना ) का उपयोग करना है। …

17 logistic cross-validation calibration

3

नेस्टेड क्रॉस सत्यापन में हाइपर पैरामीटर कैसे प्राप्त करें?

मैंने नेस्टेड क्रॉस सत्यापन के लिए निम्नलिखित पोस्ट पढ़ी हैं और अभी भी 100% सुनिश्चित नहीं हूं कि मुझे नेस्टेड क्रॉस सत्यापन के साथ मॉडल चयन के साथ क्या करना है: मॉडल चयन के लिए नेस्टेड क्रॉस सत्यापन मॉडल चयन और क्रॉस-सत्यापन: सही तरीका मेरी उलझन को समझाने के लिए, …

17 cross-validation scikit-learn hyperparameter

cross-validation पर टैग किए गए जवाब