validation पर टैग किए गए जवाब

यह आकलन करने की प्रक्रिया कि विश्लेषण के परिणाम मूल शोध सेटिंग के बाहर होने की संभावना है या नहीं। माप या उपकरण की 'वैधता' पर चर्चा करने के लिए इस टैग का उपयोग न करें (जैसे कि यह इसका क्या उपाय है), इसके बजाय [वैधता] टैग का उपयोग करें।

1
logloss बनाम गिन्नी / औक
मैंने दो मॉडल (h2o AutoML का उपयोग करके बाइनरी क्लासीफायर) को प्रशिक्षित किया है और मैं उपयोग करने के लिए एक का चयन करना चाहता हूं। मेरे पास निम्नलिखित परिणाम हैं: model_id auc logloss logloss_train logloss_valid gini_train gini_valid DL_grid_1 0.542694 0.287469 0.092717 0.211956 0.872932 0.312975 DL_grid_2 0.543685 0.251431 0.082616 0.186196 …

1
जब अलग मॉडलिंग / सत्यापन सेट का उपयोग करके एक प्रतिगमन मॉडल का निर्माण किया जाता है, तो क्या सत्यापन डेटा को "पुन: प्रसारित" करना उचित है?
मान लीजिए कि मुझे मॉडलिंग / सत्यापन टिप्पणियों के बीच 80/20 का विभाजन मिला है। मैंने मॉडलिंग डेटा सेट के लिए एक मॉडल फिट किया है, और मैं उस त्रुटि के साथ सहज हूं जो मैं सत्यापन डेटा सेट पर देख रहा हूं। इससे पहले कि मैं भविष्य के अवलोकन …

3
शास्त्रीय आंकड़ों में इस्तेमाल होने वाला होल्डआउट तरीका (प्रशिक्षण और परीक्षण में डेटा को विभाजित करना) क्यों नहीं है?
डेटा माइनिंग के लिए मेरी कक्षा के एक्सपोज़र में, मॉडल प्रदर्शन का आकलन करने के तरीके के रूप में होल्डआउट विधि पेश की गई थी। हालांकि, जब मैंने रैखिक मॉडल पर अपनी पहली कक्षा ली, तो इसे मॉडल सत्यापन या मूल्यांकन के साधन के रूप में पेश नहीं किया गया …

1
बैरियर स्कोर के औसत निरपेक्ष त्रुटि एनालॉग का नाम?
कल का प्रश्न मॉडल की सटीकता निर्धारित करता है जो अनुमान लगाता है कि घटना की संभावना मुझे संभावना स्कोरिंग के बारे में उत्सुक थी। जंगली गुलाब स्कोर एक मतलब वर्ग त्रुटि उपाय है। क्या एनालॉग का मतलब पूर्ण त्रुटि प्रदर्शन माप1 है1एनΣमैं = १एन( p r e di c …

3
ट्रेन / टेस्ट / सत्यापन सेट में विभाजित समय श्रृंखला डेटा
ट्रेन / परीक्षण / सत्यापन सेट में टाइम सीरीज़ डेटा को विभाजित करने का सबसे अच्छा तरीका क्या है, जहां हाइपरपरमीटर ट्यूनिंग के लिए सत्यापन सेट का उपयोग किया जाएगा? हमारे पास दैनिक बिक्री डेटा के 3 साल का मूल्य है, और हमारी योजना 2015-2016 को प्रशिक्षण डेटा के रूप …

2
क्या त्रुटि दर नियमितीकरण पैरामीटर लंबो का उत्तल कार्य है?
रिज या लैस्सो में नियमितीकरण पैरामीटर लैम्ब्डा को चुनने में अनुशंसित विधि लैम्ब्डा के विभिन्न मूल्यों की कोशिश करना है, सत्यापन सेट में त्रुटि को मापना और अंत में लैम्बडा के उस मूल्य को चुना जो सबसे कम त्रुटि देता है। यह मेरे लिए क्लैट नहीं है यदि फ़ंक्शन f …

1
क्लस्टर सत्यापन के लिए सूचना (VI) मीट्रिक की भिन्नता के पीछे अंतर्ज्ञान क्या है?
मेरे जैसे गैर-सांख्यिकीविदों के लिए, VIमरीना मेलिया " तुलनात्मक क्लस्टरिंग - एक सूचना आधारित दूरी " (जर्नल ऑफ़ मल्टीवेरेट एनालिसिस, 2007) द्वारा प्रासंगिक पेपर पढ़ने के बाद भी मीट्रिक (सूचना की भिन्नता) के विचार को पकड़ना बहुत मुश्किल है । वास्तव में, मैं वहाँ से बाहर कई क्लस्टरिंग शर्तों से …

1
पैनल / अनुदैर्ध्य डेटा के लिए भविष्यवाणी मूल्यांकन मीट्रिक
मैं कई अलग-अलग मॉडलों का मूल्यांकन करना चाहता हूं जो मासिक स्तर पर व्यवहार की भविष्यवाणी प्रदान करते हैं। डेटा संतुलित है, और 100,000 और 12. परिणाम किसी दिए गए महीने में एक संगीत कार्यक्रम में भाग ले रहा है, इसलिए यह किसी भी महीने में ~ 80% लोगों के …

3
संगति जाँच क्या है?
मुझे इस तरह का प्रश्न पूछा गया था "क्या आपने अपने दैनिक कार्य में कोई निरंतरता की जाँच की है?" एक Biostatistician स्थिति के लिए एक फोन साक्षात्कार के दौरान। मुझे नहीं पता कि क्या जवाब दूं। किसी भी जानकारी की सराहना की है।
11 validation 

2
बड़े समग्र डेटासेट से प्रतिनिधि नमूना कैसे सेट करें?
नमूना सेट बनाने के लिए सांख्यिकीय तकनीक क्या हैं, जो पूरी आबादी का प्रतिनिधि है (ज्ञात आत्मविश्वास स्तर के साथ)? इसके अलावा, कैसे सत्यापित करें, यदि नमूना समग्र डेटासेट में फिट बैठता है? क्या यह संभव है, संपूर्ण डेटासेट को पार्स किए बिना (जो अरबों रिकॉर्ड हो सकते हैं)?

2
आशावाद पूर्वाग्रह - भविष्यवाणी की त्रुटि का अनुमान है
सांख्यिकीय शिक्षण की पुस्तक तत्व (पीडीएफ ऑनलाइन में उपलब्ध) आशावादी पूर्वाग्रह (7.21, पृष्ठ 229) पर चर्चा करती है। यह बताता है कि आशावाद पूर्वाग्रह प्रशिक्षण त्रुटि और इन-सैंपल त्रुटि के बीच का अंतर है (यदि हम मूल प्रशिक्षण बिंदुओं में से प्रत्येक पर नए परिणाम मानों का नमूना करते हैं) …

4
मॉडल फिटिंग / प्रशिक्षण और सत्यापन के लिए उपयोग किए गए नमूना डेटा के अनुपात की गणना
एक नमूना आकार "एन" प्रदान किया है जो मैं पूर्वानुमान डेटा का उपयोग करने की योजना बना रहा हूं। डेटा को वश में करने के कुछ तरीके क्या हैं ताकि मैं इसका उपयोग किसी मॉडल को स्थापित करने के लिए करूं, और शेष डेटा को मॉडल को मान्य करने के …
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.