overfitting पर टैग किए गए जवाब

चर के बीच प्रतिरूपनीय और सूचनात्मक रिश्तों के बजाय मॉडलिंग त्रुटि (विशेष रूप से नमूनाकरण त्रुटि) मॉडल फिट आंकड़ों में सुधार करती है, लेकिन पार्सिमनी को कम करती है, और व्याख्यात्मक और पूर्वानुमानात्मक वैधता को बिगड़ती है।

21
"ओवरफिटिंग" का वास्तविक विश्व उदाहरण क्या है?
मैं समझता हूं कि "ओवरफिटिंग" का क्या मतलब है, लेकिन मुझे वास्तविक दुनिया के उदाहरण के साथ आने के लिए मदद की जरूरत है जो ओवरफिटिंग पर लागू होती है।
107 overfitting 

6
उच्च आयाम ( ) में रिज रिग्रेशन बेकार है ? ओएलएस ओवरफिट करने में कैसे विफल हो सकता है?
भविष्यवक्ताओं और नमूना आकार साथ एक अच्छी पुरानी प्रतिगमन समस्या पर विचार करें । सामान्य ज्ञान यह है कि ओएलएस आकलनकर्ता ओवरफिट करेगा और आम तौर पर रिज रिग्रेशन अनुमानक द्वारा बेहतर प्रदर्शन करेगा:यह एक इष्टतम नियमितीकरण पैरामीटर खोजने के लिए क्रॉस-मान्यता का उपयोग करने के लिए मानक है । …

6
रैंडम फॉरेस्ट - ओवरफिटिंग से कैसे निपटें
मेरे पास एक कंप्यूटर विज्ञान पृष्ठभूमि है, लेकिन मैं इंटरनेट पर समस्याओं को हल करके खुद को डेटा विज्ञान सिखाने की कोशिश कर रहा हूं। मैं पिछले कुछ हफ्तों से इस समस्या पर काम कर रहा हूं (लगभग 900 पंक्तियाँ और 10 विशेषताएँ)। मैं शुरू में लॉजिस्टिक रिग्रेशन का उपयोग …

4
क्या जर्नल साइंस ने गार्डन ऑफ फोर्किंग पाथ्स एनालिसिस का समर्थन किया है?
अनुकूली डेटा विश्लेषण का विचार का है कि आप लिए अपनी योजना को बदल दें क्योंकि आप इसके बारे में अधिक सीखते हैं। खोजपूर्ण डेटा विश्लेषण (EDA) के मामले में, यह आम तौर पर एक अच्छा विचार है (आप अक्सर डेटा में अप्रत्याशित पैटर्न की तलाश कर रहे हैं), लेकिन …

4
यह कैसे संभव है कि सत्यापन हानि बढ़ रही है जबकि सत्यापन सटीकता भी बढ़ रही है
मैं CIFAR10 डेटासेट पर एक सरल तंत्रिका नेटवर्क का प्रशिक्षण दे रहा हूं। कुछ समय बाद, सत्यापन हानि बढ़ने लगी, जबकि सत्यापन सटीकता भी बढ़ रही है। परीक्षण हानि और परीक्षण सटीकता में सुधार जारी है। यह कैसे हो सकता है? ऐसा लगता है कि यदि सत्यापन हानि में वृद्धि …

5
लॉजिस्टिक रिग्रेशन मॉडल ओवरफिटिंग
क्या लॉजिस्टिक रिग्रेशन मॉडल को ओवरफिट करना संभव है? मैंने एक वीडियो देखा जिसमें कहा गया था कि यदि आरओसी वक्र के नीचे मेरा क्षेत्र 95% से अधिक है, तो इसके बहुत अधिक फिट होने की संभावना है, लेकिन क्या लॉजिस्टिक रिग्रेशन मॉडल को ओवरफिट करना संभव है?

6
नियमितीकरण में छोटे वज़न का सरल मॉडल क्यों होता है?
मैंने एंड्रयू एनजी के मशीन लर्निंग कोर्स को एक साल पहले पूरा कर लिया है, और अब मैं अपने हाई स्कूल मैथ की खोज को लॉजिस्टिक रिग्रेशन और तकनीकों के प्रदर्शन पर अनुकूलित करने के लिए लिख रहा हूं। इन तकनीकों में से एक, निश्चित रूप से, नियमितीकरण है। नियमितीकरण …

2
क्या यह सच है कि बायेसियन तरीके अधिक नहीं हैं?
क्या यह सच है कि बायेसियन तरीके अधिक नहीं हैं? (मैंने यह दावा करते कुछ पेपर और ट्यूटोरियल देखे) उदाहरण के लिए, यदि हम एमएनआईएसटी (हस्तलिखित अंक वर्गीकरण) के लिए एक गौसियन प्रक्रिया लागू करते हैं, लेकिन केवल इसे एक एकल नमूना दिखाते हैं, तो क्या यह उस एकल नमूने …

5
क्या एक ओवरफेड मॉडल जरूरी बेकार है?
मान लें कि एक मॉडल के प्रशिक्षण डेटा पर 100% सटीकता है, लेकिन परीक्षण डेटा पर 70% सटीकता है। इस मॉडल के बारे में निम्नलिखित तर्क सही है? यह स्पष्ट है कि यह एक ओवरफेड मॉडल है। ओवरफिटिंग को कम करके परीक्षण की सटीकता को बढ़ाया जा सकता है। लेकिन, …

2
क्या यह पीसीए और एलडीए के संयोजन के लिए समझ में आता है?
मान लें कि मेरे पास पर्यवेक्षित सांख्यिकीय वर्गीकरण कार्य के लिए एक डेटासेट है, उदाहरण के लिए, बेयस के क्लासिफायरियर के माध्यम से। इस डेटासेट में 20 विशेषताएं हैं और मैं इसे प्राइमरी कंपोनेंट एनालिसिस (PCA) और / या रैखिक डिस्क्रिमिनेंट एनालिसिस (LDA) जैसी डायमेंशनलिटी रिडक्शन तकनीकों के जरिए 2 …

4
"अर्ध पर्यवेक्षित शिक्षण" - क्या यह ओवरफिटिंग है?
मैं एक कागल प्रतियोगिता ( मालवेयर क्लासिफिकेशन ) के जीतने के समाधान की रिपोर्ट पढ़ रहा था । रिपोर्ट इस फ़ोरम पोस्ट में पाई जा सकती है । समस्या एक वर्गीकरण समस्या थी (नौ कक्षाएं, ट्रेन सेट में 10000 तत्वों के साथ मीट्रिक का लॉगरिदमिक नुकसान था), परीक्षण सेट में …

9
ओवरफिटिंग और अंडरफिटिंग
मैंने ओवरफिटिंग और अंडरफिटिंग के बारे में कुछ शोध किया है, और मैंने समझा है कि वे वास्तव में क्या हैं, लेकिन मैं इसके कारणों का पता नहीं लगा सकता। ओवरफिटिंग और अंडरफिटिंग के मुख्य कारण क्या हैं? हम एक मॉडल को प्रशिक्षित करने में इन दो समस्याओं का सामना …

1
Xgboost में ओवरफिट के बारे में चर्चा
मेरा सेट-अप निम्नलिखित है: मैं "एप्लाइड प्रिडिक्टिव मॉडलिंग" में दिशानिर्देशों का पालन कर रहा हूं। इस प्रकार मैंने सहसंबद्ध सुविधाओं को फ़िल्टर किया है और निम्नलिखित के साथ समाप्त होता है: ट्रेनिंग सेट में 4900 डेटा पॉइंट और टेस्ट सेट में 1600 डेटा पॉइंट हैं। मेरे पास 26 विशेषताएं हैं …

5
प्रतिगमन में ओवरफिटिंग से बचें: नियमितीकरण के विकल्प
प्रतिगमन में नियमितीकरण (लीनियर, लॉजिस्टिक ...) ओवर-फिटिंग को कम करने का सबसे लोकप्रिय तरीका है। जब लक्ष्य भविष्यवाणी सटीकता (व्याख्या नहीं) है, तो क्या नियमितीकरण के लिए कोई अच्छा विकल्प हैं, विशेष रूप से बड़े डेटा-सेट (मील / अरबों टिप्पणियों और लाखों विशेषताओं) के लिए उपयुक्त हैं?

2
बूस्टिंग: सीखने की दर को नियमितीकरण पैरामीटर क्यों कहा जाता है?
सीखने की दर पैरामीटर ( ) ढाल में सिकुड़ती बढ़ाने प्रत्येक नया आधार मॉडल -typically एक उथले tree- कि श्रृंखला में जोड़ा जाता है का योगदान। यह नाटकीय रूप से परीक्षण सेट सटीकता को बढ़ाने के लिए दिखाया गया था, जो कि छोटे कदमों के साथ समझ में आता है, …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.