overfitting पर टैग किए गए जवाब

चर के बीच प्रतिरूपनीय और सूचनात्मक रिश्तों के बजाय मॉडलिंग त्रुटि (विशेष रूप से नमूनाकरण त्रुटि) मॉडल फिट आंकड़ों में सुधार करती है, लेकिन पार्सिमनी को कम करती है, और व्याख्यात्मक और पूर्वानुमानात्मक वैधता को बिगड़ती है।

2
क्या कोई (सैद्धांतिक रूप से) वजन से कम प्रशिक्षण नमूनों के साथ एक तंत्रिका नेटवर्क को प्रशिक्षित कर सकता है?
सबसे पहले: मुझे पता है, एक तंत्रिका नेटवर्क को प्रशिक्षित करने के लिए आवश्यक सामान्य आकार का कोई नमूना नहीं है। यह कार्य की जटिलता, डेटा में शोर और इतने पर जैसे कई कारकों पर निर्भर करता है। और मेरे पास जितने अधिक प्रशिक्षण नमूने होंगे, उतना ही बेहतर मेरा …

1
फिशर का सटीक परीक्षण और हाइपरजोमेट्रिक वितरण
मैं फिशर सटीक परीक्षण को बेहतर तरीके से समझना चाहता था, इसलिए मैंने निम्नलिखित खिलौना उदाहरण तैयार किया, जहां एफ और एम पुरुष और महिला से मेल खाते हैं, और n और y इस तरह से "सोडा की खपत" से मेल खाती है: > soda_gender f m n 0 5 …

1
ओवर-फिटिंग डेटा के बिना सबसे अच्छा फिट का चयन कैसे करें? एन सामान्य कार्यों, आदि के साथ एक द्विदिश वितरण मॉडलिंग
मेरे पास स्पष्ट रूप से मूल्यों का वितरण है, जिसे मैं फिट करना चाहता हूं। डेटा को 2 सामान्य कार्यों (बिमोडल) या 3 सामान्य कार्यों के साथ अच्छी तरह से फिट किया जा सकता है। इसके अतिरिक्त, डेटा को 3 के साथ फिट करने के लिए एक प्रशंसनीय भौतिक कारण …

4
रैखिक Classifiers के साथ ओवरफिटिंग
आज हमारे प्राध्यापक ने कक्षा में बताया कि "रेखीय वर्गीय अक्षरों के साथ ओवरफिटिंग संभव नहीं है"। मुझे लगता है कि गलत होने के लिए, चूंकि रैखिक सेटिफ़ायर प्रशिक्षण सेट में आउटलेर्स के लिए संवेदनशील हो सकते हैं - उदाहरण के लिए एक कठिन मार्जिन का सहारा लें वेक्टर मशीन: …

1
क्या रैंडम फ़ॉरेस्ट के साथ मॉडलिंग को क्रॉस-मान्यता की आवश्यकता है?
जहाँ तक मैंने देखा है, इस बारे में राय अलग-अलग है। सबसे अच्छा अभ्यास निश्चित रूप से क्रॉस-वैलिडेशन का उपयोग करके निर्देशित करेगा (विशेषकर यदि एक ही डेटासेट पर अन्य एल्गोरिदम के साथ आरएफ की तुलना करें)। दूसरी ओर, मूल स्रोत बताता है कि मॉडल प्रशिक्षण के दौरान ओओबी त्रुटि …

1
रैंडम फ़ॉरेस्ट ओवरफ़िट नहीं कर सकता?
मैंने कुछ साहित्य पढ़ा है कि यादृच्छिक वन ओवरफिट नहीं कर सकते हैं। जबकि यह बहुत अच्छा लगता है, यह सच होना बहुत अच्छा लगता है। क्या rf की ओवरफिट करना संभव है?

2
रिज प्रतिगमन में "मैट्रिक्स व्युत्क्रम की संख्यात्मक स्थिरता" के लिए स्पष्ट व्याख्या और ओवरफिट को कम करने में इसकी भूमिका
मैं समझता हूं कि हम कम से कम वर्गों के प्रतिगमन समस्या में नियमितीकरण को नियोजित कर सकते हैं w∗=argminw[(y−Xw)T(y−Xw)+λ∥w∥2]w∗=argminw⁡[(y−Xw)T(y−Xw)+λ‖w‖2]\boldsymbol{w}^* = \operatorname*{argmin}_w \left[ (\mathbf y-\mathbf{Xw})^T(\boldsymbol{y}-\mathbf{Xw}) + \lambda\|\boldsymbol{w}\|^2 \right] और इस समस्या का एक बंद-रूप समाधान है: w^=(XTX+λI)−1XTy.w^=(XTX+λI)−1XTy.\hat{\boldsymbol{w}} = (\boldsymbol{X}^T\boldsymbol{X}+\lambda\boldsymbol{I})^{-1}\boldsymbol{X}^T\boldsymbol{y}. हम देखते हैं कि 2 समीकरण में, नियमितीकरण बस λλ\lambda को …

1
क्या एक संतृप्त मॉडल एक ओवरफेड मॉडल का एक विशेष मामला है?
मैं यह समझने की कोशिश कर रहा हूं कि एक संतृप्त मॉडल क्या है। AFAIK यह है जब आप टिप्पणियों के रूप में कई विशेषताएं हैं। क्या हम कह सकते हैं कि एक संतृप्त मॉडल एक अति-संपन्न मॉडल का विशेष मामला है?

1
बहु प्रतिगमन करते समय पिछड़ा उन्मूलन क्यों उचित है?
क्या यह ओवर-फिटिंग में परिणाम नहीं करता है? क्या मेरे परिणाम अधिक विश्वसनीय होंगे यदि मैंने विश्लेषण के एक भाग के रूप में जैक-चाकू या बूटस्ट्रैप प्रक्रिया को जोड़ा?

2
मॉडल-निर्माण प्रक्रिया इंटरैक्टिव होने पर बैक-टेस्टिंग या क्रॉस-वैरिफाइंग
मेरे पास कुछ पूर्वानुमानित मॉडल हैं, जिनका प्रदर्शन मैं बैक-टेस्ट करना चाहता हूं (अर्थात, मेरे डेटासेट को "रिवाइंड" करके इसे पिछले बिंदु तक ले जाऊंगा और फिर देखूंगा कि मॉडल ने कैसा प्रदर्शन किया है)। समस्या यह है कि मेरे कुछ मॉडल एक इंटरैक्टिव प्रक्रिया के माध्यम से बनाए गए …
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.