cross-validation पर टैग किए गए जवाब

मॉडल की फिटिंग के दौरान बार-बार डेटा के सबसेट को रोकना ताकि रोक दिया गया डेटा के सबसेट पर मॉडल के प्रदर्शन को निर्धारित किया जा सके।

2
नेस्टेड क्रॉस-मान्यता का उपयोग
मॉडल चयन पर Scikit जानें के पृष्ठ में नेस्टेड क्रॉस-मान्यता के उपयोग का उल्लेख है: >>> clf = GridSearchCV(estimator=svc, param_grid=dict(gamma=gammas), ... n_jobs=-1) >>> cross_validation.cross_val_score(clf, X_digits, y_digits) दो क्रॉस-वेलिडेशन लूप्स समानांतर में किए जाते हैं: एक ग्रिडड्रेससीवी अनुमानक द्वारा गामा सेट करने के लिए और दूसरा एक क्रॉस_वेल_स्कोर द्वारा अनुमानक के …

2
सादे अंग्रेजी में R का उपयोग करके एक कॉक्स आनुपातिक खतरों प्रतिगमन मॉडल की व्याख्या और सत्यापन
क्या कोई मुझे सादे अंग्रेजी में मेरे कॉक्स मॉडल की व्याख्या कर सकता है? मैंने फ़ंक्शन का उपयोग करके अपने डेटा के सभी के लिए निम्न कॉक्स प्रतिगमन मॉडल फिट किया है cph। मेरा डेटा नामक ऑब्जेक्ट में सहेजा गया है Data। चर w, xऔर yनिरंतर हैं; zदो स्तरों का …

1
ट्रेन बनाम टेस्ट त्रुटि गैप और इसके संबंध को ओवरफिट करने के लिए: परस्पर विरोधी सलाह को पुनः प्राप्त करना
ट्रेन बनाम टेस्ट त्रुटि की तुलना करने के तरीके के बारे में वहाँ परस्पर विरोधी सलाह दी जा रही है, विशेषकर तब जब दोनों के बीच अंतर हो। मुझे लगता है कि संघर्ष के लिए विचार के दो स्कूल प्रतीत होते हैं। मैं समझने की कोशिश कर रहा हूं कि …

2
प्रशिक्षण / सत्यापन / परीक्षण सेट के संदर्भ में के-गुना क्रॉस सत्यापन कैसे फिट होता है?
मेरा मुख्य प्रश्न यह समझने की कोशिश करना है कि प्रशिक्षण / सत्यापन / परीक्षण सेट (यदि यह इस तरह के संदर्भ में बिल्कुल फिट बैठता है) के संदर्भ में k- गुना क्रॉस-वैलिडेशन कैसे फिट बैठता है। आमतौर पर, लोग डेटा को एक प्रशिक्षण, सत्यापन और परीक्षण सेट में विभाजित …

2
क्रॉस सत्यापन और पैरामीटर अनुकूलन
जब मैं 10-गुना क्रॉस सत्यापन का उपयोग करता हूं तो मेरे पास पैरामीटर अनुकूलन के बारे में एक प्रश्न है। मैं पूछना चाहता हूं कि क्या मापदंडों को हर गुना मॉडल प्रशिक्षण के दौरान ठीक करना चाहिए या नहीं, अर्थात (1) प्रत्येक गुना औसत सटीकता के लिए अनुकूलित मापदंडों में …

5
लॉजिस्टिक रिग्रेशन पर दार्शनिक सवाल: क्यों इष्टतम सीमा मूल्य प्रशिक्षित नहीं है?
आमतौर पर लॉजिस्टिक रिग्रेशन में, हम एक मॉडल फिट करते हैं और प्रशिक्षण सेट पर कुछ पूर्वानुमान प्राप्त करते हैं। फिर हम उन प्रशिक्षण भविष्यवाणियों ( यहाँ कुछ पसंद ) पर क्रॉस-वैरिफाई करते हैं और आरओसी वक्र की तरह कुछ के आधार पर इष्टतम सीमा मूल्य तय करते हैं। हम …

1
यादृच्छिक वन का मूल्यांकन करें: OOB बनाम CV
जब हम एक यादृच्छिक वन की गुणवत्ता का आकलन करते हैं, उदाहरण के लिए एयूसी का उपयोग करते हुए, क्या इन मात्राओं को आउट ऑफ बैग नमूने पर या क्रॉस सत्यापन के होल्ड आउट पर गणना करना अधिक उपयुक्त है? मैंने सुना है कि OOB नमूनों पर इसकी गणना करने …

4
क्रॉस सत्यापन डेटा स्नूपिंग से अलग कैसे है?
मैंने "सांख्यिकीय शिक्षा का एक परिचय" समाप्त किया । मैंने सोचा कि क्या विभिन्न मशीन लर्निंग तकनीकों के लिए सर्वोत्तम ट्यूनिंग मापदंडों को खोजने के लिए क्रॉस-मान्यता का उपयोग करना डेटा स्नूपिंग से अलग है? हम बार-बार जाँच रहे हैं कि ट्यूनिंग पैरामीटर के कौन से मूल्य परीक्षण सेट में …

1
K- गुना क्रॉस-मान्यता के साथ, क्या आप अंतिम मॉडल बनाने के लिए सभी मॉडल का औसत रखते हैं ?
K- गुना क्रॉस सत्यापन करते समय, मैं समझता हूं कि आप उस एक को छोड़कर सभी गुनाओं को इंगित करके सटीकता मीट्रिक प्राप्त करते हैं और पूर्वानुमान बनाते हैं, और फिर इस प्रक्रिया को बार दोहराते हैं । इसके बाद आप अपने सभी उदाहरणों पर सटीकता मेट्रिक्स चला सकते हैं …

2
सत्यापन और मॉडल चयन के लिए बूटस्ट्रैपिंग को समझना
मुझे लगता है कि मैं समझता हूं कि बूटस्ट्रैपिंग के मूल सिद्धांत कैसे काम करते हैं, लेकिन मुझे यकीन नहीं है कि मैं समझता हूं कि मैं मॉडल चयन के लिए बूटस्ट्रैपिंग का उपयोग कैसे कर सकता हूं या ओवरफिटिंग से बचने के लिए। उदाहरण के लिए, उदाहरण के लिए, …

2
Keras: क्यों घट जाती है जबकि val_loss बढ़ जाती है?
मैंने पैरामस के एक समूह के लिए ग्रिड खोज की स्थापना की। मैं एक केरस तंत्रिका जाल के लिए सबसे अच्छा पैरामीटर खोजने की कोशिश कर रहा हूं जो बाइनरी वर्गीकरण करता है। आउटपुट या तो 1 या 0. एक लगभग 200 विशेषताएं हैं। जब मैंने एक ग्रिड खोज की, …

1
LogisticRegressionCV में गैर-अभिसरण कैसे ठीक करें
मैं डेटा के एक सेट पर क्रॉसवालाइडेशन के साथ लॉजिस्टिक रिग्रेशन करने के लिए स्किकिट-लर्न का उपयोग कर रहा हूं (लगभग 14 पैरामीटर> 7000 सामान्य टिप्पणियों के साथ)। मेरे पास एक लक्षित क्लासिफायर है, जिसका मूल्य 1 या 0 है। मेरे पास समस्या यह है कि इस्तेमाल किए गए सॉल्वर …

1
कर्नेल पीसीए के लिए कर्नेल कैसे चुनें?
कर्नेल पीसीए (प्रमुख घटक विश्लेषण) द्वारा अंतिम डेटा आउटपुट में अच्छे डेटा पृथक्करण के परिणामस्वरूप कर्नेल चुनने के तरीके क्या हैं, और कर्नेल के मापदंडों को अनुकूलित करने के तरीके क्या हैं? यदि संभव हो तो आम आदमी के शब्दों को बहुत सराहा जाएगा, और ऐसे तरीकों की व्याख्या करने …

1
क्या जैकिनिफिंग के कोई समकालीन उपयोग हैं?
प्रश्न: बूटस्ट्रैपिंग जैकनाइफिंग से बेहतर है; हालाँकि, मैं सोच रहा हूँ कि क्या ऐसे उदाहरण हैं जहाँ jackknifing पैरामीटर अनुमानों के लिए अनिश्चितता को चिह्नित करने के लिए एकमात्र या कम से कम व्यवहार्य विकल्प है। इसके अलावा, व्यावहारिक स्थितियों में बूटस्ट्रेपिंग के सापेक्ष पक्षपाती / गलत तरीके से जैकनाइफिंग …

4
क्या आप क्रॉस-वेलिडेशन द्वारा कोई जमीनी सच्चाई वाले डेटासेट पर विभिन्न क्लस्टरिंग विधियों की तुलना कर सकते हैं?
वर्तमान में, मैं एक टेक्स्ट डॉक्यूमेंट डेटासेट का विश्लेषण करने की कोशिश कर रहा हूँ जिसमें कोई जमीनी सच्चाई नहीं है। मुझे बताया गया था कि आप अलग-अलग क्लस्टरिंग विधियों की तुलना करने के लिए k-fold क्रॉस सत्यापन का उपयोग कर सकते हैं। हालाँकि, मैंने पिछले दिनों जो उदाहरण देखे …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.