सांख्यिकी और बिग डेटा cross-validation

2

मॉडल चयन पर Scikit जानें के पृष्ठ में नेस्टेड क्रॉस-मान्यता के उपयोग का उल्लेख है: >>> clf = GridSearchCV(estimator=svc, param_grid=dict(gamma=gammas), ... n_jobs=-1) >>> cross_validation.cross_val_score(clf, X_digits, y_digits) दो क्रॉस-वेलिडेशन लूप्स समानांतर में किए जाते हैं: एक ग्रिडड्रेससीवी अनुमानक द्वारा गामा सेट करने के लिए और दूसरा एक क्रॉस_वेल_स्कोर द्वारा अनुमानक के …

14 machine-learning cross-validation scikit-learn

2

सादे अंग्रेजी में R का उपयोग करके एक कॉक्स आनुपातिक खतरों प्रतिगमन मॉडल की व्याख्या और सत्यापन

क्या कोई मुझे सादे अंग्रेजी में मेरे कॉक्स मॉडल की व्याख्या कर सकता है? मैंने फ़ंक्शन का उपयोग करके अपने डेटा के सभी के लिए निम्न कॉक्स प्रतिगमन मॉडल फिट किया है cph। मेरा डेटा नामक ऑब्जेक्ट में सहेजा गया है Data। चर w, xऔर yनिरंतर हैं; zदो स्तरों का …

14 r cross-validation survival cox-model

1

ट्रेन बनाम टेस्ट त्रुटि गैप और इसके संबंध को ओवरफिट करने के लिए: परस्पर विरोधी सलाह को पुनः प्राप्त करना

ट्रेन बनाम टेस्ट त्रुटि की तुलना करने के तरीके के बारे में वहाँ परस्पर विरोधी सलाह दी जा रही है, विशेषकर तब जब दोनों के बीच अंतर हो। मुझे लगता है कि संघर्ष के लिए विचार के दो स्कूल प्रतीत होते हैं। मैं समझने की कोशिश कर रहा हूं कि …

14 cross-validation overfitting

2

प्रशिक्षण / सत्यापन / परीक्षण सेट के संदर्भ में के-गुना क्रॉस सत्यापन कैसे फिट होता है?

मेरा मुख्य प्रश्न यह समझने की कोशिश करना है कि प्रशिक्षण / सत्यापन / परीक्षण सेट (यदि यह इस तरह के संदर्भ में बिल्कुल फिट बैठता है) के संदर्भ में k- गुना क्रॉस-वैलिडेशन कैसे फिट बैठता है। आमतौर पर, लोग डेटा को एक प्रशिक्षण, सत्यापन और परीक्षण सेट में विभाजित …

14 cross-validation dataset overfitting

2

क्रॉस सत्यापन और पैरामीटर अनुकूलन

जब मैं 10-गुना क्रॉस सत्यापन का उपयोग करता हूं तो मेरे पास पैरामीटर अनुकूलन के बारे में एक प्रश्न है। मैं पूछना चाहता हूं कि क्या मापदंडों को हर गुना मॉडल प्रशिक्षण के दौरान ठीक करना चाहिए या नहीं, अर्थात (1) प्रत्येक गुना औसत सटीकता के लिए अनुकूलित मापदंडों में …

14 cross-validation optimization parameterization

5

लॉजिस्टिक रिग्रेशन पर दार्शनिक सवाल: क्यों इष्टतम सीमा मूल्य प्रशिक्षित नहीं है?

आमतौर पर लॉजिस्टिक रिग्रेशन में, हम एक मॉडल फिट करते हैं और प्रशिक्षण सेट पर कुछ पूर्वानुमान प्राप्त करते हैं। फिर हम उन प्रशिक्षण भविष्यवाणियों ( यहाँ कुछ पसंद ) पर क्रॉस-वैरिफाई करते हैं और आरओसी वक्र की तरह कुछ के आधार पर इष्टतम सीमा मूल्य तय करते हैं। हम …

13 logistic cross-validation optimization roc threshold

1

यादृच्छिक वन का मूल्यांकन करें: OOB बनाम CV

जब हम एक यादृच्छिक वन की गुणवत्ता का आकलन करते हैं, उदाहरण के लिए एयूसी का उपयोग करते हुए, क्या इन मात्राओं को आउट ऑफ बैग नमूने पर या क्रॉस सत्यापन के होल्ड आउट पर गणना करना अधिक उपयुक्त है? मैंने सुना है कि OOB नमूनों पर इसकी गणना करने …

13 cross-validation random-forest auc

4

क्रॉस सत्यापन डेटा स्नूपिंग से अलग कैसे है?

मैंने "सांख्यिकीय शिक्षा का एक परिचय" समाप्त किया । मैंने सोचा कि क्या विभिन्न मशीन लर्निंग तकनीकों के लिए सर्वोत्तम ट्यूनिंग मापदंडों को खोजने के लिए क्रॉस-मान्यता का उपयोग करना डेटा स्नूपिंग से अलग है? हम बार-बार जाँच रहे हैं कि ट्यूनिंग पैरामीटर के कौन से मूल्य परीक्षण सेट में …

13 machine-learning cross-validation

1

K- गुना क्रॉस-मान्यता के साथ, क्या आप अंतिम मॉडल बनाने के लिए सभी मॉडल का औसत रखते हैं ?

K- गुना क्रॉस सत्यापन करते समय, मैं समझता हूं कि आप उस एक को छोड़कर सभी गुनाओं को इंगित करके सटीकता मीट्रिक प्राप्त करते हैं और पूर्वानुमान बनाते हैं, और फिर इस प्रक्रिया को बार दोहराते हैं । इसके बाद आप अपने सभी उदाहरणों पर सटीकता मेट्रिक्स चला सकते हैं …

13 cross-validation

2

सत्यापन और मॉडल चयन के लिए बूटस्ट्रैपिंग को समझना

मुझे लगता है कि मैं समझता हूं कि बूटस्ट्रैपिंग के मूल सिद्धांत कैसे काम करते हैं, लेकिन मुझे यकीन नहीं है कि मैं समझता हूं कि मैं मॉडल चयन के लिए बूटस्ट्रैपिंग का उपयोग कैसे कर सकता हूं या ओवरफिटिंग से बचने के लिए। उदाहरण के लिए, उदाहरण के लिए, …

13 model-selection cross-validation bootstrap

2

Keras: क्यों घट जाती है जबकि val_loss बढ़ जाती है?

मैंने पैरामस के एक समूह के लिए ग्रिड खोज की स्थापना की। मैं एक केरस तंत्रिका जाल के लिए सबसे अच्छा पैरामीटर खोजने की कोशिश कर रहा हूं जो बाइनरी वर्गीकरण करता है। आउटपुट या तो 1 या 0. एक लगभग 200 विशेषताएं हैं। जब मैंने एक ग्रिड खोज की, …

13 machine-learning cross-validation deep-learning tensorflow theano

1

LogisticRegressionCV में गैर-अभिसरण कैसे ठीक करें

मैं डेटा के एक सेट पर क्रॉसवालाइडेशन के साथ लॉजिस्टिक रिग्रेशन करने के लिए स्किकिट-लर्न का उपयोग कर रहा हूं (लगभग 14 पैरामीटर> 7000 सामान्य टिप्पणियों के साथ)। मेरे पास एक लक्षित क्लासिफायर है, जिसका मूल्य 1 या 0 है। मेरे पास समस्या यह है कि इस्तेमाल किए गए सॉल्वर …

13 logistic cross-validation scikit-learn

1

कर्नेल पीसीए के लिए कर्नेल कैसे चुनें?

कर्नेल पीसीए (प्रमुख घटक विश्लेषण) द्वारा अंतिम डेटा आउटपुट में अच्छे डेटा पृथक्करण के परिणामस्वरूप कर्नेल चुनने के तरीके क्या हैं, और कर्नेल के मापदंडों को अनुकूलित करने के तरीके क्या हैं? यदि संभव हो तो आम आदमी के शब्दों को बहुत सराहा जाएगा, और ऐसे तरीकों की व्याख्या करने …

13 pca cross-validation dimensionality-reduction kernel-trick manifold-learning

1

क्या जैकिनिफिंग के कोई समकालीन उपयोग हैं?

प्रश्न: बूटस्ट्रैपिंग जैकनाइफिंग से बेहतर है; हालाँकि, मैं सोच रहा हूँ कि क्या ऐसे उदाहरण हैं जहाँ jackknifing पैरामीटर अनुमानों के लिए अनिश्चितता को चिह्नित करने के लिए एकमात्र या कम से कम व्यवहार्य विकल्प है। इसके अलावा, व्यावहारिक स्थितियों में बूटस्ट्रेपिंग के सापेक्ष पक्षपाती / गलत तरीके से जैकनाइफिंग …

12 machine-learning cross-validation bootstrap maximum-entropy jackknife

4

क्या आप क्रॉस-वेलिडेशन द्वारा कोई जमीनी सच्चाई वाले डेटासेट पर विभिन्न क्लस्टरिंग विधियों की तुलना कर सकते हैं?

वर्तमान में, मैं एक टेक्स्ट डॉक्यूमेंट डेटासेट का विश्लेषण करने की कोशिश कर रहा हूँ जिसमें कोई जमीनी सच्चाई नहीं है। मुझे बताया गया था कि आप अलग-अलग क्लस्टरिंग विधियों की तुलना करने के लिए k-fold क्रॉस सत्यापन का उपयोग कर सकते हैं। हालाँकि, मैंने पिछले दिनों जो उदाहरण देखे …

12 machine-learning clustering cross-validation unsupervised-learning

cross-validation पर टैग किए गए जवाब