scikit-learn पर टैग किए गए जवाब

पाइथन के लिए एक मशीन-लर्निंग लाइब्रेरी। किसी भी विषय पर प्रश्न के लिए इस टैग का उपयोग करें कि (ए) में स्कोर-सीखना शामिल है या तो सवाल का एक महत्वपूर्ण हिस्सा है या अपेक्षित उत्तर है, और (बी) केवल स्कोर-सीखने का उपयोग करने के बारे में नहीं है।

3
XGBoost बनाम पायथन Sklearn ढाल के पेड़ को बढ़ावा दिया
मैं समझने की कोशिश कर रहा हूं कि XGBoost कैसे काम करता है। मैं पहले से ही समझता हूं कि पाइथन स्केलेर पर पेड़ कैसे तेजी से काम करते हैं। मेरे लिए जो स्पष्ट नहीं है वह यह है कि अगर XGBoost उसी तरह काम करता है, लेकिन तेजी से, …

2
मल्टीलेबेल वर्गीकरण मैट्रिक्स ऑन स्किकिट
मैं एक मल्टी-लेबल क्लासिफायर बनाने की कोशिश कर रहा हूं ताकि स्कैकेट का उपयोग करके मौजूदा दस्तावेज़ों को विषय आवंटित किया जा सके मैं अपने दस्तावेजों के माध्यम से उन्हें पारित करने के प्रसंस्करण कर रहा हूँ TfidfVectorizerके माध्यम से लेबल MultiLabelBinarizerऔर एक बनाया OneVsRestClassifierएक साथ SGDClassifierअनुमानक के रूप में। …

2
बेतरतीब जंगल है ओवरफिटिंग?
मैं परिक्षित के साथ यादृच्छिक जंगलों के साथ प्रयोग कर रहा हूं और मुझे अपने प्रशिक्षण सेट के शानदार परिणाम मिल रहे हैं, लेकिन मेरे परीक्षण के परिणाम अपेक्षाकृत खराब हैं ... यहां समस्या (पोकर से प्रेरित) है जिसे मैं हल करने की कोशिश कर रहा हूं: खिलाड़ी ए के …

3
लॉजिस्टिक रिग्रेशन के गुणांकों की मानक त्रुटियों की गणना कैसे करें
मैं एक लॉजिस्टिक रिग्रेशन को प्रशिक्षित करने और परीक्षण करने के लिए पायथन के स्किटिट-लर्न का उपयोग कर रहा हूं। scikit-learn स्वतंत्र चर के प्रतिगमन गुणांक को लौटाता है, लेकिन यह गुणांक के मानक त्रुटियों को प्रदान नहीं करता है। मुझे प्रत्येक गुणांक के लिए एक वाल्ड सांख्यिकीय की गणना …

3
पायथन में कोलीनियर चर को व्यवस्थित रूप से कैसे हटाया जाए? [बन्द है]
बन्द है। यह सवाल ऑफ टॉपिक है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है। इस प्रश्न को सुधारना चाहते हैं? प्रश्न को अपडेट करें ताकि यह क्रॉस मान्य के लिए विषय पर हो । 2 साल पहले बंद हुआ । इस प्रकार, मैंने सहसंबंध तालिकाओं को देखकर …

3
साधारण वर्ग के गुणांक खोजने के लिए "सामान्य समीकरणों" का उपयोग क्यों नहीं किया जाता है?
मैंने इस सूची को यहाँ देखा और विश्वास नहीं कर सकता था कि कम से कम वर्गों को हल करने के बहुत सारे तरीके थे। "सामान्य समीकरण" पर विकिपीडिया एक काफी सीधे आगे रास्ता लग रहा α^β^=y¯−β^x¯,=∑ni=1(xi−x¯)(yi−y¯)∑ni=1(xi−x¯)2α^=y¯−β^x¯,β^=∑i=1n(xi−x¯)(yi−y¯)∑i=1n(xi−x¯)2 {\displaystyle {\begin{aligned}{\hat {\alpha }}&={\bar {y}}-{\hat {\beta }}\,{\bar {x}},\\{\hat {\beta }}&={\frac {\sum _{i=1}^{n}(x_{i}-{\bar {x}})(y_{i}-{\bar …

3
नेस्टेड क्रॉस सत्यापन में हाइपर पैरामीटर कैसे प्राप्त करें?
मैंने नेस्टेड क्रॉस सत्यापन के लिए निम्नलिखित पोस्ट पढ़ी हैं और अभी भी 100% सुनिश्चित नहीं हूं कि मुझे नेस्टेड क्रॉस सत्यापन के साथ मॉडल चयन के साथ क्या करना है: मॉडल चयन के लिए नेस्टेड क्रॉस सत्यापन मॉडल चयन और क्रॉस-सत्यापन: सही तरीका मेरी उलझन को समझाने के लिए, …

3
मल्टीक्लास एलडीए प्रशिक्षण में कोलिनियर चर
मैं 8 वर्गों के डेटा के साथ एक मल्टी-क्लास LDA क्लासिफायरियर का प्रशिक्षण दे रहा हूं । प्रशिक्षण प्रदर्शन करते समय, मुझे एक चेतावनी मिलती है: " चर के संपर्क में हैं " मुझे 90% से अधिक प्रशिक्षण सटीकता प्राप्त हो रही है । मैं उपयोग कर रहा हूँ scikits …

6
सबसे तेज़ एसवीएम कार्यान्वयन
एक सामान्य प्रश्न से अधिक। मैं भविष्य कहनेवाला मॉडलिंग के लिए एक rbf SVM चला रहा हूं। मुझे लगता है कि मेरे वर्तमान कार्यक्रम को निश्चित रूप से थोड़ी गति की आवश्यकता है। मैं ग्रिड खोज + क्रॉस सत्यापन के लिए मोटे के साथ सीखता हूं। प्रत्येक एसवीएम रन में …

2
कैलिब्रेटेडक्लासीफायरसीवी के साथ सहपाठियों को जांचने का सही तरीका
Scikit में CalibratedClassifierCV है , जो हमें एक विशेष X, y जोड़ी पर हमारे मॉडल को कैलिब्रेट करने की अनुमति देता है। यह भी स्पष्ट रूप से बताता है किdata for fitting the classifier and for calibrating it must be disjoint. यदि उन्हें निराश होना चाहिए, तो क्या क्लासिफायर को …

3
स्टैटमॉडल ओएलएस और स्किकिट लीनियर रिग्रेशन के बीच अंतर
मेरे पास अलग-अलग पुस्तकालयों से दो अलग-अलग तरीकों के बारे में सवाल है जो एक ही काम कर रहे हैं। मैं रैखिक प्रतिगमन मॉडल बनाने की कोशिश कर रहा हूं। यहां वह कोड है जो मैं ओएलएस के साथ स्टैटमोडेल लाइब्रेरी का उपयोग कर रहा हूं: X_train, X_test, y_train, y_test …

2
"एफ प्रतिगमन" और मूल्यों पर आधारित सुविधाओं के चयन के बीच अंतर ?
क्या F-regressionव्यक्तिगत रूप से लेबल के साथ सहसंबंधी विशेषताओं का उपयोग करके सुविधाओं की तुलना करना और मान का अवलोकन करना है ?R2R2R^2 मैंने अक्सर देखा है कि मेरे सहकर्मी F regressionअपनी मशीन लर्निंग पाइपलाइन में फ़ीचर चयन के लिए उपयोग करते हैं sklearn: sklearn.feature_selection.SelectKBest(score_func=sklearn.feature_selection.f_regression...)` कुछ कृपया मुझे बताएं - …

7
बेतरतीब जंगल उग आए हैं
मैं scikits- सीखने में रैंडम फ़ॉरेस्ट रिग्रेशन का उपयोग करने की कोशिश कर रहा हूं। समस्या यह है कि मुझे वास्तव में उच्च परीक्षण त्रुटि मिल रही है: train MSE, 4.64, test MSE: 252.25. यह मेरा डेटा कैसा दिखता है: (नीला: वास्तविक डेटा, हरा: अनुमानित): मैं प्रशिक्षण के लिए 90% …

3
लॉजिस्टिक रिग्रेशन: स्किटिट बनाम ग्लमैनेट
मैं आर में पैकेज sklearnका उपयोग करके लॉजिस्टिक रिग्रेशन लाइब्रेरी से परिणामों की नकल करने की कोशिश कर रहा हूं glmnet। से sklearnरसद प्रतिगमन प्रलेखन , यह l2 दंड के अंतर्गत लागत समारोह को कम करने के प्रयास कर रहा है minw,c12wTw+C∑i=1Nlog(exp(−yi(XTiडब्ल्यू + सी ) ) + 1)minw,c12wटीw+सीΣमैं=1एनलॉग⁡(exp⁡(-yमैं(एक्समैंटीw+सी))+1)\min_{w,c} \frac12 w^Tw …

3
मशीन लर्निंग में लापता डेटा की समस्या के आसपास काम करने के तरीके
वस्तुतः किसी भी डेटाबेस को हम मशीन लर्निंग एल्गोरिदम का उपयोग करके भविष्यवाणियां करना चाहते हैं, कुछ विशेषताओं के लिए लापता मान पाएंगे। इस समस्या को संबोधित करने के लिए कई दृष्टिकोण हैं, जो उन विशेषताओं को छोड़ देते हैं जब तक कि वे गायब नहीं होते हैं जब तक …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.