scikit-learn पर टैग किए गए जवाब

Scikit-learn एक पायथन मॉड्यूल है जिसमें मशीन सीखने, डेटा खनन और डेटा विश्लेषण के लिए सरल और कुशल उपकरण शामिल हैं। यह NumPy, SciPy, और matplotlib पर बनाया गया है। यह 3-क्लॉज बीएसडी लाइसेंस के तहत वितरित किया जाता है।

8
Scikit_learn मॉडल में फिट और fit_transform के बीच अंतर?
मैं डेटा साइंस के लिए नौसिखिया हूं और मुझे स्किकिट-लर्न में अंतर fitऔर fit_transformतरीकों के बारे में समझ नहीं है । क्या कोई केवल यह बता सकता है कि हमें डेटा बदलने की आवश्यकता क्यों हो सकती है? प्रशिक्षण डेटा पर फिटिंग मॉडल और परीक्षण डेटा को बदलने का क्या …

3
कब एक हॉट एन्कोडिंग बनाम लेबलइंकोडर बनाम डिक्टेक्टरिज़ोर का उपयोग करें?
मैं कुछ समय के लिए श्रेणीबद्ध डेटा वाले मॉडल का निर्माण कर रहा हूं और जब इस स्थिति में मैं मूल रूप से एक मॉडल बनाने से पहले इस डेटा को बदलने के लिए scikit-learn's LabelEncoder फ़ंक्शन का उपयोग करने के लिए डिफ़ॉल्ट हूं। मैं उनके बीच अंतर को समझता …

11
एसवीएम का उपयोग स्किट सीखता है और अंतहीन चलाता है और निष्पादन को कभी पूरा नहीं करता है
मैं 595605 पंक्तियों और 5 कॉलम (फीचर्स) और टेस्ट डेटासेट वाले 397070 पंक्तियों वाले परीक्षण डेटासेट पर scikit learn (अजगर) का उपयोग करके SVR चलाने की कोशिश कर रहा हूं। डेटा को पूर्व-संसाधित और नियमित किया गया है। मैं परीक्षण के उदाहरणों को सफलतापूर्वक चलाने में सक्षम हूं, लेकिन अपने …

6
निर्णय पेड़ / यादृच्छिक वन में सुविधाओं के रूप में तार
मैं निर्णय पेड़ / यादृच्छिक वन के एक आवेदन पर कुछ समस्याएं कर रहा हूं। मैं एक समस्या को फिट करने की कोशिश कर रहा हूं जिसमें नंबर और साथ ही तार (जैसे कि देश का नाम) भी हैं। अब लाइब्रेरी, स्किकिट-लर्न केवल नंबरों को पैरामीटर के रूप में लेता …

9
Sklearn में ट्रेन / टेस्ट / मान्यता सेट विभाजन
मैं एक डेटा मैट्रिक्स और संबंधित लेबल वेक्टर को X_train, X_test, X_val, y_train, y_test, y_val में स्केलेर के साथ कैसे विभाजित कर सकता हूं? जहां तक ​​मुझे पता है, sklearn.cross_validation.train_test_splitकेवल दो में विभाजित करने में सक्षम है, तीन में नहीं ...

5
क्या स्किट-लर्न में फॉरवर्ड सिलेक्शन / स्टेप वाइज रिग्रेशन अल्गोरिथम है?
मैं बहुत अधिक सुविधाओं के साथ समस्या पर काम कर रहा हूं और मेरे मॉडल को प्रशिक्षित करने में बहुत लंबा समय लगता है। मैंने सुविधाओं को चुनने के लिए आगे के चयन एल्गोरिथ्म को लागू किया। हालाँकि, मैं सोच रहा था कि भविष्य में चयन / स्टेप वाइज रिग्रेशन …

1
स्केगन ग्रैडिएंटबॉस्टिंग क्लैसिफायर की तुलना में एक्सगबोस्ट इतना तेज क्यों है?
मैं 100 न्यूमेरिक फीचर्स के साथ 50k उदाहरणों पर एक ढाल बढ़ाने वाले मॉडल को प्रशिक्षित करने की कोशिश कर रहा हूं। XGBClassifierमेरी मशीन पर 43 सेकंड के भीतर 500 पेड़ लगाता है, जबकि GradientBoostingClassifier1 मिनट और 2 सेकंड में केवल 10 पेड़ (!) को संभालता है :( मैंने 500 …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

3
MultiOutputClassifier से predict_proba को समझना
मैं एक रैंडम फ़ॉरेस्ट मॉडल के साथ एक मल्टीपाउट वर्गीकरण करने के लिए scikit-learn वेबसाइट पर इस उदाहरण का अनुसरण कर रहा हूं । from sklearn.datasets import make_classification from sklearn.multioutput import MultiOutputClassifier from sklearn.ensemble import RandomForestClassifier from sklearn.utils import shuffle import numpy as np X, y1 = make_classification(n_samples=5, n_features=5, n_informative=2, …

3
रैखिक प्रतिगमन में भार को गैर-नकारात्मक होने के लिए कैसे मजबूर किया जाए
मैं एक मानक रेखीय प्रतिगमन का उपयोग कर रहा हूं जो कि अजगर में सीखें। हालाँकि, मैं वेट्स को हर फीचर के लिए पॉजिटिव होने के लिए मजबूर करना चाहूंगा (निगेटिव नहीं), क्या ऐसा कोई तरीका है जिससे मैं इसे पूरा कर सकूं? मैं प्रलेखन में देख रहा था, लेकिन …

4
Scikit-learn: SGDClassifier को भविष्यवाणी करने के साथ-साथ लॉजिस्टिक रिग्रेशन प्राप्त करना
लॉजिस्टिक रिग्रेशन को प्रशिक्षित करने का एक तरीका स्टोचस्टिक ग्रेडिएंट डीसेंट का उपयोग करके है, जो स्किटिट-लर्न को एक इंटरफ़ेस प्रदान करता है। मैं जो करना चाहूंगा, वह स्किट-लर्न का SGDClassifier लेगा और यहां लॉजिस्टिक रिग्रेशन के समान है । हालाँकि, मुझे कुछ मशीन सीखने की वृद्धि याद आ रही …

5
पायथन में केएल डाइवर्जेंस की गणना
मैं इसके लिए नया हूँ और यह नहीं कह सकता कि मुझे इसके पीछे सैद्धांतिक अवधारणाओं की पूरी समझ है। मैं पायथन में कई सूचियों के बीच केएल डाइवर्जेंस की गणना करने की कोशिश कर रहा हूं। मैं यह प्रयास करने और करने के लिए http://scikit-learn.org/stable/modules/generated/sklearn.metrics.mutual_info_score.html का उपयोग कर रहा …

2
train_test_split () त्रुटि: नमूने के असंगत संख्याओं के साथ इनपुट चर मिले
पायथन के लिए काफी नया लेकिन कुछ वर्गीकरण डेटा के आधार पर मेरा पहला आरएफ मॉडल तैयार करना। मैंने सभी लेबल को int64 संख्यात्मक डेटा में परिवर्तित कर दिया है और एक्स और वाई में एक संख्यात्मक सरणी के रूप में लोड किया है, लेकिन जब मैं मॉडल को प्रशिक्षित …

3
डेटा को विभाजित करने से पहले और बाद में StandardScaler
जब मैं उपयोग करने के बारे में पढ़ रहा था StandardScaler, तो अधिकांश सिफारिशें कह रही थीं कि आपको डेटा को ट्रेन / परीक्षण में विभाजित करने StandardScaler से पहले उपयोग करना चाहिए , लेकिन जब मैं ऑनलाइन (स्केलेरन का उपयोग करके) पोस्ट किए गए कुछ कोड की जांच कर …

2
Sklearn के साथ LogisticRegression में पी-मान और आत्मविश्वास अंतराल कैसे प्राप्त करें?
मैं sklearn (LogisticRegression) के साथ एक बहुराष्ट्रीय लॉजिस्टिक रिग्रेशन का निर्माण कर रहा हूं। लेकिन इसके खत्म होने के बाद, मैं अपने मॉडल का एक पी-मूल्य और आत्मविश्वास अंतराल कैसे प्राप्त कर सकता हूं? यह केवल ऐसा प्रतीत होता है कि स्केलेर केवल गुणांक और अवरोधन प्रदान करता है। आपका …

2
क्या आप एसवीसी और रैखिक-एसवीसी के बीच अंतर की व्याख्या कर सकते हैं?
मैंने हाल ही में साथ काम करना सीखना शुरू कर दिया है sklearnऔर अभी-अभी इस अजीब परिणाम के साथ आया हूं। मैंने विभिन्न मॉडलों और अनुमान विधियों की कोशिश करने के लिए digitsउपलब्ध डेटासेट का उपयोग किया sklearn। जब मैंने डेटा पर सपोर्ट वेक्टर मशीन मॉडल का परीक्षण किया, तो …
19 svm  scikit-learn 

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.