scikit-learn पर टैग किए गए जवाब

scikit-learn पायथन के लिए एक मशीन-लर्निंग लाइब्रेरी है जो मशीन सीखने पर ध्यान देने के साथ डेटा विश्लेषण और डेटा खनन के लिए सरल और कुशल उपकरण प्रदान करता है। यह सभी के लिए सुलभ है और विभिन्न संदर्भों में पुन: प्रयोज्य है। इसे NumPy और SciPy पर बनाया गया है। परियोजना खुला स्रोत और व्यावसायिक रूप से उपयोग करने योग्य (बीएसडी लाइसेंस) है।

20
स्किकिट-लर्न में कई कॉलम में एन्कोडिंग लेबल करें
मैं स्ट्रिंग लेबल के LabelEncoderपांडा को एनकोड करने के लिए scikit-learn का उपयोग करने की कोशिश कर रहा हूं DataFrame। चूंकि डेटाफ्रेम में कई (50+) कॉलम होते हैं, इसलिए मैं LabelEncoderप्रत्येक कॉलम के लिए ऑब्जेक्ट बनाने से बचना चाहता हूं ; बल्कि मेरे पास एक बड़ी LabelEncoderवस्तु है जो मेरे …

12
NumPy में किसी सरणी को सामान्य कैसे करें?
मैं एक NumPy सरणी का मानदंड बनाना चाहूंगा। विशेष रूप से, मैं इस फ़ंक्शन के बराबर संस्करण की तलाश कर रहा हूं def normalize(v): norm = np.linalg.norm(v) if norm == 0: return v return v / norm क्या ऐसा कुछ है skearnया numpy? यह फ़ंक्शन ऐसी स्थिति में काम करता …

6
स्किट-डिस्क में डिस्क पर क्लासिफायर सहेजें
मैं डिस्क को प्रशिक्षित नाइव बेयस क्लासिफायर को कैसे बचा सकता हूं और इसका उपयोग डेटा की भविष्यवाणी करने के लिए कर सकता हूं ? मेरे पास scikit-learn वेबसाइट से निम्नलिखित नमूना कार्यक्रम है: from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb = GaussianNB() y_pred = …

15
ImportError: sklearn.cross_validation नाम का कोई मॉड्यूल नहीं
मैं Ubuntu 14.04 में अजगर 2.7 का उपयोग कर रहा हूं। मैंने इन आदेशों के साथ scikit-learn, numpy और matplotlib स्थापित किया है: sudo apt-get install build-essential python-dev python-numpy \ python-numpy-dev python-scipy libatlas-dev g++ python-matplotlib \ ipython लेकिन जब मैं इन पैकेजों को आयात करता हूं: from sklearn.cross_validation import train_test_split …


10
क्या अजगर में रूट माध्य वर्ग त्रुटि (RMSE) के लिए एक पुस्तकालय कार्य है?
मुझे पता है कि मैं इस तरह एक रूट माध्य चुकता त्रुटि फ़ंक्शन को लागू कर सकता हूं: def rmse(predictions, targets): return np.sqrt(((predictions - targets) ** 2).mean()) मैं देख रहा हूँ कि क्या यह rmse फ़ंक्शन कहीं लाइब्रेरी में कार्यान्वित किया गया है, शायद scipy या scikit-learn में?

21
शिकवा-निर्णय निर्णय-वृक्ष से निर्णय नियम कैसे निकाले?
क्या मैं एक निर्णय वृक्ष में एक प्रशिक्षित पेड़ से एक पाठ सूची के रूप में अंतर्निहित निर्णय-नियम (या 'निर्णय पथ') निकाल सकता हूं? कुछ इस तरह: if A>0.4 then if B<0.2 then if C>0.8 then class='X' आपकी सहायता के लिए धन्यवाद।


10
RuntimeWarning: numpy.dtype आकार बदल गया, बाइनरी असंगतता का संकेत दे सकता है
मेरे पास सहेजे गए एसवीएम मॉडल को लोड करने की कोशिश के लिए यह त्रुटि है। मैंने sklearn, NumPy और SciPy को अनइंस्टॉल करने की कोशिश की है, नवीनतम संस्करणों को फिर से एक साथ पुन: स्थापित कर रहा है (पाइप का उपयोग करके)। मुझे अभी भी यह त्रुटि मिल …

6
Scikit में रैंडम राज्य (छद्म यादृच्छिक संख्या) सीखते हैं
मैं एक मशीन लर्निंग एल्गोरिदम को स्किकिट लर्न में लागू करना चाहता हूं, लेकिन मुझे समझ नहीं आ रहा है कि यह पैरामीटर क्या random_stateकरता है? मुझे क्यों इसका उपयोग करना चाहिए? मुझे यह भी समझ नहीं आया कि एक छद्म यादृच्छिक संख्या क्या है।

5
डेटा को 3 सेटों में कैसे विभाजित करें (ट्रेन, सत्यापन और परीक्षण)?
मेरे पास एक पांडा डेटाफ़्रेम है और मैं इसे 3 अलग-अलग सेटों में विभाजित करना चाहता हूं। मुझे पता है कि का उपयोग कर train_test_split से sklearn.cross_validation, एक दो सेट (ट्रेन और परीक्षण) में डेटा विभाजित कर सकते हैं। हालाँकि, मुझे डेटा को तीन सेटों में विभाजित करने के बारे …

6
पांडा डेटाफ्रेम कॉलम स्केलेन के साथ स्केलिंग करते हैं
मेरे पास मिश्रित प्रकार के स्तंभों के साथ एक पांडा डेटाफ़्रेम है, और मैं कुछ स्तंभों में स्केलेर के min_max_scaler को लागू करना चाहूंगा। आदर्श रूप में, मैं इन परिवर्तनों को जगह में करना चाहूंगा, लेकिन अभी तक ऐसा करने का कोई तरीका नहीं निकला है। मैंने निम्नलिखित कोड लिखा …

3
एक गर्म एन्कोडिंग मशीन सीखने के प्रदर्शन में सुधार क्यों करता है?
मैंने देखा है कि जब किसी विशेष डेटा सेट (मैट्रिक्स) पर वन हॉट एन्कोडिंग का उपयोग किया जाता है और एल्गोरिदम सीखने के लिए प्रशिक्षण डेटा के रूप में उपयोग किया जाता है, तो यह मूल मैट्रिक्स का उपयोग प्रशिक्षण डेटा के रूप में करने की तुलना में, भविष्यवाणी सटीकता …

13
sklearn error ValueError: इनपुट में NaN, अनंत या dtype के लिए बहुत बड़ा मान है ('float64')
मैं स्केलेर का उपयोग कर रहा हूं और आत्मीयता के प्रसार के साथ समस्या है। मैंने एक इनपुट मैट्रिक्स बनाया है और मुझे निम्न त्रुटि मिलती रहती है। ValueError: Input contains NaN, infinity or a value too large for dtype('float64'). मै भाग चुका np.isnan(mat.any()) #and gets False np.isfinite(mat.all()) #and gets …

6
RandomForestClassifier में फ़ीचर_इमपोर्ट कैसे निर्धारित किए जाते हैं?
मेरे पास डेटा इनपुट के रूप में समय-श्रृंखला के साथ एक वर्गीकरण कार्य है, जहां प्रत्येक विशेषता (n = 23) समय में एक विशिष्ट बिंदु का प्रतिनिधित्व करती है। पूर्ण वर्गीकरण परिणाम के अलावा, मैं यह पता लगाना चाहूंगा कि कौन सी विशेषताएँ / तिथियां परिणाम में किस सीमा तक …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.