python पर टैग किए गए जवाब

प्रोग्रामिंग लैंग्वेज पायथन से संबंधित डेटा विज्ञान प्रश्नों के लिए उपयोग करें। सामान्य कोडिंग प्रश्नों के लिए अभिप्रेत नहीं है (-> स्टैकओवरफ़्लो)।

17
तंत्रिका नेटवर्क के लिए सबसे अच्छा अजगर पुस्तकालय
मैं विभिन्न मशीन सीखने की समस्याओं को हल करने के लिए तंत्रिका नेटवर्क का उपयोग कर रहा हूं। मैं पायथन और पाइब्रेन का उपयोग कर रहा हूं लेकिन यह लाइब्रेरी लगभग बंद है। क्या पायथन में अन्य अच्छे विकल्प हैं?

8
Scikit_learn मॉडल में फिट और fit_transform के बीच अंतर?
मैं डेटा साइंस के लिए नौसिखिया हूं और मुझे स्किकिट-लर्न में अंतर fitऔर fit_transformतरीकों के बारे में समझ नहीं है । क्या कोई केवल यह बता सकता है कि हमें डेटा बदलने की आवश्यकता क्यों हो सकती है? प्रशिक्षण डेटा पर फिटिंग मॉडल और परीक्षण डेटा को बदलने का क्या …

15
मशीन सीखने के लिए पायथन बनाम आर
मैं सिर्फ शैक्षणिक उद्देश्यों के लिए मशीन लर्निंग एप्लीकेशन विकसित करना शुरू कर रहा हूं । मैं वर्तमान में आर का उपयोग कर रहा हूं और इसमें खुद को प्रशिक्षित कर रहा हूं । हालांकि, बहुत सी जगहों पर, मैंने लोगों को पायथन का उपयोग करते हुए देखा है । …

11
एसवीएम का उपयोग स्किट सीखता है और अंतहीन चलाता है और निष्पादन को कभी पूरा नहीं करता है
मैं 595605 पंक्तियों और 5 कॉलम (फीचर्स) और टेस्ट डेटासेट वाले 397070 पंक्तियों वाले परीक्षण डेटासेट पर scikit learn (अजगर) का उपयोग करके SVR चलाने की कोशिश कर रहा हूं। डेटा को पूर्व-संसाधित और नियमित किया गया है। मैं परीक्षण के उदाहरणों को सफलतापूर्वक चलाने में सक्षम हूं, लेकिन अपने …

1
पांडा में isna () और isnull () के बीच अंतर
मैं काफी समय से पांडा का इस्तेमाल कर रहा हूं। लेकिन, मैं समझ गया कि क्या बीच का अंतर है isna()और isnull()पांडा में। और, अधिक महत्वपूर्ण बात, जो डेटाफ्रेम में लापता मूल्यों की पहचान करने के लिए उपयोग करना है। किसी मूल्य का naया तो पता कैसे लगाया जाता है, …

6
निर्णय पेड़ / यादृच्छिक वन में सुविधाओं के रूप में तार
मैं निर्णय पेड़ / यादृच्छिक वन के एक आवेदन पर कुछ समस्याएं कर रहा हूं। मैं एक समस्या को फिट करने की कोशिश कर रहा हूं जिसमें नंबर और साथ ही तार (जैसे कि देश का नाम) भी हैं। अब लाइब्रेरी, स्किकिट-लर्न केवल नंबरों को पैरामीटर के रूप में लेता …

8
पायथन में खुला स्रोत विसंगति का पता लगाना
समस्या पृष्ठभूमि: मैं एक प्रोजेक्ट पर काम कर रहा हूं, जिसमें आईटी मॉनिटरिंग स्पेस (आईटी स्पेस की मेरी सबसे अच्छी समझ) में पाई जाने वाली लॉग फाइल शामिल हैं। ये लॉग फाइलें टाइम-सीरीज़ डेटा हैं, जिन्हें विभिन्न मापदंडों की सैकड़ों / हजारों पंक्तियों में व्यवस्थित किया गया है। प्रत्येक पैरामीटर …

2
केरस में विभिन्न लंबाई के उदाहरणों के साथ एक आरएनएन का प्रशिक्षण
मैं RNN के बारे में सीखना शुरू करने की कोशिश कर रहा हूं और मैं केर का उपयोग कर रहा हूं। मैं वेनिला RNN और LSTM परतों के मूल आधार को समझता हूं, लेकिन मुझे प्रशिक्षण के लिए एक निश्चित तकनीकी बिंदु को समझने में परेशानी हो रही है। में …
61 python  keras  rnn  training 

8
क्लस्टरिंग भू स्थान निर्देशांक (लट, लंबे जोड़े)
जियोलोकेशन क्लस्टरिंग के लिए सही दृष्टिकोण और क्लस्टरिंग एल्गोरिदम क्या है? मैं क्लस्टर जियोलोकेशन निर्देशांक के लिए निम्न कोड का उपयोग कर रहा हूं: import numpy as np import matplotlib.pyplot as plt from scipy.cluster.vq import kmeans2, whiten coordinates= np.array([ [lat, long], [lat, long], ... [lat, long] ]) x, y = …

9
पायथन का उपयोग कर प्रतिलिपि प्रस्तुत करने योग्य डेटा विज्ञान के लिए उपकरण और प्रोटोकॉल
मैं पायथन का उपयोग कर एक डेटा विज्ञान परियोजना पर काम कर रहा हूं। परियोजना के कई चरण हैं। प्रत्येक चरण में पायथन लिपियों, सहायक डेटा, कॉन्फ़िगरेशन और मापदंडों का उपयोग करके और एक अन्य डेटा सेट बनाने के लिए डेटा सेट लेना शामिल है। मैं कोड को git में …

4
तंत्रिका नेटवर्क: किस लागत का उपयोग करना है?
मैं मुख्य रूप से तंत्रिका नेटवर्क के साथ प्रयोगों के लिए TensorFlow का उपयोग कर रहा हूं । हालाँकि मैंने अभी कुछ प्रयोग किए हैं (XOR- प्रॉब्लम, MNIST, कुछ रिग्रेशन स्टफ, ...) अब, मैं विशिष्ट समस्याओं के लिए "सही" लागत फ़ंक्शन चुनने के साथ संघर्ष करता हूं क्योंकि कुल मिलाकर …

7
ValueError: इनपुट में NaN, अनंत या dtype के लिए बहुत बड़ा मान है ('float32')
रैंडमफॉरस्ट मॉडल का उपयोग करते हुए परीक्षण डेटा की भविष्यवाणी करते समय मुझे वैल्यूआवर मिला। मेरा कोड: clf = RandomForestClassifier(n_estimators=10, max_depth=6, n_jobs=1, verbose=2) clf.fit(X_fit, y_fit) df_test.fillna(df_test.mean()) X_test = df_test.values y_pred = clf.predict(X_test) त्रुटि: ValueError: Input contains NaN, infinity or a value too large for dtype('float32'). मुझे परीक्षण डेटासेट में खराब …

3
पंडों के साथ सहसंबंध मैट्रिक्स की गणना और दृश्य
मेरे पास कई प्रविष्टियों के साथ एक पांडा डेटा फ्रेम है, और मैं कुछ प्रकार की दुकानों की आय के बीच सहसंबंध की गणना करना चाहता हूं। आय डेटा के साथ कई स्टोर हैं, गतिविधि के क्षेत्र का वर्गीकरण (थिएटर, कपड़ा स्टोर, भोजन ...) और अन्य डेटा। मैंने एक नया …

5
पांडा के साथ विश्लेषण के लिए एक 20GB फ़ाइल खोलना
मैं वर्तमान में मशीन सीखने के उद्देश्यों के लिए पांडा और अजगर के साथ एक फ़ाइल खोलने की कोशिश कर रहा हूं, यह मेरे लिए एक डेटाफ़्रेम में उन सभी के लिए आदर्श होगा। अब फ़ाइल 18 जीबी बड़ी है और मेरी रैम 32 जीबी है लेकिन मुझे मेमोरी एरर …

3
केर में मल्टी जी.पी.यू.
आप कई जीपीयू पर प्रशिक्षण के विभाजन के लिए केरस लाइब्रेरी (या टेंसरफ़्लो) में कैसे प्रोग्राम कर सकते हैं? मान लीजिए कि आप Amazon ec2 उदाहरण में हैं, जिसमें 8 GPU हैं और आप उन सभी का उपयोग तेजी से प्रशिक्षित करने के लिए करना चाहेंगे, लेकिन आपका कोड केवल …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.