डेटा साइंस scikit-learn

2

मेरे पास ~ 1M पंक्तियों और ~ 500K विरल विशेषताओं वाला एक डेटासेट है। मैं 1K-5K सघन सुविधाओं के क्रम में कहीं न कहीं आयामीता कम करना चाहता हूं। sklearn.decomposition.PCAविरल डेटा पर काम नहीं करता है, और मैं का उपयोग करने की कोशिश की है, sklearn.decomposition.TruncatedSVDलेकिन बहुत जल्दी एक स्मृति …

12 python scikit-learn dimensionality-reduction

1

scikit-CPU उपयोग और मेमोरी पर n_jobs पैरामीटर सीखें

स्किकिट-लर्न पर अधिकांश अनुमानकों में, समानांतर नौकरियों का उपयोग करने के लिए / विधियों n_jobsमें एक पैरामीटर है । मैंने देखा कि सिर्फ 1 पायथन प्रक्रिया बनाने के लिए इसे स्थापित करने और कोर को अधिकतम किया गया, जिससे सीपीयू का उपयोग शीर्ष पर 2500% तक पहुंच गया। यह इसे …

12 python scikit-learn

3

क्या अजगर के लिए कोई अच्छा आउट-ऑफ-द-बॉक्स भाषा मॉडल है?

मैं एक एप्लिकेशन का प्रोटोटाइप बना रहा हूं और मुझे कुछ उत्पन्न वाक्यों के प्रति एकरूपता की गणना करने के लिए एक भाषा मॉडल की आवश्यकता है। क्या अजगर में कोई प्रशिक्षित भाषा मॉडल है जिसका मैं आसानी से उपयोग कर सकता हूं? जैसे कुछ सरल model = LanguageModel('en') p1 …

11 python nlp language-model r statistics linear-regression machine-learning classification random-forest xgboost python sampling data-mining orange predictive-modeling recommender-system statistics dimensionality-reduction pca machine-learning python deep-learning keras reinforcement-learning neural-network image-classification r dplyr deep-learning keras tensorflow lstm dropout machine-learning sampling categorical-data data-imputation machine-learning deep-learning machine-learning-model dropout deep-network pandas data-cleaning data-science-model aggregation python neural-network reinforcement-learning policy-gradients r dataframe dataset statistics prediction forecasting r k-means python scikit-learn labels python orange cloud-computing machine-learning neural-network deep-learning rnn recurrent-neural-net logistic-regression missing-data deep-learning autoencoder apache-hadoop time-series data preprocessing classification predictive-modeling time-series machine-learning python feature-selection autoencoder deep-learning keras tensorflow lstm word-embeddings predictive-modeling prediction machine-learning-model machine-learning classification binary theory machine-learning neural-network time-series lstm rnn neural-network deep-learning keras tensorflow convnet computer-vision

1

ग्राफ़ संरचित डेटा पर Scikit-Learn Label Propagation का उपयोग कैसे करें?

मेरे शोध के भाग के रूप में, मैं एक ग्राफ पर लेबल प्रसार करने में रुचि रखता हूं। मुझे उन दो तरीकों में विशेष रूप से दिलचस्पी है: ज़ियाओजिन ज़ू और ज़ौबिन घर्रामानी। लेबल प्रसार के साथ लेबल और लेबल रहित डेटा से सीखना। तकनीकी रिपोर्ट CMU-CALD-02-107, कार्नेगी मेलन विश्वविद्यालय, …

11 scikit-learn graphs

3

हैशिंग वेक्टाइज़र और एक tfidf वेक्टराइज़र के बीच अंतर क्या है

मैं प्रत्येक दस्तावेज़ के लिए पाठ दस्तावेज़ों के शब्द वैक्टर में परिवर्तित कर रहा हूँ। मैं एक TfidfVectorizer और एक HashingVectorizer का उपयोग करके यह कोशिश की है मैं समझता हूं कि अंकों HashingVectorizerको IDFअंकों की तरह ध्यान में नहीं रखा जाता TfidfVectorizerहै। जिस कारण से मैं अभी भी काम …

11 nlp scikit-learn text-mining tfidf

3

वैज्ञानिक कंप्यूटिंग के लिए सर्वश्रेष्ठ भाषाएँ [बंद]

बंद हो गया । इस प्रश्न पर अधिक ध्यान देने की आवश्यकता है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है। इस प्रश्न को सुधारना चाहते हैं? प्रश्न को अपडेट करें ताकि यह इस पोस्ट को संपादित करके केवल एक समस्या पर केंद्रित हो । 5 साल पहले …

10 efficiency statistics tools knowledge-base machine-learning neural-network deep-learning optimization hyperparameter machine-learning time-series categorical-data logistic-regression python visualization bigdata efficiency classification binary svm random-forest logistic-regression data-mining sql experiments bigdata efficiency performance scalability distributed bigdata nlp statistics education knowledge-base definitions machine-learning recommender-system evaluation efficiency algorithms parameter efficiency scalability sql statistics visualization knowledge-base education machine-learning r python r text-mining sentiment-analysis machine-learning machine-learning python neural-network statistics reference-request machine-learning data-mining python classification data-mining bigdata usecase apache-hadoop map-reduce aws education feature-selection machine-learning machine-learning sports data-formats hierarchical-data-format bigdata apache-hadoop bigdata apache-hadoop python visualization knowledge-base classification confusion-matrix accuracy bigdata apache-hadoop bigdata efficiency apache-hadoop distributed machine-translation nlp metadata data-cleaning text-mining python pandas machine-learning python pandas scikit-learn bigdata machine-learning databases clustering data-mining recommender-system

3

24,000 श्रेणियों के साथ एक वर्ग को कैसे एनकोड करना है?

मैं वर्तमान में जीनोमिक्स के लिए एक लॉजिस्टिक रिग्रेशन मॉडल पर काम कर रहा हूं। इनपुट क्षेत्रों में से एक मैं एक कोवरिएट के रूप में शामिल करना चाहता हूं genes। लगभग 24,000 ज्ञात जीन हैं। कम्प्यूटेशनल जीव विज्ञान में परिवर्तनशीलता के इस स्तर के साथ कई विशेषताएं हैं और …

10 machine-learning keras scikit-learn

3

कॉल का सबसे अच्छा समय भविष्यवाणी करें

मेरे पास कैलिफ़ोर्निया के विभिन्न शहरों में ग्राहकों का एक सेट सहित एक डेटासेट है, प्रत्येक ग्राहक के लिए कॉल करने का समय, और कॉल की स्थिति (यदि ग्राहक कॉल का जवाब देता है और ग्राहक जवाब नहीं देता है तो गलत है)। मुझे भविष्य के ग्राहकों के लिए कॉल …

10 machine-learning classification regression scikit-learn

3

पर्यावरणीय आंकड़ों के आधार पर फसल की पैदावार की भविष्यवाणी करने के लिए मशीन लर्निंग मॉडल का निर्माण

मेरे पास एक डेटासेट है जिसमें 10 साल (2005 - 2014) के लिए एक खेत के तापमान, वर्षा और सोयाबीन की पैदावार के आंकड़े हैं। मैं इस डेटा के आधार पर 2015 के लिए पैदावार की भविष्यवाणी करना चाहता हूं। कृपया ध्यान दें कि डेटासेट में तापमान और वर्षा के …

10 python scikit-learn pandas

2

स्कैच क्लासीफायर को वर्गीकृत करने में कितना समय लगता है?

मैं 1 मिलियन लेबल वाले दस्तावेज़ों से मिलकर पाठ वर्गीकरण के लिए scikit रैखिक समर्थन वेक्टर मशीन (SVM) क्लासिफायरियर का उपयोग करने की योजना बना रहा हूं। मैं क्या करने की योजना बना रहा हूं, जब कोई उपयोगकर्ता किसी कीवर्ड में प्रवेश करता है, तो क्लासिफायर पहले इसे एक श्रेणी …

10 machine-learning classification python scikit-learn

1

बहुस्तरीय डेटासेट पर गलत वर्गीकरण के कारण असंतुलित डेटा

मैं पाठ वर्गीकरण पर काम कर रहा हूं जहां मेरे पास 39 श्रेणियां / कक्षाएं और 8.5 मिलियन रिकॉर्ड हैं। (भविष्य में डेटा और श्रेणियों में वृद्धि होगी)। मेरे डेटा की संरचना या प्रारूप इस प्रकार है। ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | …

9 machine-learning python classification scikit-learn multiclass-classification

4

फीचर इम्पोर्टेंस के संदर्भ में डिसिजन ट्री की व्याख्या करना

मैं यह समझने की कोशिश कर रहा हूं कि स्केलेर के साथ निर्मित एक निर्णय ट्री वर्गीकरण मॉडल की निर्णय प्रक्रिया को पूरी तरह से कैसे समझा जाए। मैं जिस 2 मुख्य पहलू को देख रहा हूं, वे हैं पेड़ का रेखांकन प्रतिनिधित्व और फीचर इंपोर्टेंस की सूची। मुझे समझ …

9 machine-learning visualization scikit-learn data decision-trees

3

Scikit-Learn में रैंडम फॉरेस्ट रेजिस्टर से वज़न (सूत्र) निर्यात करें

मैंने स्किकिट लर्न इन पाइथन (रैंडम फ़ॉरेस्ट रिग्रेसर) के साथ एक भविष्यवाणी मॉडल का प्रशिक्षण लिया और मैं मैनुअल भविष्यवाणी के लिए एक एक्सेल टूल बनाने के लिए प्रत्येक सुविधा के भार को किसी तरह निकालना चाहता हूं। केवल एक चीज जो मुझे मिली है, model.feature_importances_लेकिन यह मदद नहीं करती …

9 python predictive-modeling regression random-forest scikit-learn

1

समर्थन वेक्टर मशीनों के लिए फ़ीचर चयन

मेरा प्रश्न तीन गुना है वेक्टर मशीनों का "कर्नेलाइज़्ड" समर्थन के संदर्भ में क्या परिवर्तनीय / सुविधा चयन वांछनीय है - विशेष रूप से जब हम ओवरफ़िटिंग को रोकने के लिए पैरामीटर सी को नियमित करते हैं और एसवीएम के लिए कर्नेल को शुरू करने के पीछे मुख्य उद्देश्य समस्या …

9 svm feature-selection scikit-learn

2

क्या एक ऐसी विधि है जो आयामीता में कमी के विपरीत है?

मैं मशीन लर्निंग के क्षेत्र में नया हूं, लेकिन सिग्नल प्रोसेसिंग के अपने हिस्से का काम किया है। कृपया मुझे बताएं कि क्या यह प्रश्न गलत समझा गया है। मेरे पास दो आयामी डेटा हैं जिन्हें कम से कम तीन चर द्वारा परिभाषित किया गया है, अत्यधिक गैर-रेखीय मॉडल तरीके …

9 machine-learning scikit-learn

scikit-learn पर टैग किए गए जवाब