python पर टैग किए गए जवाब

प्रोग्रामिंग लैंग्वेज पायथन से संबंधित डेटा विज्ञान प्रश्नों के लिए उपयोग करें। सामान्य कोडिंग प्रश्नों के लिए अभिप्रेत नहीं है (-> स्टैकओवरफ़्लो)।

1
बहु-श्रेणी वर्गीकरण के लिए सबसे अच्छा केरस मॉडल क्या है?
मैं अनुसंधान, पर काम कर रहा हूँ, जहां तीन घटना विजेता के वर्गीकृत एक की जरूरत = ( win, draw, lose) WINNER LEAGUE HOME AWAY MATCH_HOME MATCH_DRAW MATCH_AWAY MATCH_U2_50 MATCH_O2_50 3 13 550 571 1.86 3.34 4.23 1.66 2.11 3 7 322 334 7.55 4.1 1.4 2.17 1.61 मेरा वर्तमान …

1
स्केगन ग्रैडिएंटबॉस्टिंग क्लैसिफायर की तुलना में एक्सगबोस्ट इतना तेज क्यों है?
मैं 100 न्यूमेरिक फीचर्स के साथ 50k उदाहरणों पर एक ढाल बढ़ाने वाले मॉडल को प्रशिक्षित करने की कोशिश कर रहा हूं। XGBClassifierमेरी मशीन पर 43 सेकंड के भीतर 500 पेड़ लगाता है, जबकि GradientBoostingClassifier1 मिनट और 2 सेकंड में केवल 10 पेड़ (!) को संभालता है :( मैंने 500 …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

3
Hypertuning XGBoost पैरामीटर
XGBoost एक अच्छा काम कर रहा है, जब यह स्पष्ट और निरंतर निर्भर चर दोनों से निपटने की बात करता है। लेकिन, मैं एक XGBoost समस्या के लिए अनुकूलित मापदंडों का चयन कैसे करूं? यह है कि मैंने हाल ही में कागल समस्या के लिए पैरामीटर लागू किया है: param …
27 r  python  xgboost 

3
रैखिक प्रतिगमन में भार को गैर-नकारात्मक होने के लिए कैसे मजबूर किया जाए
मैं एक मानक रेखीय प्रतिगमन का उपयोग कर रहा हूं जो कि अजगर में सीखें। हालाँकि, मैं वेट्स को हर फीचर के लिए पॉजिटिव होने के लिए मजबूर करना चाहूंगा (निगेटिव नहीं), क्या ऐसा कोई तरीका है जिससे मैं इसे पूरा कर सकूं? मैं प्रलेखन में देख रहा था, लेकिन …

1
पाइरॉच बनाम टेन्सरफ्लो फोल्ड
PyTorch और Tensorflow Fold दोनों ही गहन शिक्षण ढाँचे हैं जो उन स्थितियों से निपटने के लिए हैं जहाँ इनपुट डेटा में गैर-समान लंबाई या आयाम हैं (यानी, ऐसी स्थितियाँ जहाँ डायनेमिक ग्राफ़ उपयोगी या आवश्यक हैं)। मैं जानना चाहूंगा कि वे किस तरह की तुलना करते हैं, प्रतिमानों के …

7
एक और मशीन पर पायथन काम के माहौल को कैसे क्लोन करें?
मैंने अपने कार्य केंद्र पर पायथन (एनाकोंडा + फ्लास्क) के साथ एक मशीन लर्निंग मॉडल विकसित किया और सब ठीक हो गया। बाद में, मैंने इस प्रोग्राम को किसी अन्य मशीन पर शिप करने की कोशिश की, जहाँ निश्चित रूप से मैंने उसी वातावरण को स्थापित करने की कोशिश की, …
26 python  anaconda 

2
केरस में दो अलग-अलग मॉडल विलय
मैं दो केरस मॉडल को एक मॉडल में विलय करने की कोशिश कर रहा हूं और मैं इसे पूरा करने में असमर्थ हूं। संलग्न चित्र में उदाहरण के लिए, मैं आयाम 8 की मध्य परत को प्राप्त करना चाहूंगा , और इसका उपयोग मॉडल में परत (आयाम 8 फिर से) …

6
फेसबुक साइटों पर उपयोगकर्ताओं की उम्र का अनुमान लगाने के लिए मशीन सीखने की तकनीक जो उन्हें पसंद है
मेरे पास मेरे फेसबुक एप्लिकेशन का एक डेटाबेस है और मैं उपयोगकर्ताओं की उम्र का अनुमान लगाने के लिए मशीन सीखने का उपयोग करने की कोशिश कर रहा हूं, जो कि वे फेसबुक साइट को पसंद करते हैं। मेरे डेटाबेस की तीन महत्वपूर्ण विशेषताएं हैं: मेरे प्रशिक्षण सेट में उम्र …

4
क्या पंडों को चलाने का एक सीधा तरीका है। DataFrame.isin समानांतर में?
मेरे पास एक मॉडलिंग और स्कोरिंग कार्यक्रम है जो DataFrame.isinकुछ हजार विशिष्ट पृष्ठों में से प्रत्येक के लिए अलग-अलग उपयोगकर्ताओं के रिकॉर्ड जैसे "फेसबुक" की सूची के माध्यम से पांडा के कार्य का भारी उपयोग करता है। यह कार्यक्रम का सबसे अधिक समय लेने वाला हिस्सा है, मॉडलिंग या स्कोरिंग …

4
नामित एंटिटी मान्यता के लिए Word2Vec
मैं एक नामित निकाय मान्यता प्रणाली बनाने के लिए Google के word2vec कार्यान्वयन का उपयोग करना चाह रहा हूं। मैंने सुना है कि संरचना के माध्यम से वापस प्रसार के साथ पुनरावर्ती तंत्रिका जाल नामित इकाई मान्यता कार्यों के लिए अच्छी तरह से अनुकूल हैं, लेकिन मैं उस प्रकार के …

5
डेटा विज्ञान परियोजनाओं के लिए वीएम छवि
चूंकि डेटा विज्ञान कार्यों के लिए कई उपकरण उपलब्ध हैं, और यह सब कुछ स्थापित करने और एक आदर्श प्रणाली बनाने के लिए बोझिल है। क्या पायथन, आर और अन्य ओपन-सोर्स डेटा विज्ञान उपकरण के साथ लिनक्स / मैक ओएस छवि स्थापित है और लोगों को तुरंत उपयोग करने के …
24 python  r  tools 

4
Scikit-learn: SGDClassifier को भविष्यवाणी करने के साथ-साथ लॉजिस्टिक रिग्रेशन प्राप्त करना
लॉजिस्टिक रिग्रेशन को प्रशिक्षित करने का एक तरीका स्टोचस्टिक ग्रेडिएंट डीसेंट का उपयोग करके है, जो स्किटिट-लर्न को एक इंटरफ़ेस प्रदान करता है। मैं जो करना चाहूंगा, वह स्किट-लर्न का SGDClassifier लेगा और यहां लॉजिस्टिक रिग्रेशन के समान है । हालाँकि, मुझे कुछ मशीन सीखने की वृद्धि याद आ रही …

3
पायथन मशीन लर्निंग मॉडल को स्टोर करने के लिए सर्वोत्तम अभ्यास
मशीन लर्निंग मॉडल को बचाने, स्टोर करने और साझा करने के लिए सबसे अच्छे अभ्यास क्या हैं? पायथन में, हम आमतौर पर अचार या जॉबलिब का उपयोग करके मॉडल के द्विआधारी प्रतिनिधित्व को संग्रहीत करते हैं। मॉडल, मेरे मामले में, ~ 100 बड़ा हो सकता है। इसके अलावा, जॉबलिब एक …

4
क्या क्लस्टरिंग से पहले अपने डेटा को मानकीकृत करना आवश्यक है?
क्या क्लस्टर से पहले अपने डेटा को मानकीकृत करना आवश्यक है? scikit learnDBSCAN के बारे में उदाहरण में, यहाँ वे इस पंक्ति में करते हैं: X = StandardScaler().fit_transform(X) लेकिन मुझे समझ नहीं आता कि यह क्यों जरूरी है। आखिरकार, क्लस्टरिंग डेटा के किसी विशेष वितरण को ग्रहण नहीं करता है …

5
पायथन में केएल डाइवर्जेंस की गणना
मैं इसके लिए नया हूँ और यह नहीं कह सकता कि मुझे इसके पीछे सैद्धांतिक अवधारणाओं की पूरी समझ है। मैं पायथन में कई सूचियों के बीच केएल डाइवर्जेंस की गणना करने की कोशिश कर रहा हूं। मैं यह प्रयास करने और करने के लिए http://scikit-learn.org/stable/modules/generated/sklearn.metrics.mutual_info_score.html का उपयोग कर रहा …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.