डेटा साइंस

3

मैक्स पूलिंग वैसे भी छवि को खराब करने जा रहा है, तो दृढ़ क्यों?

किनारों को पहचानने के लिए कुछ करने के लिए फ़िल्टर लगाने का विचार एक बहुत अच्छा विचार है। उदाहरण के लिए, आप 7. की एक छवि ले सकते हैं। कुछ फिल्टर के साथ, आप परिवर्तित छवियों के साथ समाप्त हो सकते हैं जो मूल छवि की विभिन्न विशेषताओं पर जोर …

14 neural-network

4

पूर्व-प्रशिक्षित मॉडल भार के साथ एक नया शब्द 2vec मॉडल कैसे शुरू करें?

मैं Word2vector मॉडल का उपयोग और प्रशिक्षण के लिए अजगर में जेनसिम लाइब्रेरी का उपयोग कर रहा हूं। हाल ही में, मैं अपने मॉडल के वज़न को कुछ पूर्व-प्रशिक्षित वर्ड 2vec मॉडल जैसे (GoogleNewDataset pretrained मॉडल) के साथ शुरू करने पर विचार कर रहा था। मैं इसके साथ कुछ हफ़्ते …

14 python nlp word-embeddings word2vec gensim

8

क्या अजगर बड़े डेटा के लिए उपयुक्त है

मैंने इस पोस्ट में पढ़ा कि क्या बिग डेटा के लिए R भाषा उपयुक्त है जो बड़ा डेटा बनाता है 5TB, और जबकि यह इस प्रकार के डेटा के साथ काम करने की व्यवहार्यता के बारे में जानकारी प्रदान करने का एक अच्छा काम Rकरता है Python। मैं सोच रहा …

14 bigdata python

4

LSTM समय श्रृंखला पूर्वानुमान के आसपास भविष्यवाणी अंतराल

LSTM (या अन्य आवर्तक) तंत्रिका नेटवर्क से एक समय श्रृंखला पूर्वानुमान के आसपास भविष्यवाणी अंतराल (संभावना वितरण) की गणना करने के लिए एक विधि है? उदाहरण के लिए, मैं भविष्य में 10 नमूनों की भविष्यवाणी कर रहा हूं (टी + 1 से टी + 10), पिछले 10 देखे गए नमूनों …

14 machine-learning deep-learning time-series prediction lstm

2

XgBoost में जोड़ीदार रैंकिंग मॉडल कैसे फिट होते हैं?

जहां तक मुझे पता है, रैंक मॉडल्स को सीखने के लिए, आपको डेटासेट में तीन चीजें होनी चाहिए: लेबल या प्रासंगिकता समूह या क्वेरी आईडी सुविधा वेक्टर उदाहरण के लिए, डेटा को रैंक करने वाले Microsoft लर्निंग इस प्रारूप (लेबल, समूह आईडी और सुविधाओं) का उपयोग करता है। 1 qid:10 …

14 search ranking xgboost gbm

4

0 से 1 के बीच हस्ताक्षरित पूर्णांक की एक सरणी को कैसे स्केल करें?

मैं मस्तिष्क का उपयोग एक तंत्रिका नेटवर्क को एक फीचर सेट पर प्रशिक्षित करने के लिए कर रहा हूं जिसमें सकारात्मक और नकारात्मक दोनों मूल्य शामिल हैं। लेकिन ब्रेन को 0 और 1 के बीच इनपुट वैल्यू की आवश्यकता होती है। मेरे डेटा को सामान्य करने का सबसे अच्छा तरीका …

14 machine-learning neural-network feature-scaling normalization javascript

6

पायथन में अच्छा "लगातार अनुक्रम खनन" संकुल?

क्या किसी ने MLLib में FPM के अलावा किसी अच्छे "लगातार अनुक्रम खनन" पैकेज का उपयोग (पसंद) किया है? मैं एक स्थिर पैकेज की तलाश कर रहा हूं, जो लोगों द्वारा अभी भी बनाए रखा गया है। धन्यवाद!

14 python sequential-pattern-mining

4

Gensim Word2Vec कार्यान्वयन में युगों की संख्या

Word2Vec कार्यान्वयन iterमें एक पैरामीटर हैgensim class gensim.models.word2vec.Word2Vec (वाक्य = कोई नहीं, आकार = 100, अल्फा = 0.025, खिड़की = 5, min_count = 5, max_vocab_size = कोई नहीं, नमूना = 0, बीज = 1, श्रमिक = 1, min_alpha = 0.0001, sg = 1, hs = 1, ऋणात्मक = 0, cbow_mean …

14 gensim word2vec convergence

2

आप टेक्स्ट वर्गीकरण पर SMOTE कैसे लागू करते हैं?

सिंथेटिक माइनॉरिटी ओवरसैंपलिंग तकनीक (SMOTE) एक ओवरलैप्ड डेटासेट समस्या में इस्तेमाल की जाने वाली ओवरसैंपलिंग तकनीक है। अब तक मेरे पास एक विचार है कि इसे सामान्य, संरचित डेटा पर कैसे लागू किया जाए। लेकिन क्या इसे पाठ वर्गीकरण समस्या पर लागू करना संभव है? डेटा के किस भाग को …

14 unbalanced-classes text smote

3

पंडों डेटाफ्रेम को DMatrix

मैं scikit सीखने में xgboost चलाने की कोशिश कर रहा हूं। और मैं केवल डेटाफ्रेम में डेटा लोड करने के लिए पंडों का उपयोग करता हूं। मैं कैसे xgboost के साथ पांडा df का उपयोग करने वाला हूं। मैं DMGrix दिनचर्या से उलझन में हूँ xgboost algo चलाने के लिए …

14 scikit-learn pandas xgboost

4

मानव डेटाबेस के बिना AlphaGo (और सुदृढीकरण-शिक्षण का उपयोग करके अन्य खेल कार्यक्रम)

मैं विषय का विशेषज्ञ नहीं हूं, और मेरा सवाल शायद बहुत भोला है। यह एक निबंध से लगता है कि सुदृढीकरण सीखने की शक्तियों और सीमा को समझने के लिए अल्फ़ाज़ो कार्यक्रम में उपयोग किया जाता है। अन्य चीजों (मोंटे-कार्लो पेड़ों की खोज, आदि), तंत्रिका नेटवर्क का उपयोग करके बनाया …

13 reinforcement-learning

2

तंत्रिका नेटवर्क के अनुकूलन के लिए जेनेटिक एल्गोरिदम का उपयोग क्यों नहीं किया जाता है?

मेरी समझ से, जेनेटिक एल्गोरिदम बहुउद्देश्यीय अनुकूलन के लिए शक्तिशाली उपकरण हैं। इसके अलावा, न्यूरल नेटवर्क (विशेष रूप से गहरे वाले) को प्रशिक्षित करना कठिन है और इसमें कई मुद्दे हैं (गैर-उत्तल लागत कार्य - स्थानीय मिनीमा, लुप्त और विस्फोट ग्रेडर आदि)। इसके अलावा, मैं वैचारिक रूप से एनए को …

13 neural-network optimization genetic-algorithms

1

CNN में अपसम्पलिंग और द्वि-लीनियर अपसम्पलिंग के बीच अंतर क्या है?

मैं इस पेपर को समझने की कोशिश कर रहा हूं और इस बात को लेकर अनिश्चित हूं कि द्वि-रैखिक उतार-चढ़ाव क्या है। क्या कोई इसे उच्च स्तर पर समझा सकता है? https://arxiv.org/abs/1606.00915

13 deep-learning convnet cnn convolution

4

हर आशावादी के लिए ग्रेडिएंट डिसेंट सेंट्रल है?

मैं जानना चाहता हूं कि ग्रैडिएंट वंशज आदमियों, आदमगढ़, आरएमएसप्रॉप और कई अन्य आशावादियों जैसे ऑप्टिमाइज़र में उपयोग किया जाने वाला मुख्य एल्गोरिदम है या नहीं।

13 machine-learning neural-network deep-learning optimization gradient-descent

1

XGBRegressor बनाम xgboost.train विशाल गति अंतर?

यदि मैं निम्नलिखित कोड का उपयोग करके अपने मॉडल को प्रशिक्षित करता हूं: import xgboost as xg params = {'max_depth':3, 'min_child_weight':10, 'learning_rate':0.3, 'subsample':0.5, 'colsample_bytree':0.6, 'obj':'reg:linear', 'n_estimators':1000, 'eta':0.3} features = df[feature_columns] target = df[target_columns] dmatrix = xg.DMatrix(features.values, target.values, feature_names=features.columns.values) clf = xg.train(params, dmatrix) यह लगभग 1 मिनट में समाप्त होता है। …

13 machine-learning python decision-trees xgboost efficiency