डेटा साइंस

डेटा विज्ञान पेशेवरों, मशीन लर्निंग विशेषज्ञों और क्षेत्र के बारे में अधिक जानने में दिलचस्पी रखने वालों के लिए प्रश्नोत्तर

3
मैक्स पूलिंग वैसे भी छवि को खराब करने जा रहा है, तो दृढ़ क्यों?
किनारों को पहचानने के लिए कुछ करने के लिए फ़िल्टर लगाने का विचार एक बहुत अच्छा विचार है। उदाहरण के लिए, आप 7. की एक छवि ले सकते हैं। कुछ फिल्टर के साथ, आप परिवर्तित छवियों के साथ समाप्त हो सकते हैं जो मूल छवि की विभिन्न विशेषताओं पर जोर …

4
पूर्व-प्रशिक्षित मॉडल भार के साथ एक नया शब्द 2vec मॉडल कैसे शुरू करें?
मैं Word2vector मॉडल का उपयोग और प्रशिक्षण के लिए अजगर में जेनसिम लाइब्रेरी का उपयोग कर रहा हूं। हाल ही में, मैं अपने मॉडल के वज़न को कुछ पूर्व-प्रशिक्षित वर्ड 2vec मॉडल जैसे (GoogleNewDataset pretrained मॉडल) के साथ शुरू करने पर विचार कर रहा था। मैं इसके साथ कुछ हफ़्ते …

8
क्या अजगर बड़े डेटा के लिए उपयुक्त है
मैंने इस पोस्ट में पढ़ा कि क्या बिग डेटा के लिए R भाषा उपयुक्त है जो बड़ा डेटा बनाता है 5TB, और जबकि यह इस प्रकार के डेटा के साथ काम करने की व्यवहार्यता के बारे में जानकारी प्रदान करने का एक अच्छा काम Rकरता है Python। मैं सोच रहा …
14 bigdata  python 

4
LSTM समय श्रृंखला पूर्वानुमान के आसपास भविष्यवाणी अंतराल
LSTM (या अन्य आवर्तक) तंत्रिका नेटवर्क से एक समय श्रृंखला पूर्वानुमान के आसपास भविष्यवाणी अंतराल (संभावना वितरण) की गणना करने के लिए एक विधि है? उदाहरण के लिए, मैं भविष्य में 10 नमूनों की भविष्यवाणी कर रहा हूं (टी + 1 से टी + 10), पिछले 10 देखे गए नमूनों …

2
XgBoost में जोड़ीदार रैंकिंग मॉडल कैसे फिट होते हैं?
जहां तक ​​मुझे पता है, रैंक मॉडल्स को सीखने के लिए, आपको डेटासेट में तीन चीजें होनी चाहिए: लेबल या प्रासंगिकता समूह या क्वेरी आईडी सुविधा वेक्टर उदाहरण के लिए, डेटा को रैंक करने वाले Microsoft लर्निंग इस प्रारूप (लेबल, समूह आईडी और सुविधाओं) का उपयोग करता है। 1 qid:10 …
14 search  ranking  xgboost  gbm 

4
0 से 1 के बीच हस्ताक्षरित पूर्णांक की एक सरणी को कैसे स्केल करें?
मैं मस्तिष्क का उपयोग एक तंत्रिका नेटवर्क को एक फीचर सेट पर प्रशिक्षित करने के लिए कर रहा हूं जिसमें सकारात्मक और नकारात्मक दोनों मूल्य शामिल हैं। लेकिन ब्रेन को 0 और 1 के बीच इनपुट वैल्यू की आवश्यकता होती है। मेरे डेटा को सामान्य करने का सबसे अच्छा तरीका …

6
पायथन में अच्छा "लगातार अनुक्रम खनन" संकुल?
क्या किसी ने MLLib में FPM के अलावा किसी अच्छे "लगातार अनुक्रम खनन" पैकेज का उपयोग (पसंद) किया है? मैं एक स्थिर पैकेज की तलाश कर रहा हूं, जो लोगों द्वारा अभी भी बनाए रखा गया है। धन्यवाद!

4
Gensim Word2Vec कार्यान्वयन में युगों की संख्या
Word2Vec कार्यान्वयन iterमें एक पैरामीटर हैgensim class gensim.models.word2vec.Word2Vec (वाक्य = कोई नहीं, आकार = 100, अल्फा = 0.025, खिड़की = 5, min_count = 5, max_vocab_size = कोई नहीं, नमूना = 0, बीज = 1, श्रमिक = 1, min_alpha = 0.0001, sg = 1, hs = 1, ऋणात्मक = 0, cbow_mean …

2
आप टेक्स्ट वर्गीकरण पर SMOTE कैसे लागू करते हैं?
सिंथेटिक माइनॉरिटी ओवरसैंपलिंग तकनीक (SMOTE) एक ओवरलैप्ड डेटासेट समस्या में इस्तेमाल की जाने वाली ओवरसैंपलिंग तकनीक है। अब तक मेरे पास एक विचार है कि इसे सामान्य, संरचित डेटा पर कैसे लागू किया जाए। लेकिन क्या इसे पाठ वर्गीकरण समस्या पर लागू करना संभव है? डेटा के किस भाग को …

3
पंडों डेटाफ्रेम को DMatrix
मैं scikit सीखने में xgboost चलाने की कोशिश कर रहा हूं। और मैं केवल डेटाफ्रेम में डेटा लोड करने के लिए पंडों का उपयोग करता हूं। मैं कैसे xgboost के साथ पांडा df का उपयोग करने वाला हूं। मैं DMGrix दिनचर्या से उलझन में हूँ xgboost algo चलाने के लिए …

4
मानव डेटाबेस के बिना AlphaGo (और सुदृढीकरण-शिक्षण का उपयोग करके अन्य खेल कार्यक्रम)
मैं विषय का विशेषज्ञ नहीं हूं, और मेरा सवाल शायद बहुत भोला है। यह एक निबंध से लगता है कि सुदृढीकरण सीखने की शक्तियों और सीमा को समझने के लिए अल्फ़ाज़ो कार्यक्रम में उपयोग किया जाता है। अन्य चीजों (मोंटे-कार्लो पेड़ों की खोज, आदि), तंत्रिका नेटवर्क का उपयोग करके बनाया …

2
तंत्रिका नेटवर्क के अनुकूलन के लिए जेनेटिक एल्गोरिदम का उपयोग क्यों नहीं किया जाता है?
मेरी समझ से, जेनेटिक एल्गोरिदम बहुउद्देश्यीय अनुकूलन के लिए शक्तिशाली उपकरण हैं। इसके अलावा, न्यूरल नेटवर्क (विशेष रूप से गहरे वाले) को प्रशिक्षित करना कठिन है और इसमें कई मुद्दे हैं (गैर-उत्तल लागत कार्य - स्थानीय मिनीमा, लुप्त और विस्फोट ग्रेडर आदि)। इसके अलावा, मैं वैचारिक रूप से एनए को …

1
CNN में अपसम्पलिंग और द्वि-लीनियर अपसम्पलिंग के बीच अंतर क्या है?
मैं इस पेपर को समझने की कोशिश कर रहा हूं और इस बात को लेकर अनिश्चित हूं कि द्वि-रैखिक उतार-चढ़ाव क्या है। क्या कोई इसे उच्च स्तर पर समझा सकता है? https://arxiv.org/abs/1606.00915

4
हर आशावादी के लिए ग्रेडिएंट डिसेंट सेंट्रल है?
मैं जानना चाहता हूं कि ग्रैडिएंट वंशज आदमियों, आदमगढ़, आरएमएसप्रॉप और कई अन्य आशावादियों जैसे ऑप्टिमाइज़र में उपयोग किया जाने वाला मुख्य एल्गोरिदम है या नहीं।

1
XGBRegressor बनाम xgboost.train विशाल गति अंतर?
यदि मैं निम्नलिखित कोड का उपयोग करके अपने मॉडल को प्रशिक्षित करता हूं: import xgboost as xg params = {'max_depth':3, 'min_child_weight':10, 'learning_rate':0.3, 'subsample':0.5, 'colsample_bytree':0.6, 'obj':'reg:linear', 'n_estimators':1000, 'eta':0.3} features = df[feature_columns] target = df[target_columns] dmatrix = xg.DMatrix(features.values, target.values, feature_names=features.columns.values) clf = xg.train(params, dmatrix) यह लगभग 1 मिनट में समाप्त होता है। …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.