डेटा साइंस

3

यह सामान्य एनएलपी प्रश्न की तरह अधिक है। Word2Vec नाम के शब्द एम्बेड करने के लिए उपयुक्त इनपुट क्या है? क्या लेख से संबंधित सभी वाक्य एक कॉर्पस में एक अलग दस्तावेज़ होना चाहिए? या कहा कि प्रत्येक लेख में एक दस्तावेज होना चाहिए? यह अजगर और जेनसिम का उपयोग …

22 nlp word-embeddings

6

दृढ़ तंत्रिका तंत्रिका नेटवर्क क्यों काम करते हैं?

मैंने अक्सर लोगों को यह कहते हुए सुना है कि क्यों जटिल तंत्रिका नेटवर्क अभी भी खराब समझे जाते हैं। क्या यह ज्ञात है कि दृढ़ तंत्रिका नेटवर्क हमेशा परतों के रूप में बढ़ते परिष्कृत सुविधाओं को सीखते हैं? किस कारण से वे इस तरह की विशेषताओं का ढेर बनाते …

22 machine-learning neural-network deep-learning convnet cnn

4

क्या डाटा साइंस को डाटा माइनिंग कहा जाता है?

मुझे यकीन है कि डेटा विज्ञान पर चर्चा की जाएगी क्योंकि इस मंच में कई समानार्थी शब्द या कम से कम संबंधित क्षेत्र हैं जहां बड़े डेटा का विश्लेषण किया जाता है। मेरा विशेष प्रश्न डाटा माइनिंग के संबंध में है। मैंने कुछ साल पहले डेटा माइनिंग में स्नातक वर्ग …

22 data-mining definitions

3

आप काम पर उम्मीदों का प्रबंधन कैसे करते हैं?

डेटा साइंस, मशीन लर्निंग, और आसपास की सभी सफलता की कहानियों के आसपास के सभी घेरा के साथ, दोनों न्यायोचित और डेटा वैज्ञानिकों और उनके पूर्वानुमान मॉडल से बहुत अधिक औचित्यपूर्ण हैं। सांख्यिकीविदों, मशीन लर्निंग विशेषज्ञों, और डेटा वैज्ञानिकों का अभ्यास करने का मेरा प्रश्न है - आप कंपनी के …

22 performance accuracy

2

समय श्रृंखला से कैसे निपटें जो मौसम या अन्य पैटर्न में बदलती हैं?

पृष्ठभूमि मैं ऊर्जा मीटर रीडिंग के एक समय श्रृंखला डेटा सेट पर काम कर रहा हूं। श्रृंखला की लंबाई मीटर से भिन्न होती है - कुछ के लिए मेरे पास कई साल हैं, अन्य केवल कुछ महीने हैं, आदि कई महत्वपूर्ण मौसमीता प्रदर्शित करते हैं, और अक्सर कई परतें - …

22 data-mining clustering time-series beginner

3

xgboost: हाल के नमूनों को अधिक महत्व दें

क्या उन बिंदुओं पर अधिक महत्व जोड़ने का एक तरीका है जो xgboost के साथ डेटा का विश्लेषण करते समय अधिक हाल के हैं?

22 xgboost weighted-data

2

PASCAL VOC चैलेंज के लिए डिटेक्शन टास्क के लिए mAP की गणना कैसे करें?

पास्कल वीओसी लीडरबोर्ड के लिए खोज कार्य के लिए एमएपी (औसत औसत परिशुद्धता) की गणना कैसे करें? http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 वहाँ कहा - पृष्ठ 11 पर : http://homepages.inf.ed.ac.uk/ckiw/postscript/ijcv_voc09.pdf औसत परिशुद्धता (एपी)। VOC2007 चुनौती के लिए, वर्गीकरण और पता लगाने दोनों का मूल्यांकन करने के लिए प्रक्षेपित औसत परिशुद्धता (सल्टन और मैगिल 1986) …

22 machine-learning neural-network svm computer-vision object-recognition

2

Pytorch में torch.no_grad का क्या उपयोग है?

मैं pytorch में नया हूं और इस github कोड के साथ शुरू हुआ हूं । मुझे कोड में लाइन 60-61 में टिप्पणी समझ नहीं आ रही है "because weights have requires_grad=True, but we don't need to track this in autograd"। मैं समझ गया कि हम requires_grad=Trueउन चरों का उल्लेख करते …

22 pytorch

4

एक केरास मॉडल के लिए सटीकता, एफ 1, परिशुद्धता और रिकॉल कैसे प्राप्त करें?

मैं अपने बाइनरी KerasClassifier मॉडल के लिए सटीक, रिकॉल और F1-स्कोर की गणना करना चाहता हूं, लेकिन कोई समाधान नहीं ढूंढता। यहाँ मेरा वास्तविक कोड है: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the model model = Sequential() …

22 machine-learning neural-network deep-learning classification keras

2

पंडों में दो कॉलम द्वारा समूहीकृत मूल्यों को कैसे योग करें

मेरे पास पंडों का डेटाफ़्रेम इस तरह है: df = pd.DataFrame({ 'Date': ['2017-1-1', '2017-1-1', '2017-1-2', '2017-1-2', '2017-1-3'], 'Groups': ['one', 'one', 'one', 'two', 'two'], 'data': range(1, 6)}) Date Groups data 0 2017-1-1 one 1 1 2017-1-1 one 2 2 2017-1-2 one 3 3 2017-1-2 two 4 4 2017-1-3 two 5 मैं …

21 python pandas dataframe

3

PySpark में कई डेटा फ़्रेम रो-वार मर्ज करना

मैं 10 डेटा फ्रेम है pyspark.sql.dataframe.DataFrame, से प्राप्त randomSplitके रूप में (td1, td2, td3, td4, td5, td6, td7, td8, td9, td10) = td.randomSplit([.1, .1, .1, .1, .1, .1, .1, .1, .1, .1], seed = 100)अब मैं 9 में शामिल करना चाहते td'एक भी डेटा फ्रेम में है, मुझे लगता है …

21 python apache-spark cross-validation pyspark

3

चक्रीय साधारण विशेषताओं को बदलने का एक अच्छा तरीका क्या है?

मैं अपनी विशेषता के रूप में 'घंटे' क्षेत्र में हूँ, लेकिन यह एक चक्रीय मान लेता है। मैं '23' और '0' घंटे जैसी सूचनाओं को संरक्षित करने के लिए फीचर को कैसे बदल सकता हूं, यह बहुत दूर नहीं है। एक तरीका मुझे लगता है कि परिवर्तन करना है: min(h, …

21 feature-extraction feature-scaling featurization

1

क्या मिनी-बैच के आकार को चुनने के लिए कोई नियम हैं?

तंत्रिका नेटवर्क का प्रशिक्षण करते समय, एक हाइपरपरमीटर एक मिनीबैच का आकार होता है। आम विकल्प 32, 64 और 128 तत्व प्रति मिनी बैच हैं। क्या कोई नियम / दिशानिर्देश हैं कि मिनी-बैच कितना बड़ा होना चाहिए? कोई प्रकाशन जो प्रशिक्षण पर प्रभाव की जांच करता है?

21 neural-network deep-learning convnet optimization

3

मैं Gensim के साथ FastText प्रीट्रेन मॉडल को कैसे लोड करूं?

मैंने फास्टटेक्स प्रीट्रेन मॉडल को फास्टटेक्स मॉडल से लोड करने की कोशिश की । मैं wiki.simple.en का उपयोग कर रहा हूं from gensim.models.keyedvectors import KeyedVectors word_vectors = KeyedVectors.load_word2vec_format('wiki.simple.bin', binary=True) लेकिन, यह निम्नलिखित त्रुटियों को दर्शाता है Traceback (most recent call last): File "nltk_check.py", line 28, in <module> word_vectors = KeyedVectors.load_word2vec_format('wiki.simple.bin', …

21 nlp gensim

3

एकाधिक आउटपुट प्रतिगमन के लिए तंत्रिका नेटवर्क

मेरे पास 34 इनपुट कॉलम और 8 आउटपुट कॉलम वाले डेटासेट हैं। समस्या को हल करने का एक तरीका 34 आउटपुट लेना और प्रत्येक आउटपुट कॉलम के लिए व्यक्तिगत प्रतिगमन मॉडल बनाना है। मुझे आश्चर्य है कि क्या यह समस्या सिर्फ एक मॉडल का उपयोग करके हल की जा सकती …

21 neural-network regression tensorflow