डेटा साइंस

डेटा विज्ञान पेशेवरों, मशीन लर्निंग विशेषज्ञों और क्षेत्र के बारे में अधिक जानने में दिलचस्पी रखने वालों के लिए प्रश्नोत्तर

3
Word2Vec के लिए एक बेहतर इनपुट क्या है?
यह सामान्य एनएलपी प्रश्न की तरह अधिक है। Word2Vec नाम के शब्द एम्बेड करने के लिए उपयुक्त इनपुट क्या है? क्या लेख से संबंधित सभी वाक्य एक कॉर्पस में एक अलग दस्तावेज़ होना चाहिए? या कहा कि प्रत्येक लेख में एक दस्तावेज होना चाहिए? यह अजगर और जेनसिम का उपयोग …

6
दृढ़ तंत्रिका तंत्रिका नेटवर्क क्यों काम करते हैं?
मैंने अक्सर लोगों को यह कहते हुए सुना है कि क्यों जटिल तंत्रिका नेटवर्क अभी भी खराब समझे जाते हैं। क्या यह ज्ञात है कि दृढ़ तंत्रिका नेटवर्क हमेशा परतों के रूप में बढ़ते परिष्कृत सुविधाओं को सीखते हैं? किस कारण से वे इस तरह की विशेषताओं का ढेर बनाते …

4
क्या डाटा साइंस को डाटा माइनिंग कहा जाता है?
मुझे यकीन है कि डेटा विज्ञान पर चर्चा की जाएगी क्योंकि इस मंच में कई समानार्थी शब्द या कम से कम संबंधित क्षेत्र हैं जहां बड़े डेटा का विश्लेषण किया जाता है। मेरा विशेष प्रश्न डाटा माइनिंग के संबंध में है। मैंने कुछ साल पहले डेटा माइनिंग में स्नातक वर्ग …

3
आप काम पर उम्मीदों का प्रबंधन कैसे करते हैं?
डेटा साइंस, मशीन लर्निंग, और आसपास की सभी सफलता की कहानियों के आसपास के सभी घेरा के साथ, दोनों न्यायोचित और डेटा वैज्ञानिकों और उनके पूर्वानुमान मॉडल से बहुत अधिक औचित्यपूर्ण हैं। सांख्यिकीविदों, मशीन लर्निंग विशेषज्ञों, और डेटा वैज्ञानिकों का अभ्यास करने का मेरा प्रश्न है - आप कंपनी के …

2
समय श्रृंखला से कैसे निपटें जो मौसम या अन्य पैटर्न में बदलती हैं?
पृष्ठभूमि मैं ऊर्जा मीटर रीडिंग के एक समय श्रृंखला डेटा सेट पर काम कर रहा हूं। श्रृंखला की लंबाई मीटर से भिन्न होती है - कुछ के लिए मेरे पास कई साल हैं, अन्य केवल कुछ महीने हैं, आदि कई महत्वपूर्ण मौसमीता प्रदर्शित करते हैं, और अक्सर कई परतें - …


2
PASCAL VOC चैलेंज के लिए डिटेक्शन टास्क के लिए mAP की गणना कैसे करें?
पास्कल वीओसी लीडरबोर्ड के लिए खोज कार्य के लिए एमएपी (औसत औसत परिशुद्धता) की गणना कैसे करें? http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 वहाँ कहा - पृष्ठ 11 पर : http://homepages.inf.ed.ac.uk/ckiw/postscript/ijcv_voc09.pdf औसत परिशुद्धता (एपी)। VOC2007 चुनौती के लिए, वर्गीकरण और पता लगाने दोनों का मूल्यांकन करने के लिए प्रक्षेपित औसत परिशुद्धता (सल्टन और मैगिल 1986) …

2
Pytorch में torch.no_grad का क्या उपयोग है?
मैं pytorch में नया हूं और इस github कोड के साथ शुरू हुआ हूं । मुझे कोड में लाइन 60-61 में टिप्पणी समझ नहीं आ रही है "because weights have requires_grad=True, but we don't need to track this in autograd"। मैं समझ गया कि हम requires_grad=Trueउन चरों का उल्लेख करते …
22 pytorch 

4
एक केरास मॉडल के लिए सटीकता, एफ 1, परिशुद्धता और रिकॉल कैसे प्राप्त करें?
मैं अपने बाइनरी KerasClassifier मॉडल के लिए सटीक, रिकॉल और F1-स्कोर की गणना करना चाहता हूं, लेकिन कोई समाधान नहीं ढूंढता। यहाँ मेरा वास्तविक कोड है: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the model model = Sequential() …

2
पंडों में दो कॉलम द्वारा समूहीकृत मूल्यों को कैसे योग करें
मेरे पास पंडों का डेटाफ़्रेम इस तरह है: df = pd.DataFrame({ 'Date': ['2017-1-1', '2017-1-1', '2017-1-2', '2017-1-2', '2017-1-3'], 'Groups': ['one', 'one', 'one', 'two', 'two'], 'data': range(1, 6)}) Date Groups data 0 2017-1-1 one 1 1 2017-1-1 one 2 2 2017-1-2 one 3 3 2017-1-2 two 4 4 2017-1-3 two 5 मैं …

3
PySpark में कई डेटा फ़्रेम रो-वार मर्ज करना
मैं 10 डेटा फ्रेम है pyspark.sql.dataframe.DataFrame, से प्राप्त randomSplitके रूप में (td1, td2, td3, td4, td5, td6, td7, td8, td9, td10) = td.randomSplit([.1, .1, .1, .1, .1, .1, .1, .1, .1, .1], seed = 100)अब मैं 9 में शामिल करना चाहते td'एक भी डेटा फ्रेम में है, मुझे लगता है …

3
चक्रीय साधारण विशेषताओं को बदलने का एक अच्छा तरीका क्या है?
मैं अपनी विशेषता के रूप में 'घंटे' क्षेत्र में हूँ, लेकिन यह एक चक्रीय मान लेता है। मैं '23' और '0' घंटे जैसी सूचनाओं को संरक्षित करने के लिए फीचर को कैसे बदल सकता हूं, यह बहुत दूर नहीं है। एक तरीका मुझे लगता है कि परिवर्तन करना है: min(h, …

1
क्या मिनी-बैच के आकार को चुनने के लिए कोई नियम हैं?
तंत्रिका नेटवर्क का प्रशिक्षण करते समय, एक हाइपरपरमीटर एक मिनीबैच का आकार होता है। आम विकल्प 32, 64 और 128 तत्व प्रति मिनी बैच हैं। क्या कोई नियम / दिशानिर्देश हैं कि मिनी-बैच कितना बड़ा होना चाहिए? कोई प्रकाशन जो प्रशिक्षण पर प्रभाव की जांच करता है?

3
मैं Gensim के साथ FastText प्रीट्रेन मॉडल को कैसे लोड करूं?
मैंने फास्टटेक्स प्रीट्रेन मॉडल को फास्टटेक्स मॉडल से लोड करने की कोशिश की । मैं wiki.simple.en का उपयोग कर रहा हूं from gensim.models.keyedvectors import KeyedVectors word_vectors = KeyedVectors.load_word2vec_format('wiki.simple.bin', binary=True) लेकिन, यह निम्नलिखित त्रुटियों को दर्शाता है Traceback (most recent call last): File "nltk_check.py", line 28, in <module> word_vectors = KeyedVectors.load_word2vec_format('wiki.simple.bin', …
21 nlp  gensim 

3
एकाधिक आउटपुट प्रतिगमन के लिए तंत्रिका नेटवर्क
मेरे पास 34 इनपुट कॉलम और 8 आउटपुट कॉलम वाले डेटासेट हैं। समस्या को हल करने का एक तरीका 34 आउटपुट लेना और प्रत्येक आउटपुट कॉलम के लिए व्यक्तिगत प्रतिगमन मॉडल बनाना है। मुझे आश्चर्य है कि क्या यह समस्या सिर्फ एक मॉडल का उपयोग करके हल की जा सकती …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.