डेटा साइंस

3

शब्द-आधारित और चार-आधारित पाठ पीढ़ी RNN के बीच क्या अंतर है?

आवर्तक तंत्रिका नेटवर्क के साथ पाठ पीढ़ी के बारे में पढ़ते हुए मैंने देखा कि कुछ उदाहरणों को शब्द और दूसरों के चरित्र द्वारा पाठ शब्द उत्पन्न करने के लिए कार्यान्वित किया गया था, वास्तव में ऐसा क्यों किए बिना। तो, RNN मॉडल के बीच अंतर क्या है जो पाठ …

15 machine-learning neural-network nlp rnn

3

प्रतिबंधित बोल्ट्जमान मशीन (RBM) के पीछे अंतर्ज्ञान

मैं कौरसेरा पर ज्योफ हिंट्स न्यूरल नेटवर्क्स पाठ्यक्रम के माध्यम से गया और प्रतिबंधित बोल्ट्जमन मशीनों के परिचय के माध्यम से , फिर भी मैं आरबीएम के पीछे के अंतर्ज्ञान को नहीं समझ पाया। हमें इस मशीन में ऊर्जा की गणना करने की आवश्यकता क्यों है? और इस मशीन में …

15 unsupervised-learning rbm

4

आर: GPU पर मशीन सीखने

क्या आर के लिए कोई मशीन लर्निंग पैकेज हैं जो प्रशिक्षण की गति में सुधार करने के लिए जीपीयू का उपयोग कर सकते हैं (पाइथो दुनिया से थीनो जैसा कुछ)? मैं देखता हूं कि एक पैकेज है जिसे gputools कहा जाता है जो gpu पर कोड के निष्पादन की अनुमति …

15 machine-learning r gpu

5

छिपे हुए मार्कोव मॉडल को लागू करने के लिए पायथन लाइब्रेरी

छिपे हुए मार्कोव मॉडल को लागू करने के लिए मैं किस स्थिर पायथन लाइब्रेरी का उपयोग कर सकता हूं? मुझे इसकी उचित रूप से अच्छी तरह से प्रलेखित होने की आवश्यकता है, क्योंकि मैंने वास्तव में पहले कभी इस मॉडल का उपयोग नहीं किया है। वैकल्पिक रूप से, क्या एचएमएम …

15 python time-series markov-process

4

स्काला का उपयोग करते हुए डेटा साइंस टूल्स

मुझे पता है कि स्पार्क पूरी तरह से स्काला के साथ एकीकृत है। यह उपयोग का मामला विशेष रूप से बड़े डेटा सेट के लिए है। किन अन्य साधनों में अच्छा स्काला समर्थन है? क्या स्काला बड़े डेटा सेट के लिए सबसे उपयुक्त है? या यह छोटे डेटा सेट के …

15 scalability scala

2

Hadoop और noSQL में क्या अंतर है

मैंने लोगों को उनके डेटा (बड़े डेटा वातावरण) को संसाधित करने में मदद करने के लिए कई उपकरणों / रूपरेखाओं के बारे में सुना। एक को Hadoop और दूसरे को noSQL कॉन्सेप्ट कहा जाता है। प्रसंस्करण के बिंदु में क्या अंतर है? क्या वे पूरक हैं?

15 nosql tools processing apache-hadoop

4

महत्वपूर्ण विशेषताओं को कैसे निर्दिष्ट करें?

कई डेटा स्रोतों से बना शिथिल संरचित डेटा (जैसे वेब टेबल / लिंक्ड ओपन डेटा) का एक सेट मान लें। डेटा के बाद कोई सामान्य स्कीमा नहीं है और प्रत्येक स्रोत मूल्यों का वर्णन करने के लिए समानार्थी विशेषताओं का उपयोग कर सकता है (उदाहरण के लिए "राष्ट्रीयता" बनाम "जन्मजात")। …

15 machine-learning statistics feature-selection

3

हम तिरछे डेटा को सामान्य वितरण में क्यों बदलते हैं

मैं कागल ( हाउस प्राइस पर मानव एनालॉग कर्नेल: आवास प्रतिगमन तकनीक ) पर आवास की कीमतों की प्रतियोगिता के समाधान के माध्यम से जा रहा था और इस हिस्से में आया था: # Transform the skewed numeric features by taking log(feature + 1). # This will make the features …

15 regression feature-extraction feature-engineering kaggle feature-scaling

2

खिड़की फिसलने से LSTM में ओवरफिटिंग होती है?

अगर मैं इसे स्लाइडिंग-विंडो दृष्टिकोण के माध्यम से प्रशिक्षित करता हूं, तो क्या मैं अपना LSTM ओवरफिट करूंगा? लोग LSTM के लिए इसका उपयोग क्यों नहीं करते हैं? एक सरल उदाहरण के लिए, मान लें कि हमें पात्रों के अनुक्रम की भविष्यवाणी करनी है: A B C D E F …

15 lstm backpropagation mini-batch-gradient-descent

4

दो शब्दों के बीच समानता

मैं एक पायथन लाइब्रेरी की तलाश कर रहा हूं जो मुझे दो शब्दों या वाक्यों के बीच समानता की पहचान करने में मदद करती है। मैं ऑडियो टू टेक्स्ट रूपांतरण कर रहा हूं, जिसके परिणामस्वरूप एक अंग्रेजी शब्दकोश या गैर शब्दकोश शब्द होगा (यह एक व्यक्ति या कंपनी का नाम …

15 nlp nltk

1

दिए गए पाठ में एक निश्चित चरित्र के बाद तार को हटा देना

मेरे पास नीचे की तरह एक डाटासेट है। मैं चरित्र के बाद सभी पात्रों को हटाना चाहता हूं ©। आर में मैं कैसे कर सकता हूं? data_clean_phrase <- c("Copyright © The Society of Geomagnetism and Earth", "© 2013 Chinese National Committee ") data_clean_df <- as.data.frame(data_clean_phrase)

15 r data-cleaning

2

सक्रियण कार्यों को एकरस क्यों होना पड़ता है?

मैं वर्तमान में तंत्रिका नेटवर्क पर एक परीक्षा की तैयारी कर रहा हूं। पूर्व परीक्षाओं के कई प्रोटोकॉल में मैंने पढ़ा है कि न्यूरॉन्स (बहुपरत पेसेप्ट्रॉन में) के सक्रियण कार्य को मोनोनिक होना चाहिए। मैं समझता हूं कि सक्रियण कार्य अलग-अलग होने चाहिए, एक व्युत्पन्न होना चाहिए जो कि अधिकांश …

15 machine-learning neural-network

5

मुक्त स्रोत डेटा विज्ञान परियोजनाओं का योगदान करने के लिए

खुले स्रोत परियोजनाओं में योगदान आम तौर पर newbies के लिए कुछ अभ्यास प्राप्त करने और अनुभवी डेटा वैज्ञानिकों और विश्लेषकों के लिए एक नए क्षेत्र का प्रयास करने का एक अच्छा तरीका है। आप किन परियोजनाओं में योगदान करते हैं? कृपया जीथब पर कुछ परिचय + लिंक प्रदान करें।

15 beginner open-source

2

K- साधन बनाम ऑनलाइन K- साधन

K- साधन क्लस्टरिंग के लिए एक प्रसिद्ध एल्गोरिथ्म है, लेकिन इस तरह के एल्गोरिथ्म (ऑनलाइन K- साधन) का ऑनलाइन रूपांतर भी है। इन तरीकों के पक्ष और विपक्ष क्या हैं, और प्रत्येक को कब प्राथमिकता दी जानी चाहिए?

15 clustering algorithms k-means

2

महतो में आइटम आधारित और उपयोगकर्ता आधारित अनुशंसा अंतर

मैं जानना चाहता हूं कि उपयोगकर्ता आधारित और आइटम आधारित अनुशंसा बिल्कुल एक दूसरे से कैसे भिन्न हैं। यह परिभाषित करता है उपयोगकर्ता-आधारित : समान उपयोगकर्ताओं को ढूंढकर आइटम सुझाएं। उपयोगकर्ताओं की गतिशील प्रकृति के कारण इसे मापना कठिन है। आइटम-आधारित : वस्तुओं के बीच समानता की गणना करें और …

15 machine-learning data-mining algorithms recommender-system