डेटा साइंस

डेटा विज्ञान पेशेवरों, मशीन लर्निंग विशेषज्ञों और क्षेत्र के बारे में अधिक जानने में दिलचस्पी रखने वालों के लिए प्रश्नोत्तर

3
शब्द-आधारित और चार-आधारित पाठ पीढ़ी RNN के बीच क्या अंतर है?
आवर्तक तंत्रिका नेटवर्क के साथ पाठ पीढ़ी के बारे में पढ़ते हुए मैंने देखा कि कुछ उदाहरणों को शब्द और दूसरों के चरित्र द्वारा पाठ शब्द उत्पन्न करने के लिए कार्यान्वित किया गया था, वास्तव में ऐसा क्यों किए बिना। तो, RNN मॉडल के बीच अंतर क्या है जो पाठ …

3
प्रतिबंधित बोल्ट्जमान मशीन (RBM) के पीछे अंतर्ज्ञान
मैं कौरसेरा पर ज्योफ हिंट्स न्यूरल नेटवर्क्स पाठ्यक्रम के माध्यम से गया और प्रतिबंधित बोल्ट्जमन मशीनों के परिचय के माध्यम से , फिर भी मैं आरबीएम के पीछे के अंतर्ज्ञान को नहीं समझ पाया। हमें इस मशीन में ऊर्जा की गणना करने की आवश्यकता क्यों है? और इस मशीन में …

4
आर: GPU पर मशीन सीखने
क्या आर के लिए कोई मशीन लर्निंग पैकेज हैं जो प्रशिक्षण की गति में सुधार करने के लिए जीपीयू का उपयोग कर सकते हैं (पाइथो दुनिया से थीनो जैसा कुछ)? मैं देखता हूं कि एक पैकेज है जिसे gputools कहा जाता है जो gpu पर कोड के निष्पादन की अनुमति …

5
छिपे हुए मार्कोव मॉडल को लागू करने के लिए पायथन लाइब्रेरी
छिपे हुए मार्कोव मॉडल को लागू करने के लिए मैं किस स्थिर पायथन लाइब्रेरी का उपयोग कर सकता हूं? मुझे इसकी उचित रूप से अच्छी तरह से प्रलेखित होने की आवश्यकता है, क्योंकि मैंने वास्तव में पहले कभी इस मॉडल का उपयोग नहीं किया है। वैकल्पिक रूप से, क्या एचएमएम …

4
स्काला का उपयोग करते हुए डेटा साइंस टूल्स
मुझे पता है कि स्पार्क पूरी तरह से स्काला के साथ एकीकृत है। यह उपयोग का मामला विशेष रूप से बड़े डेटा सेट के लिए है। किन अन्य साधनों में अच्छा स्काला समर्थन है? क्या स्काला बड़े डेटा सेट के लिए सबसे उपयुक्त है? या यह छोटे डेटा सेट के …

2
Hadoop और noSQL में क्या अंतर है
मैंने लोगों को उनके डेटा (बड़े डेटा वातावरण) को संसाधित करने में मदद करने के लिए कई उपकरणों / रूपरेखाओं के बारे में सुना। एक को Hadoop और दूसरे को noSQL कॉन्सेप्ट कहा जाता है। प्रसंस्करण के बिंदु में क्या अंतर है? क्या वे पूरक हैं?

4
महत्वपूर्ण विशेषताओं को कैसे निर्दिष्ट करें?
कई डेटा स्रोतों से बना शिथिल संरचित डेटा (जैसे वेब टेबल / लिंक्ड ओपन डेटा) का एक सेट मान लें। डेटा के बाद कोई सामान्य स्कीमा नहीं है और प्रत्येक स्रोत मूल्यों का वर्णन करने के लिए समानार्थी विशेषताओं का उपयोग कर सकता है (उदाहरण के लिए "राष्ट्रीयता" बनाम "जन्मजात")। …

3
हम तिरछे डेटा को सामान्य वितरण में क्यों बदलते हैं
मैं कागल ( हाउस प्राइस पर मानव एनालॉग कर्नेल: आवास प्रतिगमन तकनीक ) पर आवास की कीमतों की प्रतियोगिता के समाधान के माध्यम से जा रहा था और इस हिस्से में आया था: # Transform the skewed numeric features by taking log(feature + 1). # This will make the features …

2
खिड़की फिसलने से LSTM में ओवरफिटिंग होती है?
अगर मैं इसे स्लाइडिंग-विंडो दृष्टिकोण के माध्यम से प्रशिक्षित करता हूं, तो क्या मैं अपना LSTM ओवरफिट करूंगा? लोग LSTM के लिए इसका उपयोग क्यों नहीं करते हैं? एक सरल उदाहरण के लिए, मान लें कि हमें पात्रों के अनुक्रम की भविष्यवाणी करनी है: A B C D E F …

4
दो शब्दों के बीच समानता
मैं एक पायथन लाइब्रेरी की तलाश कर रहा हूं जो मुझे दो शब्दों या वाक्यों के बीच समानता की पहचान करने में मदद करती है। मैं ऑडियो टू टेक्स्ट रूपांतरण कर रहा हूं, जिसके परिणामस्वरूप एक अंग्रेजी शब्दकोश या गैर शब्दकोश शब्द होगा (यह एक व्यक्ति या कंपनी का नाम …
15 nlp  nltk 

1
दिए गए पाठ में एक निश्चित चरित्र के बाद तार को हटा देना
मेरे पास नीचे की तरह एक डाटासेट है। मैं चरित्र के बाद सभी पात्रों को हटाना चाहता हूं ©। आर में मैं कैसे कर सकता हूं? data_clean_phrase <- c("Copyright © The Society of Geomagnetism and Earth", "© 2013 Chinese National Committee ") data_clean_df <- as.data.frame(data_clean_phrase)
15 r  data-cleaning 

2
सक्रियण कार्यों को एकरस क्यों होना पड़ता है?
मैं वर्तमान में तंत्रिका नेटवर्क पर एक परीक्षा की तैयारी कर रहा हूं। पूर्व परीक्षाओं के कई प्रोटोकॉल में मैंने पढ़ा है कि न्यूरॉन्स (बहुपरत पेसेप्ट्रॉन में) के सक्रियण कार्य को मोनोनिक होना चाहिए। मैं समझता हूं कि सक्रियण कार्य अलग-अलग होने चाहिए, एक व्युत्पन्न होना चाहिए जो कि अधिकांश …

5
मुक्त स्रोत डेटा विज्ञान परियोजनाओं का योगदान करने के लिए
खुले स्रोत परियोजनाओं में योगदान आम तौर पर newbies के लिए कुछ अभ्यास प्राप्त करने और अनुभवी डेटा वैज्ञानिकों और विश्लेषकों के लिए एक नए क्षेत्र का प्रयास करने का एक अच्छा तरीका है। आप किन परियोजनाओं में योगदान करते हैं? कृपया जीथब पर कुछ परिचय + लिंक प्रदान करें।

2
K- साधन बनाम ऑनलाइन K- साधन
K- साधन क्लस्टरिंग के लिए एक प्रसिद्ध एल्गोरिथ्म है, लेकिन इस तरह के एल्गोरिथ्म (ऑनलाइन K- साधन) का ऑनलाइन रूपांतर भी है। इन तरीकों के पक्ष और विपक्ष क्या हैं, और प्रत्येक को कब प्राथमिकता दी जानी चाहिए?

2
महतो में आइटम आधारित और उपयोगकर्ता आधारित अनुशंसा अंतर
मैं जानना चाहता हूं कि उपयोगकर्ता आधारित और आइटम आधारित अनुशंसा बिल्कुल एक दूसरे से कैसे भिन्न हैं। यह परिभाषित करता है उपयोगकर्ता-आधारित : समान उपयोगकर्ताओं को ढूंढकर आइटम सुझाएं। उपयोगकर्ताओं की गतिशील प्रकृति के कारण इसे मापना कठिन है। आइटम-आधारित : वस्तुओं के बीच समानता की गणना करें और …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.