डेटा साइंस

5

विसंगतियों का पता लगाने के माध्यम से बिल्लियों का पता लगाना

मेरे पास एक शौक परियोजना है जिसे मैं मशीन सीखने के अपने अब तक के अनुभव को बढ़ाने के एक तरीके के रूप में करने पर विचार कर रहा हूं। मैंने विषय पर कौरसेरा एमओओसी को लिया और पूरा किया है। मेरा सवाल परियोजना की व्यवहार्यता के संबंध में है। …

17 machine-learning

2

सिमेंटिक विश्लेषण के लिए बड़े डेटा पर कामेच्छा का उपयोग करें

मैं डेटा विश्लेषण करने और सिमेंटिक विश्लेषण समस्या पर वर्गीकरण की भविष्यवाणी करने के लिए Libsvm का उपयोग करता हूं । लेकिन इसमें बड़े पैमाने पर डेटा पर एक प्रदर्शन मुद्दा है, क्योंकि सिमेंटिक विश्लेषण एन-आयाम समस्या की चिंता करता है। पिछले साल, लिब्लिनियर को रिलीज़ किया गया था, और …

17 machine-learning bigdata libsvm

5

हमारे संबंधपरक DBMS में डेटा बड़ा हो रहा है, क्या यह NoSQL पर जाने का समय है?

हमने ई-लर्निंग उद्देश्यों के लिए एक सामाजिक नेटवर्क एप्लिकेशन बनाया। यह एक प्रायोगिक परियोजना है जिसे हम अपनी प्रयोगशाला में शोध कर रहे हैं। इसका उपयोग कुछ केस स्टडी में कुछ समय के लिए किया गया है और हमारे रिलेशनल DBMS (SQL Server 2008) में डेटा बड़ा हो रहा है। …

17 nosql relational-dbms

1

केरेस के फिट फंक्शन का वैलिडेशन_सप्लिट पैरामीटर कैसे काम करता है?

केरस अनुक्रमिक मॉडल फिट फ़ंक्शन में मान्यता-विभाजन https://keras.io/models/fter// पर निम्न के रूप में प्रलेखित है : validation_split: 0 और 1. के बीच फ़्लोट सत्यापन डेटा का उपयोग सत्यापन डेटा के रूप में किया जाएगा। मॉडल प्रशिक्षण डेटा के इस अंश को अलग करेगा, उस पर प्रशिक्षण नहीं देगा, और प्रत्येक …

17 keras data cross-validation

4

किसी भी "नियम के अंगूठे" सुविधाओं की संख्या बनाम उदाहरणों की संख्या पर? (छोटे डेटा सेट)

मुझे आश्चर्य हो रहा है, यदि विशेषताओं की संख्या बनाम टिप्पणियों की संख्या पर कोई अनुमान है। जाहिर है, यदि कई विशेषताओं को टिप्पणियों की संख्या के बराबर है, तो मॉडल ओवरफिट हो जाएगा। विरल तरीकों (LASSO, लोचदार नेट) का उपयोग करके हम मॉडल को कम करने के लिए कई …

17 feature-selection model-selection

3

गहन शिक्षण मॉडल का प्रशिक्षण देते समय मिनी-बैच मेमोरी प्रभाव की गणना कैसे करें?

मैं GPU की आवश्यकता की मात्रा की गणना करने की कोशिश कर रहा हूं, जो मेरे मॉडल को कारपहाटी के इस नोट्स के आधार पर प्रशिक्षित करने के लिए है: http://cs231n.github.io/convolutional-networks/#computational-considerations मेरे नेटवर्क में 532,752 सक्रियण और 19,072,984 पैरामीटर (वज़न और पूर्वाग्रह) हैं। ये सभी 32 बिट फ्लोट मान हैं, …

17 deep-learning tensorflow

2

सहयोगी फ़िल्टरिंग का उपयोग करके अतिरिक्त सुविधाओं के साथ फिल्मों की सिफारिश करना

मैं सहयोगी फ़िल्टरिंग का उपयोग करके एक सिफारिश प्रणाली बनाने की कोशिश कर रहा हूं। मुझे सामान्य [user, movie, rating]जानकारी है। मैं 'भाषा' या 'मूवी की अवधि' जैसी अतिरिक्त सुविधा को शामिल करना चाहूंगा। मुझे यकीन नहीं है कि इस तरह की समस्या के लिए मैं किन तकनीकों का उपयोग …

17 python r recommender-system

2

सहपाठियों की सटीकता कैसे बढ़ाएं?

मैं OpenCV letter_recog.cpp उदाहरण का उपयोग यादृच्छिक वृक्षों और अन्य वर्गीकरणों पर करने के लिए कर रहा हूं। इस उदाहरण में छह क्लासिफायर के कार्यान्वयन हैं - यादृच्छिक पेड़, बूस्टिंग, एमएलपी, केएनएन, भोले बे और एसवीएम। 20000 उदाहरणों और 16 विशेषताओं के साथ यूसीआई अक्षर पहचान डेटासेट का उपयोग किया …

17 machine-learning classification svm accuracy random-forest

5

बाइनरी वर्गीकरण एल्गोरिदम चुनें

मुझे बाइनरी वर्गीकरण की समस्या है: प्रशिक्षण सेट में लगभग 1000 नमूने बाइनरी, न्यूमेरिक और श्रेणीबद्ध सहित 10 विशेषताएँ इस प्रकार की समस्या के लिए कौन सा एल्गोरिदम सबसे अच्छा विकल्प है? डिफ़ॉल्ट रूप से मैं एसवीएम के साथ शुरू करने जा रहा हूं (प्रारंभिक में नाममात्र गुण मान द्विआधारी …

17 classification binary svm random-forest logistic-regression

1

डीप न्यूरल नेटवर्क - ReLU के साथ बैकप्रोपोगेशन

मुझे ReLU के साथ वापस प्रचार प्राप्त करने में कुछ कठिनाई हो रही है, और मैंने कुछ काम किया है, लेकिन मुझे यकीन नहीं है कि मैं सही रास्ते पर हूं। लागत समारोह: 12(y−y^)212(y−y^)2\frac{1}{2}(y-\hat y)^2जहांyyyवास्तविक मूल्य है, और y एक भविष्यवाणी मूल्य है। यह भी मान लें किx> 0 हमेशा।y^y^\hat …

17 neural-network backpropagation

4

शार्क में टफ़रकार्ड फ़ाइल को विभाजित करने का क्या लाभ है?

मैं Tensorflow के साथ भाषण मान्यता पर काम कर रहा हूं और LSTM NN को बड़े पैमाने पर तरंगों के साथ प्रशिक्षित करने की योजना बना रहा हूं। प्रदर्शन लाभ के कारण, मैं tfrecords का उपयोग करने की योजना बना रहा हूं। इंटरनेट पर कई उदाहरण हैं (पूर्व के लिए …

17 python tensorflow

5

सीबॉर्न हीटमैप को बड़ा करें

मैं corr()एक मूल df से df बनाता हूं । corr()Df बाहर 70 एक्स 70 में आया और यह हीटमैप कल्पना करने के लिए असंभव है ... sns.heatmap(df)। अगर मैं प्रदर्शित करने की कोशिश करता हूं corr = df.corr(), तो तालिका स्क्रीन पर फिट नहीं होती है और मैं सभी सहसंबंधों …

17 visualization pandas plotting machine-learning neural-network svm decision-trees svm efficiency python linear-regression machine-learning nlp topic-model lda named-entity-recognition naive-bayes-classifier association-rules fuzzy-logic kaggle deep-learning tensorflow inception classification feature-selection feature-engineering machine-learning scikit-learn tensorflow keras encoding nlp text-mining nlp rnn python neural-network feature-extraction machine-learning predictive-modeling python r linear-regression clustering r ggplot2 neural-network neural-network training python neural-network deep-learning rnn predictive-modeling databases sql programming distribution dataset cross-validation neural-network deep-learning rnn machine-learning machine-learning python deep-learning data-mining tensorflow visualization tools sql embeddings orange feature-extraction unsupervised-learning gan machine-learning python data-mining pandas machine-learning data-mining bigdata apache-spark apache-hadoop deep-learning python convnet keras aggregation clustering k-means r random-forest decision-trees reference-request visualization data pandas plotting neural-network keras rnn theano deep-learning tensorflow inception predictive-modeling deep-learning regression sentiment-analysis nlp encoding deep-learning python scikit-learn lda convnet keras predictive-modeling regression overfitting regression svm prediction machine-learning similarity word2vec information-retrieval word-embeddings neural-network deep-learning rnn

5

प्रदर्शन में सुधार करने के लिए मशीन सीखने में विरल और सघन डेटा को जोड़ना

मेरे पास विरल विशेषताएं हैं जो भविष्य कहनेवाला हैं, साथ ही मेरे पास कुछ सघन विशेषताएं हैं जो भविष्य कहनेवाला हैं। मुझे क्लासिफायर के समग्र प्रदर्शन को बेहतर बनाने के लिए इन विशेषताओं को एक साथ जोड़ना होगा। अब, बात यह है कि जब मैं इन्हें एक साथ मिलाने की …

17 machine-learning classification predictive-modeling scikit-learn supervised-learning

2

क्या हमें डेटा के परीक्षण के लिए सामान्यीकरण लागू करना चाहिए?

मैं लेखक की पहचान की समस्या पर एक परियोजना कर रहा हूं। मैंने डेटा को प्रशिक्षित करने के लिए tf-idf सामान्यीकरण लागू किया था और फिर उस डेटा पर एक svm प्रशिक्षित किया था। अब क्लासिफायर का उपयोग करते समय मुझे टेस्ट डेटा को भी सामान्य करना चाहिए। मुझे लगता …

17 machine-learning neural-network deep-learning

4

क्या पांडा अब डेटा से अधिक तेज है।

https://github.com/Rdatatable/data.table/wiki/Benchmarks-%3A-Grouping 2014 के बाद से डेटाटेबल बेंचमार्क को अपडेट नहीं किया गया है। मैंने सुना है कि Pandasअब इससे कहीं तेज है data.table। क्या ये सच है? क्या किसी ने कोई बेंचमार्क किया है? मैंने पहले कभी पायथन का उपयोग नहीं किया है, लेकिन स्विच करने पर विचार pandasकर सकता …

17 python r pandas data data.table