डेटा साइंस

2

सत्यापन सेट और परीक्षण सेट दोनों का उपयोग क्यों करें?

एक तंत्रिका नेटवर्क पर विचार करें: दिए गए डेटा के सेट के लिए, हम इसे प्रशिक्षण, सत्यापन और परीक्षण सेट में विभाजित करते हैं। मान लीजिए कि हम इसे 60:20:20 के क्लासिक अनुपात में करते हैं, तो हम नेटवर्क को वैध सेट पर जाँच कर इसे सत्यापित करने से रोकते …

18 machine-learning neural-network cross-validation

7

याद करने पर अधिक सटीक कब महत्वपूर्ण है?

क्या कोई मुझे कुछ उदाहरण दे सकता है जहां परिशुद्धता महत्वपूर्ण है और कुछ उदाहरण जहां याद रखना महत्वपूर्ण है?

18 machine-learning evaluation

1

कैरस अंतर बीट्विन वेल_लॉस और प्रशिक्षण के दौरान नुकसान

केरस में प्रशिक्षण के दौरान val_lossऔर lossउसके बीच क्या अंतर है ? उदाहरण के लिए Epoch 1/20 1000/1000 [==============================] - 1s - loss: 0.1760, val_loss: 0.2032 कुछ साइटों पर मैंने पढ़ा कि सत्यापन पर, ड्रॉपआउट काम नहीं कर रहा था।

18 machine-learning deep-learning keras

3

क्या प्रासंगिकता के लिए आवृत्ति खाता क्लिक करता है?

एक रैंक का निर्माण करते हुए, एक खोज इंजन या एक सिफारिश प्रणाली के लिए कहें, क्या किसी प्रविष्टि की प्रासंगिकता निर्धारित करने के लिए क्लिक आवृत्ति पर भरोसा करना मान्य है?

17 recommender-system information-retrieval

1

क्यों ReLU अन्य सक्रियण कार्यों से बेहतर है

यहां जवाब गायब करने और विस्फोट करने वाले ग्रेडिएंट को संदर्भित करता है जो कि इन sigmoid-एक्टिवेशन फ़ंक्शन के समान है लेकिन, मुझे लगता है, Reluइसका नुकसान है और यह इसका अपेक्षित मूल्य है। के उत्पादन के लिए कोई सीमा नहीं है Reluऔर इसलिए इसका अपेक्षित मूल्य शून्य नहीं है। …

17 machine-learning neural-network deep-learning gradient-descent activation-function

3

संकेतन mAP @ [। 5: .95] का क्या अर्थ है?

पता लगाने के लिए, यह निर्धारित करने का एक सामान्य तरीका है कि एक वस्तु प्रस्ताव सही था , संघ पर अंतरिमता (IoU, IU)। यह प्रस्तावित ऑब्जेक्ट पिक्सल के सेट और सच्चे ऑब्जेक्ट पिक्सेल B के सेट को लेता है और गणना करता है:AAABBB IoU(A,B)=A∩BA∪BIoU(A,B)=A∩BA∪BIoU(A, B) = \frac{A \cap B}{A …

17 computer-vision

2

Doc2Vec - पैराग्राफ को कैसे लेबल करें (gensim)

मैं सोच रहा हूँ कि कैसे (टैग) वाक्यों / अनुच्छेदों / दस्तावेजों को dens2vec के साथ gensim में लेबल किया जाए - एक व्यावहारिक दृष्टिकोण से। क्या आपको अपने स्वयं के अनूठे लेबल (उदाहरण के लिए "Sent_123") के साथ प्रत्येक वाक्य / पैराग्राफ / दस्तावेज़ की आवश्यकता है? यह उपयोगी …

17 machine-learning text-mining word-embeddings word2vec

3

डीप न्यूरल नेटवर्क्स में बैजिंग बनाम ड्रॉपआउट

बैगिंग कई भविष्यवक्ताओं की पीढ़ी है जो एकल भविष्यवक्ता के रूप में काम करने योग्य है। ड्रॉपआउट एक तकनीक है जो तंत्रिका नेटवर्क को सभी संभव सबनेटवर्क को औसत करने के लिए सिखाती है। सबसे महत्वपूर्ण कागल की प्रतियोगिताओं को देखते हुए लगता है कि इस दो तकनीकों का उपयोग …

17 machine-learning neural-network deep-learning

1

पाठ क्लस्टरिंग के लिए एल्गोरिदम

मुझे समूहों में उनके अर्थों द्वारा भारी मात्रा में वाक्यों के क्लस्टरिंग की समस्या है। यह एक समस्या के समान है जब आपके पास बहुत सारे वाक्य हैं और उन्हें उनके अर्थों के साथ समूहित करना चाहते हैं। ऐसा करने के लिए क्या एल्गोरिदम सुझाए गए हैं? मुझे पहले से …

17 clustering text-mining algorithms scikit-learn

4

K- साधन: प्रारंभिक सेंट्रोइड के कुशल सेट को चुनने के लिए कुछ अच्छे तरीके क्या हैं?

जब सेंट्रोइड का एक यादृच्छिक प्रारंभिक उपयोग किया जाता है, तो K- साधनों के विभिन्न रन अलग-अलग कुल SSE का उत्पादन करते हैं। और यह एल्गोरिथम के प्रदर्शन में महत्वपूर्ण है। इस समस्या को हल करने की दिशा में कुछ प्रभावी दृष्टिकोण क्या हैं? हाल के दृष्टिकोणों की सराहना की …

17 data-mining clustering k-means

3

निकटतम पड़ोसी बहुत ही उच्च आयामी डेटा की खोज करते हैं

मेरे पास उपयोगकर्ताओं और उनके द्वारा पसंद किए जाने वाले आइटम का एक बड़ा विरल मैट्रिक्स है (1M उपयोगकर्ताओं और 100K वस्तुओं के क्रम में, बहुत कम स्तर पर)। मैं उन तरीकों की खोज कर रहा हूं जिनमें मैं kNN खोज कर सकता हूं। मेरे डेटासेट के आकार और मेरे …

17 machine-learning distributed map-reduce dimensionality-reduction

4

तंत्रिका नेटवर्क में अतिरिक्त उत्पादन परत (बाइनरी के लिए दशमलव)

मैं ऑनलाइन पुस्तक से एक प्रश्न के माध्यम से काम कर रहा हूँ: http://neuralnetworksanddeeplearning.com/chap1.html मैं समझ सकता हूं कि यदि अतिरिक्त आउटपुट परत 5 आउटपुट न्यूरॉन्स की है, तो मैं संभवतः 0.5 और पिछली परत के लिए 0.5 के वजन पर पूर्वाग्रह स्थापित कर सकता हूं। लेकिन सवाल अब चार …

17 neural-network

6

R में डैशबोर्ड बनाने के लिए आप क्या उपयोग करते हैं?

मुझे समय-समय पर (दैनिक, मासिक) वेब एनालिटिक्स डैशबोर्ड रिपोर्ट तैयार करनी होगी। वे स्थिर होंगे और बातचीत की आवश्यकता नहीं होगी, इसलिए लक्ष्य आउटपुट के रूप में एक पीडीएफ फाइल की कल्पना करें। रिपोर्ट टेबल और चार्ट (मुख्य रूप से स्प्ललाइन और ggplot2 के साथ बनाई गई बुलेट ग्राफ़) को …

17 r visualization

2

डेटा साइंस में नैतिकता कैसे लागू होनी चाहिए

हाल ही में फेसबुक पर अपने उपयोगकर्ताओं पर प्रयोग करके यह देखने के लिए गुस्सा आया था कि क्या वे उपयोगकर्ता की भावनाओं को बदल सकते हैं और अब ठीक है । जब भी मैं एक पेशेवर डेटा वैज्ञानिक नहीं हूं, मैंने कैथी ओ'नील की पुस्तक 'डूइंग डेटा साइंस' से …

17 social-network-analysis

7

एक लाख वर्टिकल के साथ एक ग्राफ की कल्पना

1000000 कोने के साथ एक ग्राफ को देखने के लिए उपयोग करने के लिए सबसे अच्छा उपकरण क्या है? ग्राफ में लगभग 50000 किनारे हैं। और मैं व्यक्तिगत कोने और किनारों के स्थान की गणना कर सकता हूं। मैं एक svg उत्पन्न करने के लिए एक कार्यक्रम लिखने के बारे …

17 visualization graphs