डेटा साइंस

डेटा विज्ञान पेशेवरों, मशीन लर्निंग विशेषज्ञों और क्षेत्र के बारे में अधिक जानने में दिलचस्पी रखने वालों के लिए प्रश्नोत्तर

2
सत्यापन सेट और परीक्षण सेट दोनों का उपयोग क्यों करें?
एक तंत्रिका नेटवर्क पर विचार करें: दिए गए डेटा के सेट के लिए, हम इसे प्रशिक्षण, सत्यापन और परीक्षण सेट में विभाजित करते हैं। मान लीजिए कि हम इसे 60:20:20 के क्लासिक अनुपात में करते हैं, तो हम नेटवर्क को वैध सेट पर जाँच कर इसे सत्यापित करने से रोकते …


1
कैरस अंतर बीट्विन वेल_लॉस और प्रशिक्षण के दौरान नुकसान
केरस में प्रशिक्षण के दौरान val_lossऔर lossउसके बीच क्या अंतर है ? उदाहरण के लिए Epoch 1/20 1000/1000 [==============================] - 1s - loss: 0.1760, val_loss: 0.2032 कुछ साइटों पर मैंने पढ़ा कि सत्यापन पर, ड्रॉपआउट काम नहीं कर रहा था।

3
क्या प्रासंगिकता के लिए आवृत्ति खाता क्लिक करता है?
एक रैंक का निर्माण करते हुए, एक खोज इंजन या एक सिफारिश प्रणाली के लिए कहें, क्या किसी प्रविष्टि की प्रासंगिकता निर्धारित करने के लिए क्लिक आवृत्ति पर भरोसा करना मान्य है?

1
क्यों ReLU अन्य सक्रियण कार्यों से बेहतर है
यहां जवाब गायब करने और विस्फोट करने वाले ग्रेडिएंट को संदर्भित करता है जो कि इन sigmoid-एक्टिवेशन फ़ंक्शन के समान है लेकिन, मुझे लगता है, Reluइसका नुकसान है और यह इसका अपेक्षित मूल्य है। के उत्पादन के लिए कोई सीमा नहीं है Reluऔर इसलिए इसका अपेक्षित मूल्य शून्य नहीं है। …

3
संकेतन mAP @ [। 5: .95] का क्या अर्थ है?
पता लगाने के लिए, यह निर्धारित करने का एक सामान्य तरीका है कि एक वस्तु प्रस्ताव सही था , संघ पर अंतरिमता (IoU, IU)। यह प्रस्तावित ऑब्जेक्ट पिक्सल के सेट और सच्चे ऑब्जेक्ट पिक्सेल B के सेट को लेता है और गणना करता है:AAABBB IoU(A,B)=A∩BA∪BIoU(A,B)=A∩BA∪BIoU(A, B) = \frac{A \cap B}{A …

2
Doc2Vec - पैराग्राफ को कैसे लेबल करें (gensim)
मैं सोच रहा हूँ कि कैसे (टैग) वाक्यों / अनुच्छेदों / दस्तावेजों को dens2vec के साथ gensim में लेबल किया जाए - एक व्यावहारिक दृष्टिकोण से। क्या आपको अपने स्वयं के अनूठे लेबल (उदाहरण के लिए "Sent_123") के साथ प्रत्येक वाक्य / पैराग्राफ / दस्तावेज़ की आवश्यकता है? यह उपयोगी …

3
डीप न्यूरल नेटवर्क्स में बैजिंग बनाम ड्रॉपआउट
बैगिंग कई भविष्यवक्ताओं की पीढ़ी है जो एकल भविष्यवक्ता के रूप में काम करने योग्य है। ड्रॉपआउट एक तकनीक है जो तंत्रिका नेटवर्क को सभी संभव सबनेटवर्क को औसत करने के लिए सिखाती है। सबसे महत्वपूर्ण कागल की प्रतियोगिताओं को देखते हुए लगता है कि इस दो तकनीकों का उपयोग …

1
पाठ क्लस्टरिंग के लिए एल्गोरिदम
मुझे समूहों में उनके अर्थों द्वारा भारी मात्रा में वाक्यों के क्लस्टरिंग की समस्या है। यह एक समस्या के समान है जब आपके पास बहुत सारे वाक्य हैं और उन्हें उनके अर्थों के साथ समूहित करना चाहते हैं। ऐसा करने के लिए क्या एल्गोरिदम सुझाए गए हैं? मुझे पहले से …

4
K- साधन: प्रारंभिक सेंट्रोइड के कुशल सेट को चुनने के लिए कुछ अच्छे तरीके क्या हैं?
जब सेंट्रोइड का एक यादृच्छिक प्रारंभिक उपयोग किया जाता है, तो K- साधनों के विभिन्न रन अलग-अलग कुल SSE का उत्पादन करते हैं। और यह एल्गोरिथम के प्रदर्शन में महत्वपूर्ण है। इस समस्या को हल करने की दिशा में कुछ प्रभावी दृष्टिकोण क्या हैं? हाल के दृष्टिकोणों की सराहना की …

3
निकटतम पड़ोसी बहुत ही उच्च आयामी डेटा की खोज करते हैं
मेरे पास उपयोगकर्ताओं और उनके द्वारा पसंद किए जाने वाले आइटम का एक बड़ा विरल मैट्रिक्स है (1M उपयोगकर्ताओं और 100K वस्तुओं के क्रम में, बहुत कम स्तर पर)। मैं उन तरीकों की खोज कर रहा हूं जिनमें मैं kNN खोज कर सकता हूं। मेरे डेटासेट के आकार और मेरे …

4
तंत्रिका नेटवर्क में अतिरिक्त उत्पादन परत (बाइनरी के लिए दशमलव)
मैं ऑनलाइन पुस्तक से एक प्रश्न के माध्यम से काम कर रहा हूँ: http://neuralnetworksanddeeplearning.com/chap1.html मैं समझ सकता हूं कि यदि अतिरिक्त आउटपुट परत 5 आउटपुट न्यूरॉन्स की है, तो मैं संभवतः 0.5 और पिछली परत के लिए 0.5 के वजन पर पूर्वाग्रह स्थापित कर सकता हूं। लेकिन सवाल अब चार …

6
R में डैशबोर्ड बनाने के लिए आप क्या उपयोग करते हैं?
मुझे समय-समय पर (दैनिक, मासिक) वेब एनालिटिक्स डैशबोर्ड रिपोर्ट तैयार करनी होगी। वे स्थिर होंगे और बातचीत की आवश्यकता नहीं होगी, इसलिए लक्ष्य आउटपुट के रूप में एक पीडीएफ फाइल की कल्पना करें। रिपोर्ट टेबल और चार्ट (मुख्य रूप से स्प्ललाइन और ggplot2 के साथ बनाई गई बुलेट ग्राफ़) को …
17 r  visualization 

2
डेटा साइंस में नैतिकता कैसे लागू होनी चाहिए
हाल ही में फेसबुक पर अपने उपयोगकर्ताओं पर प्रयोग करके यह देखने के लिए गुस्सा आया था कि क्या वे उपयोगकर्ता की भावनाओं को बदल सकते हैं और अब ठीक है । जब भी मैं एक पेशेवर डेटा वैज्ञानिक नहीं हूं, मैंने कैथी ओ'नील की पुस्तक 'डूइंग डेटा साइंस' से …

7
एक लाख वर्टिकल के साथ एक ग्राफ की कल्पना
1000000 कोने के साथ एक ग्राफ को देखने के लिए उपयोग करने के लिए सबसे अच्छा उपकरण क्या है? ग्राफ में लगभग 50000 किनारे हैं। और मैं व्यक्तिगत कोने और किनारों के स्थान की गणना कर सकता हूं। मैं एक svg उत्पन्न करने के लिए एक कार्यक्रम लिखने के बारे …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.