डेटा साइंस

डेटा विज्ञान पेशेवरों, मशीन लर्निंग विशेषज्ञों और क्षेत्र के बारे में अधिक जानने में दिलचस्पी रखने वालों के लिए प्रश्नोत्तर

10
क्या मशीन लर्निंग एल्गोरिदम खेल के स्कोर या नाटकों की भविष्यवाणी कर सकता है?
मेरे पास विभिन्न प्रकार के एनएफएल डेटासेट हैं जो मुझे लगता है कि एक अच्छा साइड-प्रोजेक्ट बना सकते हैं, लेकिन मैंने अभी तक उनके साथ कुछ भी नहीं किया है। इस साइट पर आकर मैंने मशीन लर्निंग एल्गोरिदम के बारे में सोचा और मैं सोच रहा था कि फुटबॉल के …

5
GBM बनाम XGBOOST? मुख्य अंतर?
मैं GBM और XGBOOST के बीच महत्वपूर्ण अंतर को समझने की कोशिश कर रहा हूं। मैंने इसे Google करने की कोशिश की, लेकिन दोनों एल्गोरिदम के बीच अंतर को समझाते हुए कोई अच्छा जवाब नहीं मिल सका और क्यों xgboost लगभग हमेशा GBM से बेहतर प्रदर्शन करता है। क्या है …

3
कब क्या उपयोग करना है - मशीन लर्निंग [बंद]
हाल ही में UPC / बार्सिलोना में प्रोफेसर ओरियोल पुजोल से मशीन लर्निंग क्लास में उन्होंने मशीन लर्निंग संबंधित कार्य की एक विस्तृत श्रृंखला के लिए उपयोग करने के लिए सबसे सामान्य एल्गोरिदम, सिद्धांतों और अवधारणाओं का वर्णन किया। यहाँ मैं उन्हें आपके साथ साझा करता हूं और आपसे पूछता …

3
क्या Keras में बैच_साइज़ का परिणाम की गुणवत्ता में कोई प्रभाव पड़ता है?
मैं 2-3 मिलियन लेखों के साथ एक बड़े LSTM नेटवर्क को प्रशिक्षित करने और मेमोरी एरर के साथ संघर्ष कर रहा हूं (मैं AWS EC2 g2x2large का उपयोग करता हूं)। मुझे पता चला कि इसका एक समाधान कम करना है batch_size। हालांकि, मुझे यकीन नहीं है कि यह पैरामीटर केवल …

9
क्या मुझे डेटा साइंटिस्ट बनने के लिए Hadoop सीखना आवश्यक है?
एक आकांक्षी डेटा वैज्ञानिक यहाँ। मुझे Hadoop के बारे में कुछ भी पता नहीं है, लेकिन जैसा कि मैंने डाटा साइंस और बिग डेटा के बारे में पढ़ा है, मैं Hadoop के बारे में बहुत सारी बातें देखता हूं। क्या Hadoop को Data Scientist के लिए सीखना बिल्कुल आवश्यक है?

3
"अनुवाद करने के लिए समानार्थी" और "अनुवाद करने के लिए अपरिवर्तनीय" में क्या अंतर है
मैं अनुवाद करने के लिए अनुवाद और अपरिवर्तनीय के बीच के अंतर को समझने में परेशानी महसूस कर रहा हूं । पुस्तक डीप लर्निंग में । एमआईटी प्रेस, 2016 (आई। गुडफेलो, ए। कोर्टविल, और वाई। बेंगियो), कोई भी व्यक्ति नेटवर्क पर पा सकता है: [...] पैरामीटर शेयरिंग का विशेष रूप …

11
क्या डेटा वैज्ञानिक एक्सेल का उपयोग करते हैं?
मैं खुद को एक ट्रैवलमैन डेटा वैज्ञानिक मानूंगा। अधिकांश की तरह (मुझे लगता है), मैंने अपने पहले चार्ट बनाए और एक्सेल का उपयोग करते हुए हाई स्कूल और कॉलेज में अपना पहला एकत्रीकरण किया। जैसा कि मैंने कॉलेज, ग्रेड स्कूल और ~ 7 साल के कार्य अनुभव के माध्यम से …
37 tools  career  excel 

2
XGBoost महत्व के आउटपुट की व्याख्या कैसे करें?
मैंने एक xgboost मॉडल चलाया। मैं बिल्कुल नहीं जानता कि कैसे आउटपुट की व्याख्या करना है xgb.importance। लाभ, आच्छादन और आवृत्ति का अर्थ क्या है और हम उनकी व्याख्या कैसे करते हैं? इसके अलावा, स्प्लिट, RealCover और RealCover% का क्या मतलब है? मेरे पास यहां कुछ अतिरिक्त पैरामीटर हैं क्या …

5
क्या स्किट-लर्न में फॉरवर्ड सिलेक्शन / स्टेप वाइज रिग्रेशन अल्गोरिथम है?
मैं बहुत अधिक सुविधाओं के साथ समस्या पर काम कर रहा हूं और मेरे मॉडल को प्रशिक्षित करने में बहुत लंबा समय लगता है। मैंने सुविधाओं को चुनने के लिए आगे के चयन एल्गोरिथ्म को लागू किया। हालाँकि, मैं सोच रहा था कि भविष्य में चयन / स्टेप वाइज रिग्रेशन …

3
पंडों के साथ सहसंबंध मैट्रिक्स की गणना और दृश्य
मेरे पास कई प्रविष्टियों के साथ एक पांडा डेटा फ्रेम है, और मैं कुछ प्रकार की दुकानों की आय के बीच सहसंबंध की गणना करना चाहता हूं। आय डेटा के साथ कई स्टोर हैं, गतिविधि के क्षेत्र का वर्गीकरण (थिएटर, कपड़ा स्टोर, भोजन ...) और अन्य डेटा। मैंने एक नया …

13
डेटा साइंस सर्टिफिकेशन से आप क्या समझते हैं?
मैंने अब दो डेटा साइंस सर्टिफिकेशन प्रोग्राम देखे हैं - जॉन हॉपकिंस एक जो कौरसेरा और क्लूडेरा एक में उपलब्ध है । मुझे यकीन है कि वहाँ अन्य लोग भी हैं। जॉन हॉपकिंस कक्षाओं का सेट आर पर एक टूलसेट के रूप में केंद्रित है, लेकिन इसमें कई विषय शामिल …
35 education 

13
डेटा विज्ञान से संबंधित मजेदार उद्धरण
यह अलग-अलग समुदायों के उपयोगकर्ताओं के लिए उनके क्षेत्रों के बारे में मज़ेदार बातें उद्धृत करने के लिए प्रथागत है । मशीन लर्निंग, डीप लर्निंग, डेटा साइंस और हर दिन आपके सामने आने वाली चीजों के बारे में अपनी मज़ेदार बातें साझा करना मज़ेदार हो सकता है!

6
पर्यवेक्षित शिक्षण में, सहसंबद्ध सुविधाओं का होना बुरा क्यों है?
मैंने कहीं पढ़ा है कि अगर हमारे पास ऐसी विशेषताएं हैं जो बहुत अधिक सहसंबद्ध हैं, तो हमें एक को हटाना होगा, क्योंकि इससे मॉडल खराब हो सकता है। यह स्पष्ट है कि सहसंबंधित सुविधाओं का मतलब है कि वे एक ही जानकारी लाते हैं, इसलिए उनमें से एक को …

6
क्रॉस-एन्ट्रापी लॉस स्पष्टीकरण
मान लीजिए कि मैं वर्गीकरण के लिए एक एनएन का निर्माण करता हूं। अंतिम परत सॉफ्टमेक्स सक्रियण के साथ घनी परत है। मेरे पास वर्गीकृत करने के लिए पांच अलग-अलग वर्ग हैं। एक भी प्रशिक्षण उदाहरण के लिए मान लीजिए, true labelहै [1 0 0 0 0]जबकि भविष्यवाणियों हो [0.1 …

1
`केरस` के` डेंस` और `टाइमडिस्टेव्डडेंस` के बीच का अंतर
मैं अभी भी बीच अंतर के बारे में भ्रमित कर रहा हूँ Denseऔर TimeDistributedDenseकी Kerasभले ही पहले से ही कुछ इसी तरह के सवाल पूछे देखते हैं यहाँ और यहाँ । लोग बहुत चर्चा कर रहे हैं लेकिन कोई आम सहमति निष्कर्ष नहीं है। और यहां तक ​​कि, यहाँ , …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.