डाटा साइंस को सेल्फ लर्न कैसे करें? [बन्द है]


16

मैं एक स्व-सिखाया वेब डेवलपर हूं और खुद को डेटा साइंस सिखाने में दिलचस्पी रखता हूं, लेकिन मैं इस बारे में अनिश्चित हूं कि कैसे शुरू किया जाए। विशेष रूप से, मैं सोच रहा हूँ:

  1. डेटा विज्ञान के भीतर कौन से क्षेत्र हैं? (जैसे, आर्टिफिशियल इंटेलिजेंस, मशीन लर्निंग, डेटा विश्लेषण, आदि)
  2. क्या ऑनलाइन क्लास के लोग सिफारिश कर सकते हैं?
  3. क्या ऐसी परियोजनाएं उपलब्ध हैं जिन्हें मैं अभ्यास कर सकता हूं (जैसे, खुले डेटासेट)।
  4. क्या ऐसे प्रमाणपत्र हैं जो मैं पूरा या लागू कर सकता हूं?

जवाबों:


15

साइट पर आपका स्वागत है, मार्टिन! यह एक बहुत व्यापक प्रश्न है, इसलिए आप शायद विभिन्न प्रकार के उत्तर प्राप्त करने जा रहे हैं। यहाँ मेरा ले रहा है।

  1. डाटा साइंस एक अंतःविषय क्षेत्र है जिसे आम तौर पर शास्त्रीय सांख्यिकी, मशीन सीखने और कंप्यूटर विज्ञान (फिर से, यह इस बात पर निर्भर करता है कि आप किससे पूछते हैं, लेकिन यह यहाँ पर व्यवसायिक बुद्धिमत्ता और संभव जानकारी दृश्य या ज्ञान की खोज में शामिल हो सकता है), उदाहरण के लिए। डेटा विज्ञान पर विकिपीडिया लेख )। एक अच्छा डेटा वैज्ञानिक उस डोमेन की विशिष्ट विशेषताओं को चुनने में भी कुशल है जिसमें वे काम कर रहे हैं, साथ ही साथ। उदाहरण के लिए, अस्पताल के रिकॉर्ड के लिए एनालिटिक्स पर काम करने वाले एक डेटा वैज्ञानिक अगर बायोमेडिकल इंफॉर्मेटिक्स में पृष्ठभूमि रखते हैं, तो यह अधिक प्रभावी है।
  2. यहां कई विकल्प हैं, जिस प्रकार के विश्लेषिकी में आप रुचि रखते हैं, उसके आधार पर एंड्रयू एनजी का सेसर कोर्स सबसे पहले उल्लिखित संसाधन है , और ठीक ही ऐसा है। यदि आप मशीन सीखने में रुचि रखते हैं, तो यह एक शानदार शुरुआत है। यदि आप इसमें शामिल गणित की गहन खोज चाहते हैं, टिब्शिरानी का तत्व सांख्यिकीय सीखना उत्कृष्ट है, लेकिन काफी उन्नत पाठ है। एनजी के अलावा, आंगसर पर कई ऑनलाइन पाठ्यक्रम उपलब्ध हैं, लेकिन आपको उन दिमागों के साथ चयन करना चाहिए, जिस प्रकार के एनालिटिक्स पर आप ध्यान केंद्रित करना चाहते हैं, और / या वह डोमेन जिसमें आप काम करने की योजना बनाते हैं।
  3. Kaggle । यदि आप कुछ वास्तविक दुनिया विश्लेषिकी समस्याओं पर गोता लगाना चाहते हैं, तो कागले से शुरुआत करें। आपकी विशेषज्ञता के स्तर पर निर्भर करते हुए, सरल की शुरुआत करना अच्छा हो सकता है, हालांकि।प्रोजेक्ट यूलर एकतरफा अभ्यास समस्याओं के लिए एक महान संसाधन है जिसका उपयोग मैं अभी भी वार्म-अप कार्य के रूप में करता हूं।
  4. फिर, यह संभवत: उस डोमेन पर निर्भर करता है जिसमें आप काम करना चाहते हैं। हालांकि, मुझे पता है कि यदि आप डेटा विज्ञान से संबंधित पाठ्यक्रमों की एक श्रृंखला को पूरा करते हैं, तो कोर्टेरा एक डेटा विज्ञान प्रमाणपत्र प्रदान करता है। यह शायद शुरू करने के लिए एक अच्छी जगह है।

सौभाग्य! यदि आपके कोई अन्य विशिष्ट प्रश्न हैं, तो बेझिझक मुझे टिप्पणियों में पूछ सकते हैं, और मैं आपकी मदद करने की पूरी कोशिश करूंगा!


1
यह करने के लिए वापस आ रहा है, एंड्रयू एनजी के पाठ्यक्रम है मुश्किल । मुझे उल्लेख करना चाहिए था कि मैं गणित में मजबूत नहीं हूं। मैंने सुना है कि यह अन्य डेटा साइंस कोर्स रस्सियों को सीखने के लिए थोड़ा आसान है। तुम क्या सोचते हो?
मार्टिन

5

मैं एक स्वयं-पढ़ाया गया डेटा वैज्ञानिक हूं, और मैं आपको यह समझाने की पूरी कोशिश करूंगा कि इसके बारे में कैसे जाना जाए।


डेटा विज्ञान के भीतर कौन से क्षेत्र हैं? (जैसे, आर्टिफिशियल इंटेलिजेंस, मशीन लर्निंग, डेटा विश्लेषण, आदि)

Data Science एक बहुत विस्तृत डोमेन है। यह डेटा के विज्ञान के बारे में है। इसलिए, कोई भी क्षेत्र जो निर्णय लेने के लिए डेटा का उपयोग करता है, इस डोमेन के अंतर्गत आता है। कुछ क्षेत्रों में शामिल हैं:

  • पैटर्न मान्यता और विश्लेषिकी
  • जैव सांख्यिकी
  • सांख्यिकीय सीखना
  • मशीन लर्निंग
  • डेटा सौंदर्यशास्त्र (या डेटा विज़ुअलाइज़ेशन)
  • डाटा पत्रकारिता

क्या ऑनलाइन क्लास के लोग सिफारिश कर सकते हैं?

मैंने एक ऐसे ही सवाल का जवाब दिया है । तो मैं इसे यहाँ उद्धृत करूंगा:

कौरसेरा की मशीन लर्निंग से शुरू करें कोर्स । यह मशीन लर्निंग के क्षेत्र में छात्र को पेश करने में वास्तव में अच्छा काम करता है और आपको अवधारणाओं में एक ठोस नींव रखने में मदद करता है।

यदि आपको लगता है कि गणित थोड़ा कठिन है, तो आप इस पाठ्यक्रम को अपना सकते हैं , वही प्रोफेसर द्वारा पढ़ाया जाता है और गणित पूर्व की तुलना में गहन होता है।

अब, आपके पास मशीन लर्निंग की मूल अवधारणाओं के बारे में स्पष्ट अंतर्ज्ञान होगा। अब, इस पाठ्यक्रम को लें , जिसे एंड्रयू एनजी के पाठ्यक्रम के लिए अनुवर्ती या पूरक के रूप में कहा जा सकता है।

यह संसाधन IAPR से में बहुत सारी एमएल अवधारणाएं हैं जैसे क्रॉस-वैलिडेशन, नियमितीकरण आदि।

आप भी Quora पर एक ब्लॉग में संकलित संसाधनों की इन अद्भुत सूची पर एक नज़र डाल सकते हैं ।

अब, तंत्रिका नेटवर्क और गहरी सीखने की उन्नत अवधारणाओं में गोता लगाने के लिए, आप इस मुफ्त पुस्तक का उपयोग कर सकते हैं ।

अंत में, फ्री ई-बुक: एलिमेंट ऑफ स्टैटिस्टिकल लर्निंग , एमएल या स्टैटिस्टिकल लर्निंग में शुरुआती लोगों के लिए एक अद्भुत पुस्तक है।

मैं इसके अलावा, Quora द्वारा डेटा विज्ञान संदर्भों के इस भंडार को देखें


क्या ऐसी परियोजनाएं उपलब्ध हैं जिन्हें मैं अभ्यास कर सकता हूं (जैसे, खुले डेटासेट)।

मैंने भारत के खुले डेटासेट के साथ प्रोजेक्ट करना शुरू कर दिया है। हालाँकि, मैं आपको यहाँ इस अद्भुत चर्चा की जाँच करने की सलाह दूंगा, और उन परियोजनाओं को करने के बाद, आप केगल से शुरू कर सकते हैं।


क्या ऐसे प्रमाणपत्र हैं जो मैं पूरा या लागू कर सकता हूं?

मेरी राय में, कोई डेटा विज्ञान प्रमाणपत्र नहीं हैं। हाँ, वहाँ बहुत सारे बिग डेटा प्रमाणपत्र हैं, लेकिन मैंने उन्हें एक उभरते हुए डेटा वैज्ञानिक के लिए वास्तव में उपयोगी नहीं देखा, इसलिए मैं आपको सलाह देता हूं कि जब तक आप अपने एमएल और डेटा कौशल के साथ पर्याप्त आश्वस्त न हों, तब तक आप उनका कम से कम पीछा न करें।


1

मैं डेटा विज्ञान में कोर्टेरा विशेषज्ञता से शुरू करने की सलाह देता हूं। जॉन्स हॉपकिन्स द्वारा डेटा विज्ञान विशेषज्ञता सबसे पुरानी चल रही विशेषज्ञता है। मैं किताबों और कग्गल की सिफारिश नहीं करता। वे केवल शुरुआत में आपको भ्रमित करते हैं। ध्यान रखें कि कोडिंग डेटा साइंस का सबसे आसान हिस्सा है और आपको बहुत कुछ सीखना है। क्षेत्र के बारे में एक विचार प्राप्त करने के लिए, यह वेन डायग्राम एक अच्छी शुरुआत है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.