मैं प्रायिकता सिद्धांत, माप सिद्धांत और अंत में मशीन लर्निंग के बारे में जानना चाहूंगा। मैं कहाँ से प्रारम्भ करूँ? [बन्द है]


9

मैं प्रायिकता सिद्धांत, माप सिद्धांत और अंत में मशीन लर्निंग के बारे में जानना चाहूंगा। मेरा अंतिम लक्ष्य सॉफ्टवेयर के एक टुकड़े में मशीन सीखने का उपयोग करना है।

मैंने कॉलेज में कैलकुलस और बहुत ही बुनियादी संभावना का अध्ययन किया लेकिन यह बहुत ज्यादा है। क्या आप कुछ ऑनलाइन पाठ्यक्रम या किताबें जानते हैं जिनका उपयोग मैं इन विषयों के बारे में जानने के लिए कर सकता हूं। मुझे वेब पर कई संसाधन मिले हैं, लेकिन वे सभी एक विशेषज्ञ दर्शकों को लक्षित लगते हैं। मुझे पता है कि इसमें कुछ समय लगने वाला है लेकिन अगर मैं शुरू से ही सीखना चाहूँ तो मैं कहाँ से शुरू करूँ?



2
ये तीन सवाल @General द्वारा सूचीबद्ध डुप्लिकेट द्वारा अच्छी तरह से कवर किए गए लगते हैं।
व्हिबर

जवाबों:


13

मुझे लगता है कि आपके लिए दो बहुत अच्छे और लोकप्रिय संदर्भ मौजूद हैं (मैंने इन लोगों के साथ शुरू किया है और साथ ही एक्टुआयारी विज्ञान में मास्टर की पृष्ठभूमि है:

  1. गैरेथ जेम्स, डेनिएला विटेन, ट्रेवर हस्ती, रॉबर्ट टिब्बीरानी द्वारा सांख्यिकीय शिक्षा का परिचय (आर में आवेदन के साथ)। यह साइट पर स्वतंत्र रूप से उपलब्ध है, व्यावहारिक उदाहरणों के साथ बहुत व्यापक और समझने में आसान है। आप बहुत मजबूत सांख्यिकीय पृष्ठभूमि के बिना भी कई चीजें सीखना शुरू कर सकते हैं, यह संदर्भ विभिन्न प्रोफाइलों के लिए अच्छा है और इसमें आर के कार्यान्वयन के साथ-साथ गणितीय विवरणों में गहराई से जाने के बिना पर्याप्त संख्या में लोकप्रिय एल्गोरिदम शामिल हैं।

  2. ट्रेवर हैस्टी, रॉबर्ट टिब्शिरानी, ​​जेरोम फ्रीडमैन द्वारा सांख्यिकीय शिक्षा के तत्व । पहले की तुलना में, यह पुस्तक गणितीय पहलुओं में गहराई से जाती है यदि आप उस विशेष एल्गोरिदम पर और अधिक अन्वेषण करना चाहते हैं जो आपको आपके लिए उपयोगी लगता है। ( स्वतंत्र भी है)

और निश्चित रूप से क्रॉस वैलिडेट सबसे अच्छा स्रोतों में से एक है जहां आप मेरे लिए कई चीजें सीख सकते हैं: सर्वश्रेष्ठ प्रैटिस, सांख्यिकीय गलतफहमी और दुरुपयोग, और बहुत कुछ। स्कूलों / विश्वविद्यालयों के साथ-साथ सेफ्ट-लर्निंग में कई वर्षों तक सीखने के बाद, मैंने पाया कि जब मैं पहली बार क्रॉस वैलिडेट पर गया था, तब मेरा पता बहुत सीमित है। मैं पहली यात्रा के बाद से हर दिन यहां जाना जारी रखता हूं और बहुत कुछ सीखता हूं।


3
यदि आप इन संदर्भों को पसंद करते हैं, तो स्टैनफोर्ड के ऑनलाइन पाठ्यक्रमों के लिए नज़र रखना सुनिश्चित करें। टी। हस्ती और आर। तिब्शिरानी अक्सर मशीन लर्निंग से संबंधित पाठ्यक्रम देते हैं।
मार्सेल 10

मैं आर में आवेदन के साथ सांख्यिकीय सीखने के लिए एक परिचय के बारे में 20% पढ़ा है। यह वही है जो मैं देख रहा था। महान पुस्तक और समझने में काफी आसान। आपको बहुत - बहुत धन्यवाद! :)
अधिकतम

6

यहाँ नि: शुल्क ऑनलाइन पाठ्यक्रमों की एक जोड़ी है जो मैंने सुना है कि अत्यधिक अनुशंसित हैं:

  • http://projects.iq.harvard.edu/stat110/home (प्रायिकता सिद्धांत के साथ आपके वर्तमान आराम पर निर्भर करता है। डॉ। ब्लिट्जस्टीन का कोर्स हार्वर्ड में उन लोगों के लिए बहुत लोकप्रिय हो गया, जो सांख्यिकी / संभावना में नहीं थे। मैंने देखा है। मेरी स्वयं की समीक्षा के लिए कुछ व्याख्यान और उन्हें बहुत उपयोगी पाया।)
  • https://www.coursera.org/learn/machine-learning (यह एंड्रयू एनजी द्वारा स्टैनफोर्ड के पहले बड़े पैमाने पर ऑनलाइन पाठ्यक्रमों में से एक का वर्तमान संस्करण है, जिन्होंने कोर्टेरा के सह-संस्थापक को समाप्त कर दिया है। मैं इस कोर्स को लेने का अर्थ रहा हूं। , लेकिन समय नहीं था।)

5

आपको माप सिद्धांत की आवश्यकता नहीं है। मापन सिद्धांत का उपयोग गणितज्ञों द्वारा अन्य गणितीय प्रक्रियाओं को सही ठहराने के लिए किया जाता है। अधिकांश इंजीनियरों ने माप सिद्धांत का अध्ययन नहीं किया होगा, वे केवल परिणामों का उपयोग करेंगे। एमएल के लिए आवश्यक गणित का ज्ञान मोटे तौर पर एक बहुभिन्नरूपी गौसियन को एकीकृत करने में सक्षम होने के कारण होता है- यदि आप इसके बारे में आश्वस्त हैं, तो आपके पास बहुक्रियाशील कलन, रैखिक बीजगणित और संभाव्यता सिद्धांत पृष्ठभूमि आवश्यक है।

मैं एलन डाउनी द्वारा थिंक स्टैट्स की सिफारिश करूंगा - जिसका उद्देश्य प्रोग्रामरों को संभाव्यता / आँकड़े सिखाना है। विचार सिमुलेशन करने के लिए प्रोग्रामिंग विशेषज्ञता का लाभ उठाने के लिए है और इसलिए संभावना सिद्धांत / सांख्यिकीय तरीकों को समझें। एलन ब्लॉग (उन्होंने दूसरों को लिखा है) सोचो आँकड़े (मुक्त) pdf )


4
उपाय सिद्धांत निरंतर समय स्टोकेस्टिक प्रक्रियाओं में उपयोगी है। वास्तव में, निरंतर समय वित्त (परिसंपत्ति मूल्य निर्धारण) में प्रत्येक पेपर निम्नलिखित प्रार्थना(F,Ω,P)
अक्सकल

@ अक्षल न केवल मेरी राय में निरंतर प्रक्रियाएं!
मेट्रियट

5

चूंकि आप मशीन लर्निंग में रुचि रखते हैं, मैं संभावना और मेसाचर को छोड़ दूंगा, और सही एमएल में कूद जाऊंगा। एंड्रयू एन का कॉर्स ई शुरू करने के लिए एक शानदार जगह है। आप सचमुच इसे दो सप्ताह में समाप्त कर सकते हैं।

कुछ हफ्तों के लिए आपने जो सीखा है, उसके साथ खेलें, फिर जड़ों पर वापस जाएं और कुछ संभावनाओं का अध्ययन करें। यदि आप एक इंजीनियर हैं, तो मैं इस बात से हैरान हूँ कि आपने कॉलेज में कैसे पढ़ाई की। यह इंजीनियरिंग में आवश्यक पाठ्यक्रम हुआ करता था। किसी भी तरह, आप यहां एमआईटी ओसीडब्ल्यू कोर्स करके पकड़ सकते हैं

मुझे नहीं लगता कि आपको माप सिद्धांत की आवश्यकता है। किसी को माप सिद्धांत की जरूरत नहीं है। जो लोग करते हैं, वे यहां पूछने नहीं आएंगे, क्योंकि उनके सलाहकार उन्हें बताएंगे कि कौन सा कोर्स करना है। यदि आपके पास कोई सलाहकार नहीं है, तो आपको निश्चित रूप से इसकी आवश्यकता नहीं है। टॉटोलॉजी, लेकिन सच है।

एक उपाय सिद्धांत के साथ बात यह है कि आप इसे "आसान पढ़ने" से नहीं सीख सकते हैं। आपको अभ्यास और समस्याओं को करना होगा, मूल रूप से, इसे कठिन तरीके से करना चाहिए। मेरी राय में, क्लास रूम के बाहर यह लगभग असंभव है। यहां सबसे अच्छा विकल्प स्थानीय कॉलेज में एक क्लास लेना है, अगर वे इस तरह की पेशकश करते हैं। कभी-कभी, पीएचडी स्तर की संभाव्यता पाठ्यक्रम एक वर्ग में माप और संभावनाओं को करेगा, जो शायद सबसे अच्छा सौदा है। मैं गणित विभाग में एक शुद्ध माप सिद्धांत वर्ग लेने की सिफारिश नहीं करूंगा, जब तक कि आप वास्तव में खुद को यातना नहीं देना चाहते, हालांकि अंत में आप बहुत संतुष्ट होंगे।


2

मशीन लर्निंग के लिए, मुझे लगता है कि मशीन लर्निंग: द आर्ट एंड साइंस ऑफ अल्गोरिद्म जो मेक सेंस ऑफ डेटा पीटर फ्लैच द्वारा शुरू करने के लिए एक अच्छा संसाधन हो सकता है। यह सहज ज्ञान युक्त उदाहरणों के साथ मशीन सीखने का एक सामान्य परिचय देता है, और शुरुआती लोगों के लिए उपयुक्त है। मुझे यह पुस्तक विशेष रूप से अंतिम अध्याय के कारण पसंद है, जो मशीन सीखने के प्रयोगों से संबंधित है। मशीन सीखने के बारे में जानने के दौरान, विभिन्न मॉडलों को जानना पर्याप्त नहीं है, और किसी को अलग-अलग मशीन सीखने के एल्गोरिदम की तुलना करने में सक्षम होना चाहिए। मुझे लगता है कि इस पुस्तक ने उन एल्गोरिदम की तुलना करना आसान बना दिया है। व्याख्यान स्लाइड यहाँ पाया जा सकता है


2

ऊपर दिए गए उत्कृष्ट सुझावों को जोड़ने के लिए, मैं कहूंगा कि क्या आप संभावना और आँकड़ों में अधिक बुनियादी अवधारणाओं पर एक फर्म पकड़ पाने में रुचि रखते हैं, "एल्गोरिदम से जेड-स्कोर करने के लिए: सांख्यिकी में संभाव्य कम्प्यूटिंग" कंप्यूटर का उपयोग करने के लिए एक उत्कृष्ट प्राइमर है प्रायिकता सिद्धांत और स्टोचस्टिक प्रक्रियाओं में सबसे महत्वपूर्ण शुरुआती / मध्यवर्ती अवधारणाओं में से कुछ को समझें। मैं मशीन लर्निंग (एमएल) के लिए एक परिचय के रूप में या तो "सांख्यिकीय शिक्षा के लिए एक परिचय" या "सांख्यिकीय शिक्षा के तत्व" (ईएसएल) को दूसरा बनाऊंगा। मुझे लगता है कि ईएसएल विशेष रूप से आश्चर्यजनक है, लेकिन यह एमएल अवधारणाओं पर बहुत अधिक गणित-भारी नज़र रखता है, इसलिए यदि आप केवल अपने आप को आंकड़ों पर "ठीक" मानते हैं, तो आप इसे एक बार पढ़ने के बाद इसे देना चाहते हैं। एमएल के साथ अनुभव।

यदि आप मशीन लर्निंग में रुचि रखते हैं तो नौकरी करने या समस्याओं को हल करने के लिए, हाथों पर अनुभव प्राप्त करना महत्वपूर्ण है। डेटा साइंस / मशीन लर्निंग कोर्स के लिए कुछ परिचय लें। एंड्रयू एनए ने कोर्टेरा में अपने पाठ्यक्रम में मशीन सीखने का एक अद्भुत परिचय दिया । मैं आपको कुछ डेटासेट डाउनलोड करने और उनके साथ खेलने की सलाह भी दूंगा। यदि आप पहले से ही नहीं हैं, तो R और RStudio (मेरी राय में, पायथन या मैटलैब की तुलना में शुरुआती के लिए अधिक अनुकूल) डाउनलोड करें, और kaggle में साइन अप करें और उनकी कुछ शुरुआती समस्याएं करें। उनके पास महान वॉकथ्रू हैं जो आपको मूल रूप से किसी भी विचार के साथ एमएल का उपयोग करके प्राप्त कर सकते हैं कि वास्तव में क्या हो रहा है, लेकिन यह आपको एक विचार देता है कि एमएल समाधान को लागू करने के लिए आपको किस तरह के कदम उठाने होंगे।

मैं व्यक्तिगत रूप से एमएल टूल्स का उपयोग करके शुरू करने के संयोजन को वास्तव में जाने बिना प्रोत्साहित करूंगा कि वे क्या करते हैं (कागले डेटासेट या इसी तरह का उपयोग करके); और क्रॉस-वेलिडेशन, ओवरफिटिंग, कन्फ्यूजन मैट्रिस का उपयोग करना, और एक मॉडल कितना अच्छा है, आदि के बारे में मूलभूत अवधारणाओं को सीखना, मेरे लिए, एल्गोरिदम का उपयोग करना, और यह जानना महत्वपूर्ण है कि चीजों को काम करते समय कैसे पहचाना जाए। / काम नहीं कर रहे हैं, यह समझने के लिए कि एल्गोरिदम कैसे काम करता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.