जवाबों:
यदि आप एक अनुप्रयोग-उन्मुख पुस्तक चाहते हैं, तो क्रिस्टोफर बिशप के मॉडल-आधारित मशीन लर्निंग पर विचार करें । उनके पास और अधिक तकनीकी पुस्तकें हैं जो अच्छी तरह से मानी जाती हैं।
यदि आप बहुत सारे कोड खोज रहे हैं, तो हैकर्स के लिए प्रोबेबिलिस्टिक प्रोग्रामिंग और बेयसियन मेथड्स एक विकल्प है।
अधिक सांख्यिकीय तुला के साथ एक और परिचयात्मक पुस्तक आर में अनुप्रयोगों के साथ सांख्यिकीय सीखना का एक परिचय है । फिर, लेखकों के पास पुस्तक का एक सुविचारित तकनीकी संस्करण है।
कुछ हफ्ते पहले मेरा भी यही सवाल था।
मैंने व्यक्तिगत रूप से डेटा विश्लेषण के लिए ओ रेली के पायथन को मूल बातें सीखने में बहुत उपयोगी पाया । पुस्तक मानती है कि आपके पास कुछ पायथन प्रोग्रामिंग अनुभव है, लेकिन इसमें मूल बातों के माध्यम से जाने के लिए पीठ में एक परिशिष्ट भी है।
लेखक आपको शुरुआत में वास्तविक दुनिया की एक विस्तृत विविधता (मोंटी पाइथन नहीं) उदाहरण देता है जो आप पहले कुछ अध्यायों के भीतर बना सकते हैं, फिर प्रत्येक चीज़ के बारे में विस्तार से जाते हैं जैसे कि पुस्तक आपके ज्ञान का निर्माण करती है।
मुझे निर्देश बहुत आसान और कदम से कदम मिल गए। मेरे प्रोफेसर जो इस सब में मेरे मार्गदर्शक हैं, मैं बहुत जल्दी प्रभावित हो गया था।
मैंने कागले के बारे में अच्छी बातें भी सुनी हैं।
Microsoft Azure मशीन लर्निंग और R के साथ क्लाउड में डेटा विज्ञान एक मुक्त पाठ्यपुस्तक है जो एक उदाहरण के माध्यम से महान विस्तार से काम करता है। उपयोग किए जाने वाले विशेष साधनों से दूर न रहें क्योंकि आपको पुस्तक से कुछ लाभ प्राप्त करने की आवश्यकता नहीं है।
एक और जो मुझे अच्छा लगा वह है कलेक्टिव इंटेलिजेंस प्रोग्रामिंग जो वेब स्क्रेपिंग पार्ट समेत कई प्रोजेक्ट्स के बारे में विस्तार से बताता है जिसमें ज्यादातर किताबें चमकती हैं।
मैं Ipython पुस्तिकाओं के इस संग्रह की सिफारिश कर सकता हूं जिसमें डेटा विज्ञान, सांख्यिकी और मशीन लर्निंग शामिल हैं जिन्होंने नोटबुक को टिप्पणी दी है।
https://github.com/ipython/ipython/wiki/A-gallery-of-interesting-IPython-Notebooks
एक जगह आपको कुछ दिलचस्प चरण-दर-चरण स्पष्टीकरण मिल सकते हैं जो कि कागेल ट्यूटोरियल और विजेता के साक्षात्कार हैं । अक्सर लोग अपने दृष्टिकोण का एक विस्तृत सारांश पोस्ट करेंगे।
सबसे अच्छी किताब जो मैं भर में आया हूं, वह है सेबस्टियन रास्का से पाइथन में मशीन लर्निंग । आसान उदाहरण, स्टेप बाय स्टेप स्पष्टीकरण और गणित की सही मात्रा।
पुस्तक की संरचना डेटा सफाई से लेकर अनुगमन और मूल्यांकन तक की पूरी प्रक्रिया को कवर करती है।
अच्छी तरह से देखिए :
https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/
इसमें एक स्टेप बाय स्टेप ट्यूटोरियल है जो आपको डेटा एक्सप्लोरेशन, डेटा एनालिसिस और प्रेडिक्टिव मॉडल बिल्डिंग की पूरी प्रक्रिया का अंदाजा देगा।
डेटा अन्वेषण और फ़ीचर इंजीनियरिंग के बारे में स्पष्टीकरण (प्रासंगिक सुविधाओं का चयन कैसे करें) यहाँ है:
https://www.analyticsvidhya.com/blog/2016/01/guide-data-exploration/
यहां पहले 5 डेटासेट देखें जिसमें ट्यूटोरियल हैं और व्यावहारिक अनुभव प्राप्त करने के लिए उन पर काम करते हैं:
इस पर भी नज़र डालें:
http://machinelearningmastery.com/machine-learning-in-python-step-by-step/
जहां वह एक एकल डाटासेट पर कई मॉडलों का उपयोग करता है जो आपको विभिन्न मॉडलों की एक बुनियादी स्तर की समझ देगा।
मॉडल चयन के बारे में अधिक समझने के लिए इस पर एक नज़र डालें:
https://www.quora.com/Data-Science-How-do-Data-Scientists-perform-model-selection
उपरोक्त लिंक में क्षेत्र में काम करने वाले लोगों द्वारा दिए गए उत्तर हैं।
विभिन्न डेटासेट पर अंतर्दृष्टि प्राप्त करने के लिए आप हमेशा केगल में प्रवेश कर सकते हैं और प्रतियोगिताओं से गुजर सकते हैं और डेटासेट की विस्तृत श्रृंखला पर नज़र डाल सकते हैं, जहाँ आप लोगों के कोड को गुठली तक पहुँचा सकते हैं। काग्ले में मंच मददगार हैं क्योंकि लोग समस्याओं और उनके दृष्टिकोण के लिए विभिन्न मॉडलों का उपयोग करने के बारे में चर्चा करते हैं।