मशीन सीखने रसोई की किताब / संदर्भ कार्ड / धोखा देती है?


57

मुझे डेटा माइनिंग के लिए संभाव्यता और सांख्यिकी कुकबुक और आर संदर्भ कार्ड जैसे संसाधन अविश्वसनीय रूप से उपयोगी हैं। वे स्पष्ट रूप से संदर्भ के रूप में अच्छी तरह से काम करते हैं, लेकिन मुझे एक विषय पर अपने विचारों को व्यवस्थित करने और भूमि पर लेटने में भी मदद करते हैं।

प्रश्न: मशीन सीखने के तरीकों के लिए इन संसाधनों की तरह कुछ भी मौजूद है?

मैं एक संदर्भ कार्ड की कल्पना कर रहा हूं जिसमें प्रत्येक एमएल विधि शामिल होगी:

  • सामान्य विशेषता
  • जब विधि अच्छी तरह से काम करती है
  • जब विधि खराब होती है
  • जिसमें से या किन अन्य तरीकों से विधि सामान्य हो जाती है। क्या यह अधिकतर अधिरोपित किया गया है?
  • विधि पर सेमिनल पेपर
  • विधि से जुड़ी खुली समस्याएं
  • कम्प्यूटेशनल तीव्रता

यह सभी चीजें पाठ्यपुस्तकों के माध्यम से कुछ न्यूनतम खुदाई के साथ मिल सकती हैं, मुझे यकीन है। बस कुछ पन्नों पर उनका होना वास्तव में सुविधाजनक होगा।


5
एक अच्छा लक्ष्य, लेकिन "कुछ पाठ्य पुस्तकों के माध्यम से न्यूनतम खुदाई"? सांख्यिकीय सीखने और डेटा माइनिंग + mloss.org/software/rating के लिए इन 20 पुस्तकों को संपीड़ित करने के लिए कोई भी कैसे शुरू कर सकता है ?
Denis


2
(+1) चुज्पा के लिए, यदि ऐसा कोई अवलोकन मौजूद होता, तो मैं इसके लिए भुगतान करता। प्रमुख समस्या यह है कि कुछ गुणों के बगल में जो एल्गोरिथम से ही प्राप्त किए जा सकते हैं, ऐसे गुणों या नियमों के बहुमत अंगूठे के अनुभव से प्राप्त होते हैं, अर्थात आवेदन। मुझे पूरा यकीन है कि एक लड़ाई में लागू शोधकर्ता या एमएल-फ्रेमवर्क-प्रोग्रामर / सलाहकार ऐसा कुछ लिख सकते हैं ... लेकिन यहां और अब?
स्टीफेन

@डेनिस: "20 किताबें .." लिंक काम नहीं करता है, क्या आप इसकी जांच कर सकते हैं?
लामासु

6
मैं कोई मशीन सीखने वाला विशेषज्ञ नहीं हूं, इसलिए मैं दूसरों को जवाब पोस्ट करने के लिए टाल दूंगा लेकिन मुझे लगता है कि सांख्यिकीय तत्व के तत्व को इस विषय पर एक अच्छा पाठ माना जाता है और इसे क्षेत्र के कुछ सबसे बड़े नामों द्वारा लिखा जाता है। मुझे यह जोड़ना चाहिए कि यह पुस्तक उच्च स्तर पर लिखी गई है और जिन लोगों ने मैंने सुना है कि यह आँकड़ों में पीएचडी है।
मैक्रो

जवाबों:


25

सबसे अच्छे और स्वतंत्र रूप से उपलब्ध संसाधनों में से कुछ हैं:

लेखक के सवाल के अनुसार मुझे "ऑल इन वन पेज" समाधान नहीं मिला है


सर्गेई, बार्बर की किताब मतलाब से जुड़ी है?
Denis

2
हां, बस पुस्तक के लिंक पर एक नज़र डालें: पाठकों को यह देखने में मदद करने के लिए BRMLtool बॉक्स प्रदान किया गया है कि गणितीय मॉडल वास्तविक MAT-LAB कोड में कैसे परिवर्तित होते हैं।
सर्गेई

31

यदि आप मशीन लर्निंग सीखना चाहते हैं तो मैं आपको सलाह देता हूं कि प्रो। एंड्रयू एनजी द्वारा पढ़ाए जा रहे सर्दियों में मुफ्त ऑनलाइन एमएल कोर्स में दाखिला लें ।

मैंने पहले एक शरद ऋतु में किया था और सभी सीखने की सामग्री असाधारण गुणवत्ता की है और व्यावहारिक अनुप्रयोगों की ओर अग्रसर है, और एक पुस्तक के साथ अकेले संघर्ष करने के लिए बहुत आसान है।

यह भी अच्छा सहज स्पष्टीकरण और गणित की न्यूनतम राशि के साथ एक बहुत कम फांसी फल बनाया है।


मैंने अभी यह कोर्स पूरा किया है और यह बहुत बढ़िया है! इसके अलावा, इसने मुझे मशीन लर्निंग पर किताबों को समझने की एक शानदार शुरुआत दी।
बी सेवन

1
मुझे लगता है कि यह लिंक अब coursera.org/course/ml
n611x007

14

हाँ, आप ठीक हैं; क्रिस्टोफर बिशप की "पैटर्न रिकॉग्निशन एंड मशीन लर्निंग" सामान्य संदर्भ के लिए एक उत्कृष्ट पुस्तक है, आप वास्तव में इसके साथ गलत नहीं कर सकते।

एक हालिया पुस्तक लेकिन यह भी बहुत अच्छी तरह से लिखित और समान रूप से व्यापक है डेविड बार्बर की " बायेसियन रीजनिंग और मशीन लर्निंग "; एक पुस्तक मुझे लगता है कि इस क्षेत्र में एक नए हास्य के लिए थोड़ा अधिक उपयुक्त है।

मैंने हास्टी एट अल से "द एलिमेंट्स ऑफ स्टैटिस्टिकल लर्निंग" का उपयोग किया है। (मैक्रो द्वारा उल्लिखित) और एक बहुत मजबूत पुस्तक के रूप में, मैंने इसे पहले संदर्भ के रूप में अनुशंसित नहीं किया; शायद यह अधिक विशिष्ट विषयों के लिए दूसरे संदर्भ के रूप में आपकी बेहतर सेवा करे। उस पहलू में, डेविड मैके की पुस्तक, सूचना सिद्धांत, आविष्कार और लर्निंग एल्गोरिदम , एक शानदार काम भी कर सकते हैं।


2
बिशप के लिए +1। विस्तार के समान स्तर के साथ स्पष्ट विकास। अभी भी अच्छा है, मैं हमेशा Hastie एट अल पाया। थोड़ा सा तड़का हुआ।
संयुक्ताक्षरी 20

1
+1 - हस्ती, टिबशिरानी और फ्रीडमैन मेरा निजी पसंदीदा है।
StasK

1
+1, मेरी निजी पसंदीदा हस्ती, तिब्शीरानी और फ्रीडमैन की सिफारिश करने के लिए भी। और अन्य सिफारिशों के लिए धन्यवाद; मैं उन्हें पढ़ता हूँ क्योंकि मुझे गैर-सांख्यिकीविद (या केवल क्षेत्र में प्रवेश करने वाले व्यक्ति) की सिफारिश करने के लिए एक अच्छी पुस्तक की आवश्यकता है।
नेस्टॉर

1
बिशप के लिए +1। यह वास्तव में शास्त्रीय आंकड़ों के लिए भी एक महान स्रोत है, लेकिन अद्यतन और भेस में है।
अनुमान

10

चूंकि सर्वसम्मति से ऐसा लगता है कि यह प्रश्न कोई डुप्लिकेट नहीं है, मैं मशीन सीखने वाले शुरुआती लोगों के लिए अपना पसंदीदा साझा करना चाहता हूं:

मैंने प्रोग्रामर कलेक्टिव इंटेलिजेंस को शुरुआती लोगों के लिए सबसे आसान पुस्तक पाया , क्योंकि लेखक टोबी सेगरन औसत दर्जे के सॉफ़्टवेयर डेवलपर को अपने हाथों को डेटा हैकिंग के साथ जितनी जल्दी हो सके गंदा करने की अनुमति देने पर केंद्रित है।

विशिष्ट अध्याय: डेटा समस्या को स्पष्ट रूप से वर्णित किया जाता है, इसके बाद एक मोटे तौर पर व्याख्या की जाती है कि एल्गोरिथ्म कैसे काम करता है और अंत में दिखाता है कि कोड की कुछ लाइनों के साथ कुछ अंतर्दृष्टि कैसे बनाई जाए।

अजगर का उपयोग किसी को तेजी से समझने की अनुमति देता है (आपको अजगर को गंभीरता से जानने की आवश्यकता नहीं है, मैं पहले भी नहीं जानता था,)। मत सोचो कि यह पुस्तक केवल सिफारिशकर्ता प्रणाली बनाने पर केंद्रित है। यह टेक्स्ट माइनिंग / स्पैम फ़िल्टरिंग / ऑप्टिमाइज़ेशन / क्लस्टरिंग / वेलिडेशन इत्यादि से भी संबंधित है और इसलिए आपको हर डेटा माइनर के बुनियादी टूल के बारे में जानकारी देता है।


6

Witten and Frank, "Data Mining", Elsevier 2005 स्व-सीखने के लिए एक अच्छी पुस्तक है क्योंकि पुस्तक के साथ जाने के लिए कोड (Weka) का एक जावा पुस्तकालय है और बहुत व्यावहारिक रूप से उन्मुख है। मुझे संदेह है कि मेरे पास एक और अधिक नवीनतम संस्करण है।


1
हां, इस पुस्तक को "मशीन लर्निंग" कहा जाना था, लेकिन उस समय डेटा माइनिंग प्रचार के लिए प्रकाशकों द्वारा सवारी करने के लिए इसका नाम बदलकर "डेटा माइनिंग" कर दिया गया, फिर भी यह पुस्तक ML नहीं DM (दो नंगे समानों) के बारे में है, लेकिन अलग-अलग क्षेत्र हैं!)।
clyfe

1
टॉम मिशेल की पुस्तक "मशीन लर्निंग" भी बहुत अच्छी है; शैली थोड़ी पुरानी है, लेकिन सामग्री उत्कृष्ट है।
डिक्रान मार्सुपियल

हाँ, टॉम मिशेल एमएल एमएल की तरह है, वास्तव में मैदान पर व्यापक है!
clyfe

5

मेरे पास मशीन लर्निंग है: स्टीफन मार्सलैंड द्वारा एक एल्गोरिथम परिप्रेक्ष्य। और यह स्व-सीखने के लिए बहुत उपयोगी है। पूरे किताब में पायथन कोड दिया गया है।

मैं इस अनुकूल समीक्षा में कही गई बातों से सहमत हूँ:

http://blog.rtwilson.com/review-machine-learning-an-algorithmic-perspective-by-stephen-marsland/


5

"सांख्यिकीय शिक्षा के तत्व" आपके उद्देश्यों के लिए एक महान पुस्तक होगी। पुस्तक का 5 वां संस्करण, जो 2011 की शुरुआत में प्रकाशित हुआ था, http://www.stanford.edu/~hastie/local.ftp/Springer/ESLII_print5.pdf पर स्वतंत्र रूप से उपलब्ध है


2
यह गणित की भारी पुस्तक है इसलिए स्वयं शिक्षार्थी का पालन करना कठिन हो सकता है।
एटिला ओजगुर

क्या आप जानते हैं कि ट्रेवर हस्ती के व्यक्तिगत पन्नों पर स्वतंत्र रूप से डाउनलोड होना कैसा होता है जब स्प्रिंगर इसके लिए 70 डॉलर चार्ज करता है?
अल्फ्रेड एम।

मुझे यकीन नहीं है, लेकिन मुझे लगता है कि स्प्रिंगर को पैसे चाहिए, और लेखक मुख्य रूप से अपनी किताब को व्यापक रूप से प्रचारित करना चाहते हैं। यह बहुत ही समान है कि स्प्रिंगर आपको प्रकाशित लेख कैसे बेचेंगे जबकि कई "वर्किंग पेपर संस्करण" लेखक की वेबसाइट पर स्वतंत्र रूप से उपलब्ध हैं।
DanB

FYI करें, डाउनलोड दूसरे संस्करण की 5 वीं छपाई के लिए है। मुझे इपग्राफ के फुटनोट से प्यार है "भगवान में हम भरोसा करते हैं, अन्य सभी डेटा लाते हैं" जिसे डेमिंग का श्रेय दिया जाता है। फुटनोट इस विडंबना की ओर इशारा करता है कि कोई भी "डेटा" वास्तव में यह कहते हुए डेमिंग की पुष्टि नहीं कर सकता है।
हीटफैनजॉन

आपको R -it की तरह उनके ESL -लिट (यदि ESL में गणित बहुत कठिन है) के साथ सांख्यिकीय लर्निंग के परिचय का उल्लेख करना चाहिए ।
स्टीव एस

5

यहाँ छवि विवरण दर्ज करें

अक्सर मशीन सीखने की समस्या को हल करने का सबसे कठिन हिस्सा नौकरी के लिए सही अनुमान लगाने वाला हो सकता है। विभिन्न प्रकार के डेटा और विभिन्न समस्याओं के लिए अलग-अलग अनुमानक बेहतर अनुकूल हैं। नीचे फ़्लोचार्ट उपयोगकर्ताओं को आपके डेटा पर प्रयास करने के लिए अनुमान लगाने वालों के संबंध में समस्याओं के बारे में जानकारी देने के बारे में थोड़ा मोटा मार्गदर्शन करने के लिए डिज़ाइन किया गया है। यह दस्तावेज़ीकरण देखने के लिए नीचे दिए गए चार्ट में किसी भी अनुमानक पर क्लिक करें।



3

अन्य उत्तरों में उल्लिखित अधिकांश पुस्तकें बहुत अच्छी हैं और आप वास्तव में उनमें से किसी के साथ गलत नहीं कर सकते। इसके अतिरिक्त, मुझे पायथन की काफी उपयोगी के लिए निम्नलिखित चीट शीट मिलती scikit-learnहै।


2

मुझे डूडा, हार्ट और स्टॉर्क "पैटर्न वर्गीकरण" पसंद है। यह एक क्लासिक पाठ का हालिया संशोधन है जो सब कुछ बहुत अच्छी तरह से समझाता है। यकीन नहीं है कि यह तंत्रिका नेटवर्क और एसवीएम के बहुत कवरेज के लिए अपडेट किया गया है। हस्ती, टिबशिरानी और फ्रीडमैन की पुस्तक सर्वश्रेष्ठ के बारे में है, लेकिन जो आप देख रहे हैं उससे थोड़ा अधिक तकनीकी हो सकता है और यह विषय के अवलोकन के बजाय विस्तृत है।


2

Microsoft Azure भी एक समान धोखा-पत्र प्रदान करता है, जो एक व्यक्ति को एंटोन तारासेंको द्वारा पोस्ट किया गया है।

Microsoft Azure मशीन लर्निंग एल्गोरिथम धोखा शीट

(स्रोत: https://docs.microsoft.com/en-us/azure/machine-learning/machine-learning-algorithm-cheat-sheet )

वे इसे एक नोटिस के साथ देते हैं:

इस एल्गोरिथ्म धोखा शीट में दिए गए सुझाव अनुमानित नियम-ऑफ-थंब हैं। कुछ को झुकाया जा सकता है, और कुछ का उल्लंघन किया जा सकता है। यह एक प्रारंभिक बिंदु का सुझाव देने का इरादा है। (...)

Microsoft अतिरिक्त विवरण प्रदान करते हुए एक परिचयात्मक लेख प्रदान करता है ।

कृपया ध्यान दें कि वे सामग्रियां Microsoft Azure में लागू किए गए तरीकों पर केंद्रित हैं।


1

सांख्यिकीय लर्निंग के तत्वों से शुरू न करें। यह बहुत अच्छा है, लेकिन यह एक संदर्भ पुस्तक है, जो आपको पसंद नहीं है। मैं प्रोग्रामिंग इंटेलिजेंस प्रोग्रामिंग के साथ शुरू करूंगा क्योंकि यह एक आसान रीड है।


मुझे यकीन नहीं है कि मैं ईएसएल को एक संदर्भ पाठ के रूप में चिह्नित करूंगा। यह मेरे लिए एक सिंहावलोकन के अधिक लगता है, यानी, आप कुछ भी नहीं (शायद ही) में मजाकिया किरकिरा विवरण जानने के लिए नहीं जा रहे हैं। आप व्यापक तकनीकों और अतिव्यापी विषयों को देखेंगे।
कार्डिनल

1

मशीन लर्निंग पर पहली पुस्तक के लिए, जो सिद्धांतों को समझाने का अच्छा काम करती है, मैं दृढ़ता से सिफारिश करूंगा

रोजर्स एंड जीरोलामी, मशीन लर्निंग में पहला कोर्स , (चैपमैन एंड हॉल / सीआरसी मशीन लर्निंग एंड पैटर्न रिकॉग्निशन), 2011।

क्रिस बिशप की किताब, या डेविड बार्बर की दोनों किताबों के लिए बेहतर विकल्प हैं, एक बार जब आप सिद्धांतों की अच्छी समझ रखते हैं।




हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.