मशीन लर्निंग की नींव , मेहरियर मोहरी, अफशीन रोस्तमीज़ादेह और अमीत तलवलकर द्वारा, मशीन लर्निंग सिद्धांत पर 2012 की एक पुस्तक है।
अंडरस्टैंडिंग मशीन लर्निंग: थ्योरी से अल्गोरिद्म तक , Sha Shalev-Shwartz और Shai Ben-David, एक ऐसी ही 2014 की किताब है, जो मोहरी / रुस्तमिजादेह / तलवलकर की तुलना में काफी प्रसिद्ध और लक्षित है, लेकिन अभी भी बहुत सारे सिद्धांत हैं यह। यह मुफ्त में ऑनलाइन उपलब्ध है।
न्यूरल नेटवर्क लर्निंग: मार्टिन एंथोनी और पीटर बार्टलेट द्वारा सैद्धांतिक नींव , तंत्रिका सिद्धांत के बारे में के रूप में प्रकाशित एमएल सिद्धांत के बारे में एक 1999 की पुस्तक है, लेकिन (मेरी धारणा यह नहीं पढ़ रही है) ज्यादातर सामान्य रूप से एमएल सिद्धांत के बारे में है।
ये तीन पुस्तकें ज्यादातर सांख्यिकीय सीखने के सिद्धांत का प्रमुख दृष्टिकोण लेती हैं। कम्प्यूटेशनल लर्निंग सिद्धांत नामक एक दिलचस्प दृष्टिकोण भी है, जो कंप्यूटर विज्ञान के सिद्धांत से अधिक प्रेरित है। मुझे लगता है कि इस क्षेत्र में मानक परिचयात्मक पुस्तक एक परिचय कम्प्यूटेशनल लर्निंग थ्योरी है , माइकल किर्न्स और उमेश वज़ीरानी द्वारा 1994 की पुस्तक।
एक और उत्कृष्ट और अक्सर अनुशंसित स्वतंत्र रूप से उपलब्ध पुस्तक ट्रेवर हस्ती, रॉबर्ट टिब्शिरानी और जेरोम फ्रीडमैन के 2009 के द एलिमेंट्स ऑफ़ स्टैटिस्टिकल लर्निंग का दूसरा संस्करण है । यह शायद दूसरों की तुलना में थोड़ा कम सैद्धांतिक है, और मशीन सीखने वाले की तुलना में सांख्यिकीविद् के दृष्टिकोण से अधिक है, लेकिन अभी भी बहुत रुचि है।
इसके अलावा, यदि आप विशेष रूप से ढाल वंश के बारे में परवाह करते हैं, तो मानक संदर्भ स्टीफन बॉयड और लेवेन वैंडेनबर्ग द्वारा उत्तल अनुकूलन है। 2004 की यह पुस्तक ऑनलाइन उपलब्ध है।
इन पुस्तकों में से किसी में भी गहरे नेटवर्क के आधुनिक सिद्धांत पर बहुत कुछ नहीं है, यदि आप इसकी परवाह करते हैं। (उदाहरण के लिए, अधिकांश अनुकूलन सिद्धांत उत्तल मामलों के बारे में होगा, जो निश्चित रूप से गहरे नेटवर्क नहीं हैं।) ऐसा इसलिए है क्योंकि यह सिद्धांत बहुत नया है; अधिकांश परिणाम पिछले कुछ वर्षों में ही आए हैं, और अभी भी इसका बहुत कुछ पता चल रहा है। लेकिन, अब तक के क्षेत्र की बुनियादी समझ के अवलोकन के रूप में, उनमें से कोई भी आपको उन कागजों को समझने के लिए अच्छी तरह से स्थापित करेगा जिनमें काम किया जाता है (शायद केर्न्स / वज़ीरानी को छोड़कर, जो विश्लेषण के विभिन्न पहलुओं पर ध्यान केंद्रित करता है। सुनिश्चित नहीं है कि सफलतापूर्वक गहरे नेटवर्क पर लागू किया गया है - अभी तक)।