सुदृढीकरण सीखने पर पुस्तकें

10

मैं काफी समय से सुदृढीकरण सीखने को समझने की कोशिश कर रहा हूं, लेकिन किसी तरह मैं यह कल्पना नहीं कर पा रहा हूं कि ग्रिड वर्ल्ड की समस्या को हल करने के लिए सुदृढीकरण सीखने के लिए एक कार्यक्रम कैसे लिखा जाए। क्या आप मुझे कुछ पाठ्य पुस्तकें सुझा सकते हैं जो मुझे सुदृढीकरण सीखने की स्पष्ट अवधारणा बनाने में मदद करेंगी?

machine-learning books reinforcement-learning

— girl101
स्रोत

आँकड़े.स्टैकएक्सचेंज.com

— एंटोन

कृपया ओपनई का संदर्भ लें, यह एक अच्छी जगह है कि मूल रूप से अजगर से सुदृढीकरण सीखना सीखना है

— विनीत कोठारी

7

यहाँ आपके पास सुदृढीकरण सीखने पर कुछ अच्छे संदर्भ हैं:

क्लासिक

सटन आरएस, बार्टो एजी। सुदृढीकरण सीखना: एक परिचय। कैम्ब्रिज, मास: एक ब्रैडफोर्ड पुस्तक; 1998. 322 पी।

दूसरे संस्करण का प्रारूप मुफ्त में उपलब्ध है: http://incompleteideas.net/book/the-book-2nd.html

रसेल / नॉरविग अध्याय 21:

रसेल एसजे, नॉरविग पी, डेविस ई। कृत्रिम बुद्धि: एक आधुनिक दृष्टिकोण। ऊपरी सैडल नदी, एनजे: अप्रेंटिस हॉल; 2010।

अधिक तकनीकी

सुदृढीकरण सीखने के लिए एसजेसेवरी सी। एल्गोरिदम। कृत्रिम बुद्धि और मशीन लर्निंग पर संश्लेषण व्याख्यान। 2010, 4 (1): 1-103। http://www.ualberta.ca/~szepesva/RLBook.html

बर्टसेकस डीपी। गतिशील प्रोग्रामिंग और इष्टतम नियंत्रण। चौथा संस्करण। बेलमोंट, मास: एथेना वैज्ञानिक; 2007. 1270 पी। अध्याय 6, खंड 2 मुफ्त में उपलब्ध है: http://web.mit.edu/dimitrib/www/dpchait.pdf

हाल के घटनाक्रमों के लिए

वाइरिंग एम, वैन ओटरलो एम, संपादक। सुदृढीकरण सीखना। बर्लिन, हीडलबर्ग: स्प्रिंगर बर्लिन हीडलबर्ग; 2012 से उपलब्ध: http://link.springer.com/10.1007/978-3-642-27645-3

कोचेंडरफर एमजे, अमेटो सी, चौधरी जी, कैसे जेपी, रेनॉल्ड्स एचजेडी, थॉर्नटन जेआर, एट अल। अनिश्चितता के तहत निर्णय लेना: सिद्धांत और अनुप्रयोग। 1 संस्करण। कैम्ब्रिज, मैसाचुसेट्स: द एमआईटी प्रेस; 2015. 352 पी।

मल्टी-एजेंट सुदृढीकरण सीखने

बुसोनीउ एल, बाबूस्का आर, शटर बीडी। मल्टी-एजेंट सुदृढीकरण सीखना: एक अवलोकन। इन: श्रीनिवासन डी, जैन एलसी, संपादक। मल्टी-एजेंट सिस्टम और अनुप्रयोगों में नवाचार - 1। स्प्रिंगर बर्लिन हीडलबर्ग; 2010 पी। 183-221। से उपलब्ध: http://link.springer.com/chapter/10.1007/978-3-642-14435-6_7

श्वार्ट्ज एच.एम. मल्टी-एजेंट मशीन लर्निंग: एक सुदृढीकरण दृष्टिकोण। होबोकेन, न्यू जर्सी: विली; 2014।

वीडियो / पाठ्यक्रम

मैं YouTube में डेविड सिल्वर पाठ्यक्रम का सुझाव भी दूंगा: https://www.youtube.com/playlist?list=PL5X3mDkKaJrL42i_jhE4N-p6E2Ol62Ofa

— जुआन लेनि
स्रोत

7

यूडनेस द्वारा सुदृढीकरण सीखना पर एक मुफ्त ऑनलाइन पाठ्यक्रम है। जाँच करें: मशीन लर्निंग: सुदृढीकरण सीखना

— Sreejithc321
स्रोत

वर्थ उल्लेख है कि एक ग्रिड वर्ल्ड समस्या को उस पाठ्यक्रम के हिस्से के रूप में प्रस्तुत किया गया है।

— नील स्लेटर

हाँ, यह देखा है, लेकिन

— girl101

4

मुझे वास्तव में रेनफोर्समेंट लेरनिंग का आनंद मिला: रिचर्ड सुटन द्वारा एक परिचय । यह आरएल पर एक बहुत अच्छा एकीकृत दृश्य प्रदान करता है, हालांकि इसमें नवीनतम दृष्टिकोणों का उल्लेख नहीं है (यह 1998 से है)।

— मार्टिन मोद्रक
स्रोत

वास्तव में मैं कलम और कागज पर गणना करके एक ग्रिड वर्ल्ड समस्या को देखना चाहता था, क्योंकि इससे मुझे अवधारणा को समझने में मदद मिलेगी, जब तक कि मैं उस अवधारणा को समझ नहीं

— पाऊंगा जिसे

1

आप मेरी किताब - हैंड्स-ऑन रेनफोर्समेंट लर्निंग विथ पायथन की जाँच कर सकते हैं जो कि स्क्रैच से सुदृढीकरण सीखने को अत्याधुनिक डीप सुदृढीकरण लर्निंग एल्गोरिदम की उन्नत स्थिति बताती है।

स्पष्टीकरण के साथ-साथ सभी कोड मेरे गिथब रेपो में पहले से ही उपलब्ध हैं। https://github.com/sudharsan13296/Hands-On-Reinforcement-Learning-With-Python

— Sudharsan
स्रोत