मैं प्रयोग और उदाहरण के माध्यम से सबसे अच्छा सीखता हूं। मैं तंत्रिका नेटवर्क के बारे में सीख रहा हूं और मेरे पास (जो मुझे लगता है) वर्गीकरण और प्रतिगमन की एक बहुत अच्छी समझ है और पर्यवेक्षित और अनुपयोगी शिक्षा भी है, लेकिन मैंने कुछ ऐसा किया है जिसे मैं समझ नहीं सकता हूं;
अगर मैं एक जटिल खेल खेलने के लिए एआई को प्रशिक्षित करना चाहता था; मैं एक आरटीएस (उदाहरण के लिए, साम्राज्यों, साम्राज्य पृथ्वी आदि) की तरह कुछ सोच रहा हूं। इस प्रकार के खेलों में आम तौर पर विभिन्न क्षमताओं वाले खिलाड़ी (इकाइयों, भवनों) द्वारा नियंत्रित कई इकाइयाँ होती हैं। ऐसा लगता है कि एआई वर्गीकरण करता है (जैसे कि उस इकाई को चुनें, और उस कार्रवाई को) की समस्या है, हालांकि चूंकि इकाइयों की संख्या एक चर है, इसलिए कोई इस तरह से वर्गीकरण समस्या को कैसे संभालता है?
केवल एक चीज जिसके बारे में मैं सोच सकता हूं, वह है कई नेटवर्क जो विभिन्न चरणों को करते हैं (एक समग्र रणनीति के लिए, एक इस प्रकार की इकाई को नियंत्रित करने के लिए, एक उस प्रकार की इमारत आदि के लिए); लेकिन ऐसा लगता है कि मैं समस्या को जटिल बना रहा हूं।
क्या मशीन सीखने / तंत्रिका नेटवर्क के जटिल गेम सीखने का कोई अच्छा उदाहरण है (विशेष रूप से आरटीएस नहीं, लेकिन अधिक जटिल मारियो )?