मैं सोच रहा हूं कि एक राउंड आधारित बोर्ड गेम जैसे टिक-टैक-टो, शतरंज, जोखिम या किसी अन्य राउंड आधारित गेम के लिए एक न्यूरल नेटवर्क को कैसे प्रशिक्षित किया जाए। इनपुट के रूप में खेल की स्थिति को खिलाने और वर्तमान खिलाड़ी के लिए कदम के रूप में आउटपुट का उपयोग करके, इंजेक्शन के द्वारा अगले कदम को प्राप्त करना बहुत सीधा लगता है। हालाँकि, उस उद्देश्य के लिए AI का प्रशिक्षण देना ऐसा प्रतीत नहीं होता कि सीधे आगे, क्योंकि:
- एक भी चाल अच्छी है या नहीं, इसकी रेटिंग नहीं हो सकती है, इसलिए एकल चालों का प्रशिक्षण सही विकल्प नहीं लगता है
- तंत्रिका नेटवर्क को प्रशिक्षित करने के लिए पूरे गेम के सभी गेम स्टेटस (इनपुट्स) और मूव्स (आउटपुट) का उपयोग करना, सही विकल्प नहीं लगता है क्योंकि किसी खोए हुए गेम में सभी चालें खराब नहीं हो सकती हैं
इसलिए मैं सोच रहा हूं कि एक राउंड आधारित बोर्ड गेम के लिए एक न्यूरल नेटवर्क को कैसे प्रशिक्षित किया जाए? मैं टेंसरफ़्लो का उपयोग करके टिक-टैक-टो के लिए एक न्यूरल नेटवर्क बनाना चाहूंगा।