combinatorial-games पर टैग किए गए जवाब

4
सुदृढीकरण सीखने में अमान्य चाल को कैसे संभालें?
मैं एक एआई बनाना चाहता हूं जो पांच-इन-द-रो / गोमोकू खेल सकता है। जैसा कि मैंने शीर्षक में उल्लेख किया है, मैं इसके लिए सुदृढीकरण सीखने का उपयोग करना चाहता हूं। बेसलाइन के साथ, मैं पॉलिसी ग्रेडिएंट विधि का उपयोग करता हूं , जिसका नाम REINFORCE है। मान और नीति …

1
टिक टीएसी को पैर की अंगुली की तरह खेल में आनुवंशिक एल्गोरिदम बनाम तंत्रिका नेटवर्क?
वर्तमान में मैं एक परियोजना कर रहा हूं जो गेम गोमोकू खेलने के लिए एक एआई बनाने के बारे में है (यह टिक टीएसी को पैर की अंगुली की तरह है, लेकिन 15 * 15 बोर्ड पर खेला जाता है और जीतने के लिए 5 की आवश्यकता होती है)। मैंने …

1
शतरंज जैसे खेल के लिए सुदृढीकरण सीखने के आवेदन के बारे में कुछ संदेह
मैंने एक शतरंज की तरह बोर्ड गेम का आविष्कार किया। मैंने एक इंजन बनाया ताकि यह स्वायत्त रूप से खेल सके। इंजन मूल रूप से एक निर्णय वृक्ष है। यह द्वारा रचित है: एक खोज फ़ंक्शन जो प्रत्येक नोड पर सभी संभव कानूनी चालें पाता है एक मूल्यांकन फ़ंक्शन जो …
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.