कृत्रिम होशियारी combinatorial-games

4

सुदृढीकरण सीखने में अमान्य चाल को कैसे संभालें?

मैं एक एआई बनाना चाहता हूं जो पांच-इन-द-रो / गोमोकू खेल सकता है। जैसा कि मैंने शीर्षक में उल्लेख किया है, मैं इसके लिए सुदृढीकरण सीखने का उपयोग करना चाहता हूं। बेसलाइन के साथ, मैं पॉलिसी ग्रेडिएंट विधि का उपयोग करता हूं , जिसका नाम REINFORCE है। मान और नीति …

20 machine-learning reinforcement-learning game-ai combinatorial-games

1

टिक टीएसी को पैर की अंगुली की तरह खेल में आनुवंशिक एल्गोरिदम बनाम तंत्रिका नेटवर्क?

वर्तमान में मैं एक परियोजना कर रहा हूं जो गेम गोमोकू खेलने के लिए एक एआई बनाने के बारे में है (यह टिक टीएसी को पैर की अंगुली की तरह है, लेकिन 15 * 15 बोर्ड पर खेला जाता है और जीतने के लिए 5 की आवश्यकता होती है)। मैंने …

9 neural-networks machine-learning genetic-algorithms combinatorial-games

1

शतरंज जैसे खेल के लिए सुदृढीकरण सीखने के आवेदन के बारे में कुछ संदेह

मैंने एक शतरंज की तरह बोर्ड गेम का आविष्कार किया। मैंने एक इंजन बनाया ताकि यह स्वायत्त रूप से खेल सके। इंजन मूल रूप से एक निर्णय वृक्ष है। यह द्वारा रचित है: एक खोज फ़ंक्शन जो प्रत्येक नोड पर सभी संभव कानूनी चालें पाता है एक मूल्यांकन फ़ंक्शन जो …

9 reinforcement-learning game-ai game-theory combinatorial-games negamax

combinatorial-games पर टैग किए गए जवाब