स्टॉकफिश के खिलाफ अल्फ़ाज़ेरो की जीत से शतरंज विशेषज्ञ क्यों हैरान थे?


10

यह हाल ही में मेरे ध्यान में लाया गया था कि शतरंज विशेषज्ञों ने इस अब के प्रसिद्ध मैच के परिणाम को कुछ परेशान किया।

देखें: शतरंज का नया सर्वश्रेष्ठ खिलाड़ी एक निडर, तेजतर्रार एल्गोरिथम है

शतरंज और शतरंज एआई पर एक गैर-विशेषज्ञ के रूप में, मेरी धारणा यह थी कि, अल्फ़ाहाउस के प्रदर्शन के आधार पर, और दहनशील खेलों के संबंध में उस प्रकार की विधि का सत्यापन, यह था कि पुराने एआई के पास कोई मौका नहीं होगा।

  • क्यों था अल्फाज़ेरो की जीत आश्चर्यजनक?

जवाबों:


14

अच्छा प्रश्न।

सबसे पहली और महत्वपूर्ण बात यह है कि गो डीमाइंड में चुनौती देने के लिए कोई अलौकिक विरोधी नहीं था। गो इंजन शीर्ष मानव खिलाड़ियों के उच्चतम स्तर के पास कहीं भी नहीं थे। शतरंज में, हालांकि, इंजन शीर्ष मानव खिलाड़ियों की तुलना में 500 ईएलओ अंक मजबूत हैं। यह एक बड़े पैमाने पर अंतर है। समकालीन शतरंज इंजनों में काम की मात्रा चौंका देने वाली है। हम प्रोग्रामिंग में लाखों घंटे, सैकड़ों हजारों पुनरावृत्तियों के बारे में बात कर रहे हैं। यह ज्ञान और काम का एक विशाल शरीर है। पर काबू पाने के लिए और 4 घंटे में सभी को चौंका देने वाला है।

दूसरे यह इतना अधिक परिणाम नहीं है, जो शतरंज के आकाओं के लिए आश्चर्य की बात है, बल्कि इसके बजाय अल्फ़ाज़ेरो शतरंज कैसे खेलते हैं। यह काफी विडंबनापूर्ण है कि एक ऐसी प्रणाली जिसके बारे में कोई मानवीय ज्ञान या विशेषज्ञता नहीं थी, वह सबसे ज्यादा हम करती है। इंजन बदसूरत दिखने वाली चालों को चलाने के लिए कुख्यात हैं, जिनमें सामंजस्य की कमी है आदि। किसी गैर-शतरंज खिलाड़ी को समझाना मुश्किल है लेकिन "कृत्रिम चाल" जैसी कोई चीज है जैसे समकालीन इंजन अक्सर आते हैं। अल्फाज़ेरो इस तरह नहीं खेलता है। इसकी एक बहुत ही मानवीय शैली है, जहां यह गहरे रणनीतिक खेल और आश्चर्यजनक स्थिति बलिदान के साथ प्रतिद्वंद्वी के टुकड़ों पर हावी है। अल्फाज़ेरो जिस तरह से हमारी इच्छा रखता है, इंजन की गणना की सटीकता के साथ गहरी स्थितीय समझ का संयोजन करता है।

ओह संपादित करें और मैं परिणाम के बारे में कुछ उल्लेख करना भूल गया। यदि आप कंप्यूटर शतरंज से परिचित नहीं हैं तो यह चौंका देने वाला नहीं है लेकिन यह है।

इन दिनों शीर्ष समसामयिक इंजनों को अलग करने वाले जीत के मार्जिन पतले पतले हैं। 100 गेम मैच में आप 85 गेम ड्रॉ, 9 जीत और 6 हार का परिणाम देख सकते हैं।

अल्फ़ाज़ेरो 28 जीतता है और शून्य नुकसान के साथ 72 ड्रॉ अन्य प्रकार से कुचल रहा था और जिस पल ऐसा हुआ, वह पूरी तरह से अकल्पनीय था।


अच्छा उत्तर। एआई की शतरंज के बीच तुलना के बारे में आपकी बात शतरंज की लूपनेस और विन / लॉस / ड्रा ट्रायड पर आधारित सीमा के संदर्भ में दिलचस्प है। (संभवतः, भविष्य में, हमें परिमित, अमूर्त खेलों की आवश्यकता होगी जो परिणामों के संदर्भ में अधिक दानेदार विश्लेषण की अनुमति देते हैं।) मैं शतरंज इंजन के इतिहास से परिचित हूं, और बड़े पैमाने पर प्रयास और मानव ज्ञान जो उनमें चला गया, लेकिन। सफलता की कमी के संदर्भ में: बहुत अधिक जटिल 19x19 गो में मेरे लिए विपरीत प्रभाव था।
DukeZhou

विशेष रूप से, मेरी धारणा यह थी कि यदि अल्फ़ागो शीर्ष मनुष्यों को अधिक जटिल खेल में हरा सकता है, तो यह उचित प्रतीत होता है कि यह न केवल शीर्ष मनुष्यों को हरा देगा, बल्कि किसी भी अन्य खेल में शीर्ष पिछले एआई है।
DukeZhou

आर्टिफ़िकल चाल के बारे में थोड़ा बहुत महत्वपूर्ण है, और कुछ ऐसा नहीं है जिसे मैंने गैर-शतरंज खिलाड़ियों के बारे में बात करते हुए देखा है। +1
स्टेला बिडरमैन

4

कम सफलता के साथ साहित्य में शतरंज के लिए MCTS की कोशिश की गई थी। यह माना जाता था कि अल्फ़ागो का दृष्टिकोण शतरंज पर कभी काम नहीं करेगा , शायद गो में लेकिन शतरंज में नहीं। अचानक, Google ने घोषणा की कि दृष्टिकोण काम कर रहा है और यह विश्व के सबसे मजबूत शतरंज कार्यक्रम को बहुत ही कम अंतर से हरा रहा है।

Google से पहले, सभी शतरंज प्रोग्रामर को सिखाया गया था कि इंजन प्रोग्रामिंग में हेराटिक्स को मशीन लर्निंग की तुलना में एक बेहतर रणनीति है। कोई फर्क नहीं पड़ता कि आपने तंत्रिका नेटवर्क को कैसे लागू किया, यह 64-बिट बिटबोर्ड निर्देशों के एक समूह की तुलना में तेजी से नहीं चला होगा। अल्फा गो काफी धीमा चल रहा था , लेकिन इसने सबसे मजबूत शतरंज खेला।


2

मैं देखता हूं, आपके द्वारा प्रदान किए गए लेखों के आधार पर, जीत में आश्चर्य के कई स्तर हैं:

शतरंज मास्टर करने के लिए कठिन खेल है और काउंटर भाग में दुनिया की सबसे अच्छी प्रथाएं थीं, अल्फ़ाज़ेरो में तबला रस था।

लर्निंग को चार घंटे का समय लगा और अल्फाज़ेरो ने 100 का कोई मैच नहीं गंवाया।

खेलने की शैली मानव और कंप्यूटर का एक विदेशी मिश्रण था जैसे चालें, आक्रामक और कुछ समय बलिदानों के साथ नासमझ प्रतीत होते हैं जिनका कोई पता नहीं है लेकिन वास्तव में भविष्य की स्थिति को और अधिक मजबूत बना रहे हैं।

प्रति चाल में खाते में ली गई अधिभोगियों की मात्रा काउंटर के हिस्से से कम थी, अल्फ़ाज़ेरो के पास एक रहस्यमय आंत भावना या अंतर्ज्ञान था।

प्रशिक्षण सामग्री अल्फाज़ेरो ने खुद को समय सीमा के साथ बनाया और प्रशिक्षण की मात्रा से उनींदापन महसूस किया, शायद इसने पारंपरिक मशीन को उचित मात्रा में समय नहीं दिया।


आह। इसलिए यह नई एआई विधि में आत्मविश्वास की कमी से उपजी है। यह समझ आता है।
DukeZhou
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.