यादृच्छिक पर खेलने वाले कंप्यूटर प्रोग्राम का एलो क्या होगा?


11

रैंडम मूव्स खेलने वाले कंप्यूटर प्रोग्राम का एलो क्या होगा?

सादगी के लिए, यह मान लें कि वह कभी ड्रॉ या इस्तीफा नहीं मांगता है और ड्रॉ ऑफर को कभी स्वीकार नहीं करता है।


बोर्ड पर सभी टुकड़ों की कल्पना करें और आप कंप्यूटर की रानी पर हमला करें। इसमें रानी को घुमाने के लिए 16 में से 1 मौका है और शायद दूसरे टुकड़े के साथ बचाव का एक पतला मौका है।
ZL1Corvette

4
मुझे लगता है कि किसी भी मानव खिलाड़ी को रैंडम से भी बदतर खेलने की कल्पना करना मुश्किल है ।
दाग ऑस्कर मैडसेन

मैं इसे वैज्ञानिक रूप से करना चाहूंगा
मिखाइलटाल

मेरे एआई वर्ग के लिए हमें एक शतरंज एआई बनाना था। असाइनमेंट का पहला चरण यादृच्छिक वैध चाल था। जब इन AI ने लड़ाई लड़ी तो ज्यादातर ड्रॉ में समाप्त हुई। एक लालची एआई जो लागू होने पर सबसे मूल्यवान टुकड़े पर हमला करता है, अन्यथा हर बार यादृच्छिक एअर इंडिया को हरा देता है।
Harrichael

जवाबों:


13

40/4 समय नियंत्रण के लिए कंप्यूटर शतरंज रेटिंग सूची के निचले भाग में ब्रूटस आरएनडी है, एक इंजन जो बस यादृच्छिक कानूनी चाल का चयन करता है।

http://www.computerchess.org.uk/ccrl/404/cgi/engine_details.cgi?print=Details&each_game=1&eng=Brutus%20RND#Brutus_RND

इसकी रेटिंग 205 (6/6/2018 तक) है। यह FIDE रेटिंग नहीं है, लेकिन यह एलो प्रणाली का उपयोग कर रहा है।

इसमें 0 जीत, 242 हार और 64 ड्रॉ हैं। ड्रॉ दोषपूर्ण कार्यक्रमों के कारण होते हैं जो गलती से पुनरावृत्ति या कभी-कभी गतिरोध द्वारा खींचते हैं, हालांकि आमतौर पर ऐसा होने पर उन्हें पर्याप्त भौतिक लाभ होता है।

FIDE में 1000 का रेटिंग फ़्लोर है। ब्रूटस आरएनडी केवल एक रेटिंग स्थापित करने में विफल होगा जो उच्च और अनरेटेड होगी।

यदि हम FIDE रेटिंग फ़्लोर को अनदेखा करते हैं, तो एलो सिस्टम के तहत नकारात्मक रेटिंग होना संभव है।

उल्लेख करने के लिए एक बिंदु यह है कि FIDE रेटिंग परिवर्तनों की गणना करने के लिए एक तालिका का उपयोग करता है और यदि रेटिंग अंतर 735 से अधिक है, तो मजबूत खिलाड़ी के जीतने पर कोई परिवर्तन नहीं होता है। इसका मतलब यह है कि ब्रूटस कभी भी 5000 की रेटिंग या ऐसा कुछ नहीं कर सकता था, क्योंकि इसे शानदार अक्षम खिलाड़ियों को अंक खोने की आवश्यकता होगी जो चेकमेट देने में सक्षम नहीं होंगे।

https://www.fide.com/component/handbook/?view=article&id=197

हम यहाँ अनुमान लगाने से बचे हैं। 1000 एलो रेटेड खिलाड़ी ब्रूटस की रेटिंग को 265 से नीचे लाने में सक्षम होंगे, लेकिन चूंकि खराब रेटिंग वाले खिलाड़ी नहीं हैं, इसलिए हम यह नहीं कह सकते हैं कि अगर वे मौजूद थे, तो वे ब्रूटस की रेटिंग को कितना नीचे धकेल सकते हैं।

मुझे लगता है कि खिलाड़ियों कि 500 ​​एलो या इससे भी बदतर हैं, लगातार साथी को देने में परेशानी होगी, बहुत कुछ दोषपूर्ण कार्यक्रमों की तरह। 3-गुना पुनरावृत्ति द्वारा ड्रॉ या 50 चाल नियम एफआईडीई नियमों के तहत स्वचालित नहीं हैं और केवल तब होगा जब ब्रूटस ने दावा किया था। लेकिन एक इंसान समय के साथ-साथ भाग कर हार सकता है, साथ ही साथ आकस्मिक गतिरोध से भी बच सकता है।

इसलिए मैं कहीं -200 से 200 की सीमा में अनुमान लगा रहा हूं यदि FIDE ने 1000 से नीचे की रेटिंग की और ब्रूटस को प्रतिस्पर्धा करने की अनुमति दी।


ऊँचा लगता है। मैं 100 के करीब अनुमान लगाया होगा अगर चाल वास्तव में यादृच्छिक हैं।
एडविना जैतून

6

यादृच्छिक खेलने के साथ समस्या यह है कि एक औसत शतरंज की स्थिति में कई चालें हैं (उद्घाटन में 20 से आसानी से 50 या उससे अधिक जटिल एंडगेम्स में), लेकिन उनमें से केवल कुछ ही स्वीकार्य हैं। बेतरतीब चाल से खेल की शुरुआत से ही कुल असंतोष होगा। इसके अलावा, कम मूल्यवान टुकड़ों को कैप्चर करना बहुत सामान्य होगा, विशेष रूप से मध्यम गेम में। इसने कहा, यहां तक ​​कि बेहद कमजोर विरोध के बावजूद, कंप्यूटर, लंबे समय में, गड़गड़ाहट: टन सामग्री का व्यापार किया जाएगा और संभवतः कंप्यूटर के लिए बहुत अच्छे नहीं हैं, कंप्यूटर निस्संदेह अविकसित होगा, उसका राजा सुरक्षित नहीं होगा और संभवतः कास्टेड भी नहीं ...

इतनी बुरी चीजें ढेर हो गई, और बहुत जल्दी, मशीन के लिए एक निश्चित हार होगी। उसका एलो शायद 0 FIDE होगा।


2
ऐसे इंजन के खिलाफ हारना और भी मुश्किल होगा! यहां तक ​​कि अगर आप जांच करना चाहते हैं, तब तक यह एक अनंत काल तक ले जा सकता है जब तक कि इंजन इसे प्रबंधित नहीं करता है। जीतने के लिए एक यादृच्छिक इंजन का एकमात्र यथार्थवादी तरीका है यदि प्रतिद्वंद्वी इस्तीफा दे।
पीटर

यदि आप खेल के बारे में थोड़ा भी जानते हैं, तो मैं पूरी तरह से सहमत हूं। लेकिन अगर आप केवल टुकड़ों को स्थानांतरित करना जानते हैं, तो उनका मूल्य, या कोई रणनीति भी नहीं ... ठीक है, तो मानव और कंप्यूटर अधिक या कम समान शब्दों में खेल रहे हैं।
पाब्लो एस। ओकल

मुझे लगता है कि एक नौसिखिया भी जो आज सिर्फ नियम सीखता है, यादृच्छिक से बेहतर खेलता है। नौसिखिए एक हेरास्टिक का उपयोग कर सकते हैं जैसे कि "चलो टुकड़े को पकड़ने दें", जो यादृच्छिक इंजन के खिलाफ बहुत अच्छा काम करता है, क्योंकि आप किसी भी टुकड़े को पकड़ सकते हैं, भले ही यह संरक्षित हो, या बस अपने टुकड़ों को लटकाए रखें, और इंजन को पकड़ने की बहुत संभावना नहीं है। चूंकि इसके पास चुनने के लिए कई अन्य बेकार चालें हैं। अंत में नौसिखिए के लिए एकमात्र संभावित कठिनाई यह पता लगाना है कि संभोग कैसे किया जाता है, लेकिन यह बहुत कठिन नहीं होना चाहिए ताकि संभावित भौतिक लाभ दिया जा सके।
itub

यदि आप हारना चाहते हैं तो किसी यादृच्छिक खिलाड़ी के खिलाफ हारना मुश्किल नहीं है। आप इसे 5 साल पुराने Play Magnus ऐप के साथ आज़मा सकते हैं। आपको बस एक ऐसी स्थिति के लिए मजबूर करना होगा, जहां एकमात्र कानूनी कदम यह है कि चेकमेट वितरित करना है। ऐसा करने का सबसे आसान तरीका 1 मोहरे को छोड़कर इसके सभी टुकड़ों को पकड़ना है, इसके राजा को फँसाना है ताकि यह केवल मोहरे को आगे बढ़ा सके, अपने राजा को पहली रैंक पर छोड़ दे और अपने दूसरे टुकड़ों को व्यवस्थित करे जब प्यादे को बढ़ावा दे और कॉल करे जाँच। यह काम करता है अगर यह रानी या बदमाश को बढ़ावा देता है, तो आपके पास खोने का 50% मौका है (या 100% अगर यह कभी कम नहीं हुआ)।
सिलस एस। ब्राउन

5

सच में रैंडम प्ले बहुत बुरा है जितना आप शायद सोचेंगे। यूएससीएफ निरपेक्ष तल 100 है और यह कार्यक्रम इससे ऊपर कभी नहीं बढ़ेगा।


1

मुझे यकीन नहीं है कि गो रेटिंग्स की तुलना शतरंज से कैसे होती है, लेकिन रैंडम प्ले लगभग -3500 है । चूंकि शतरंज के लिए ब्रांचिंग कारक कम है, मुझे उम्मीद है कि यादृच्छिक खिलाड़ी एलो अधिक होगा, शायद -2000 और -500 के बीच कहीं।


1
जैसा कि chess.stackexchange.com/a/6509/9025 पर उत्तर में बताया गया है , USCF रेटिंग फ्लोर 100 है, इसलिए इसे नकारात्मक रेटिंग देना असंभव होगा।
हर्ब वोल्फ

सवाल पर सिर्फ एक अलग नजरिया। यह निर्दिष्ट नहीं किया गया कि कौन सी रेटिंग प्रणाली का उपयोग करना है, और सांख्यिकीय एलो में "निचला बाउंड" नहीं है।
अकबाबा

1

एक निरपेक्ष शुरुआत से भी बदतर जो खेल के नियमों को बमुश्किल जानता है, क्योंकि कम से कम शुरुआत में एक चाल को चुनने में कुछ विचार रखा जाता है। उनकी चालें अभी भी ज्यादातर यादृच्छिक हो सकती हैं, लेकिन कम से कम कुछ पदों का मूल्यांकन चल रहा है।

इसलिए इस इंजन की रेटिंग आपके द्वारा चुनी गई रेटिंग प्रणाली के निम्नतम संभव तल पर होगी। यह अंततः एक समान रूप से खराब प्रतिद्वंद्वी के खिलाफ एक गेम जीत या ड्रा कर सकता है, और फिर कुछ बिंदुओं तक बढ़ सकता है। हालाँकि, आप उम्मीद कर सकते हैं कि इंजन की रेटिंग तेजी से बाद में न्यूनतम मंजिल तक वापस आ जाएगी।

शैनन के "प्रोग्रामिंग अ कम्प्यूटर फॉर प्लेइंग चेस" में, उन्होंने ध्यान दिया कि बोट्वनिक के बेतरतीब नाटक की संभावना 10 ^ -75 के क्रम की है। इस प्रकार, यदि यह यादृच्छिक कंप्यूटर बोट्वनिक (या एक नियमित मास्टर) भी खेलना बंद कर देता है, तो मानव जीवन के लिए गैर-रोक है, हम इसे कभी भी जीतने की उम्मीद नहीं कर सकते हैं।

हालांकि, शैनन ने कहा कि यादृच्छिक खेल सबसे खराब रणनीति नहीं है; सबसे खराब रणनीति जानबूझकर चलने वाली चाल है जो प्रतिद्वंद्वी की सहायता करती है। हालांकि यह संभव है कि एक पूर्ण शुरुआत ऐसा कर सके, संभावना है कि वे चालें खेलने की कोशिश करेंगे जो अपनी स्थिति में सुधार करते हैं।


0

एक बहुत अच्छा जवाब यह करना होगा:

सुन्न, बहुत कमजोर गेम इंजन, 1500 ईएलओ या तो का उपयोग करें, और इसके लिए एक अजगर स्क्रिप्ट संलग्न करें। कई पुस्तकालय हैं जो आपको एक स्थिति में संभावित कदम प्रदान करते हैं, इसलिए हम एक यादृच्छिक पर चुन सकते हैं। मैं बाद में परिणाम पोस्ट करूंगा।

http://creative-co.de/random_chess/

आपको इसकी भी जांच करनी चाहिए।


3
नेम्पी एक वैज्ञानिक गणित पुस्तकालय है, शतरंज इंजन नहीं है।
svineet

यह एक शतरंज इंजन भी है
मिखाइलटाल

2
chess.stackexchange.com/questions/6034/… ऐसा लगता है कि इसे
संख्य

1
@ मिखाइलटाल: क्या कोई कारण है कि आप नाम को सही करने के लिए इस उत्तर को संपादित नहीं करते हैं?
ग्रीनमैट

2
@SmallChess: समान नाम, लेकिन समान नहीं।
ग्रीनमैट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.