क्या कोई शतरंज इंजन है जो जानवर-बल खोज का उपयोग नहीं करता है?


10

हर शतरंज इंजन, जिसके बारे में मैंने सुना है (जिसमें मुझे विकिपीडिया पर सूचीबद्ध सभी मिला है) अपनी चाल के बारे में निर्णय लेने के लिए मूल्यांकन फ़ंक्शन (माइनमैक्स एल्गोरिथ्म) के साथ जानवर-बल खोज का उपयोग करता है।

यह नहीं है कि अधिकांश मनुष्य खेल को कैसे देखते हैं, इसके बजाय सामान्य पैटर्न मान्यता को नियोजित करते हैं, इसलिए सिद्धांत रूप में, कंप्यूटर के लिए भी ऐसा करना संभव होगा।

क्या कोई शतरंज इंजन है जो अपनी चाल खोजने के लिए जानवर-बल के दृष्टिकोण पर भरोसा नहीं करता है?


9
मैग्नस कार्लसन। ;)
वेस

3
जो लोग कहते हैं कि आधुनिक इंजन ब्रूट बल नहीं हैं, क्योंकि वे आगे बढ़ते हैं ... मुझे लगता है कि यह स्पष्ट है कि जब शतरंज इंजन लाखों पदों का मूल्यांकन करता है, तो यह ब्रूट बल का उपयोग कर रहा है, चाहे कोई भी भौहें खींच सकता हो। एल्गोरिथ्म पर।
टोनी एननिस

आधुनिक इंजन चालें मिस कर सकते हैं, जैसे। बलिदान जहां अदायगी काफी गहरी नहीं है। मुझे लगता है कि यह शायद इसलिए है क्योंकि वे गहराई से जांच नहीं करते हैं।
एक राहगीर

जवाबों:


6

1980 के दशक में वापस ज्ञान इंजनों के साथ शतरंज इंजन लिखने के लिए प्रयास किए गए थे जो कि मनुष्यों की तरह उम्मीदवार कदम उठाएंगे, लेकिन वे असफल थे। समस्या यह है कि मानव पैटर्न मिलान शब्दों में रखना मुश्किल है, इसलिए ज्ञान आधार के लिए नियम बनाना बेहद कठिन था।

उम्मीदवार चाल लेने के लिए एक तंत्रिका नेटवर्क का प्रशिक्षण अनुसंधान के एक आशाजनक लाइन की तरह लगता है। यहाँ और यहाँ दो उचित कागजात हो सकते हैं। (FWIW, यह मेरे COMP विज्ञान के क्षेत्र नहीं है)


5

आप जिराफ़ पर एक नज़र डाल सकते हैं जो हाल ही में खबरों में था:

https://thestack.com/iot/2015/09/14/neural-network-chess-computer-abandons-brute-force-for-selective-human-approach/

प्रचार यह है कि 3 दिनों में इसने खुद को खेल सिखाया और IM स्तर तक पहुंच गया। दूसरी ओर शोध जारी है

http://arxiv.org/abs/1509.01549


बिल्कुल सच नहीं ... मेरा जवाब देखिए।
स्मॉलचेयर

3

मैं जिराफ पर @ Ian_Bush के उत्तर में विवरण जोड़ना चाहूंगा।

@ Ian_Bush के जवाब में, यह ध्यान दिया जाता है कि जिराफ जानवर-बल गणना का उपयोग नहीं करता है। यह सही नहीं है , क्योंकि जिराफ अभी भी एक अल्फा-बीटा (नेगा-मैक्स) इंजन है। केवल एक मानक इंजन के लिए अंतर यह है कि मूल्यांकन कार्य गहरे सीखने द्वारा स्वचालित रूप से समायोजित किया गया है है। इसलिए, इंजन सीखता है कि कैसे खुद से खेलना है।

परंपरागत रूप से, इंजन प्रोग्रामर इंजन में सेल्फ-ट्यून पैरामीटर करता है। मैंने खुद बहुत कुछ किया है। उदाहरण के लिए, आपको बिशप और नाइट को कितना वजन देना चाहिए? 3.0? 3.1? 3.2? यह बताना मुश्किल है।

जिराफ़ समस्या को बहुत अधिक स्पष्ट तरीके से बताता है। यह कुछ प्रारंभिक मूल्यों के साथ शुरू होता है। इंजन उन मूल्यों को ट्यून करने के लिए ग्रेडिएंट एसेंट एल्गोरिथ्म का उपयोग करता है। हमें स्पष्ट रूप से यह बताने की जरूरत नहीं है कि एक रानी को कोड में कितना वजन होना चाहिए। यह हम "सीखने" का मतलब है। इसका मतलब यह नहीं है कि इंजन बिना खोज के शतरंज खेल सकता है ।

संपादित करें : जिराफ़ पेड़ को नोड्स की संभावना के रूप में मॉडल करते हैं कि वे मुख्य विचलन में आते हैं। विवरण के लिए कागज की जाँच करें। मैं व्यक्तिगत रूप से इस दृष्टिकोण पर विश्वास नहीं करता हूं, और कागज थोड़ा सा सबूत दिखाता है कि यह कितना उपयोगी होगा।


क्या यह सच है कि जिराफ स्टॉकफिश ईगल को लक्ष्य के रूप में इस्तेमाल करते हैं? यदि ऐसा है, तो यह अपने आप में "शतरंज नहीं सीखता है", यह सिर्फ बोर्ड फीचर्स के शीर्ष पर एक नेट का उपयोग करके स्टॉकफिश के एक सन्निकटन के बारे में बताता है।
फर्नांडो

@ फ़र्नान्डो जिराफ़ का स्टॉकफ़िश से कोई लेना-देना नहीं है, मेरा मानना ​​है।
स्मालचैथ

मैं पूरा पेपर We evaluated board representations by training neural networks to predict the output of Stock- fish’s evaluation function in a supervised fashion, given 5 million positions as input, in the board representation under evaluation. पढ़ूंगा , लेकिन पेज 18 पर लिखा है: तो, यह सेल्फी IMO द्वारा नहीं सीखा जा रहा है।
फर्नांडो

1

यदि आप एक अनुमान आधारित खोज कह सकते हैं और जानवर-बल के रूप में दृष्टिकोण का मूल्यांकन कर सकते हैं, तो यह बहस का रूप है। अधिकांश टॉप-टियर शतरंज इंजन आज स्थिति का मूल्यांकन करने के लिए एक नियम-आधारित दृष्टिकोण का पालन करते हैं और चालों को बढ़ाने के लिए एक नियम आधारित खोज कार्य करते हैं।

यह वास्तव में "वैश्विक इष्टतम" कदम उठाने की गारंटी नहीं है, हालांकि ये कदम उद्देश्य के लिए पर्याप्त हैं। इस अर्थ में, अधिकांश शतरंज इंजन वैश्विक इष्टतम पर एक सन्निकटन का उपयोग कर रहे हैं और वास्तव में हो रहे हैं।

आज तक, हमने कई शतरंज इंजनों को एक अलग दृष्टिकोण का उपयोग करके शीर्ष स्तर पर सफल नहीं किया है, कम से कम सस्ते हार्डवेयर पर नहीं।


0

क्लाउड इंजन बनाने के लिए क्लाउड शैनन ने दो प्रकार के एल्गोरिदम प्रस्तावित किए। एक "टाइप ए" इंजन कुछ परिमित गहराई तक सभी संभावित चालों की जांच करता है, पेड़ को छोटा करता है, और फिर न्यूनतम पेड़ (उर्फ जानवर बल) से उच्चतम मूल्यांकन के साथ चाल खेलता है। टाइप बी इंजन कुछ मानदंडों के आधार पर अपनी खोज को केवल संभावित चालों के सबसेट तक सीमित करता है। मेरा मानना ​​था कि वह टाइप बी को अधिक होनहार मानते हैं।

जिन इंजनों को 1970 के दशक में बनाया गया था (उदाहरण के लिए हाईटेक, कैसा) को बिना किसी प्रूनिंग या सिर्फ अल्फा-बीटा के साथ शुद्ध ब्रूट बल के रूप में इस्तेमाल किया गया था, लेकिन लोगों ने जल्द ही चालों और लाइनों के पेड़ को छीलने का मूल्य देखा जो मजबूत साबित होने की संभावना नहीं थी। । लगभग सभी हाल के इंजन लाइनों के पेड़ को स्पष्ट रूप से कमजोर (अल्फा-बीटा) बताते हैं, और अधिकांश इंजन विभिन्न प्रकार के फॉरवर्ड प्रूनिंग (व्यर्थता, देर से कदम में कमी, अशक्त चाल, रेजरिंग) का उपयोग करते हैं। उस अर्थ में, कई इंजन नहीं हैं जो अब शुद्ध ब्रूट बल का उपयोग करते हैं।

1970 के दशक में, बोट्विननिक, एक इंजन पर काम कर रहा था, जिसे पायनियर कहा जाता था, उसने हमले के रास्तों की धारणा के बारे में कल्पना की थी, जिसका मूल्यांकन मार्गदर्शन किया गया होगा। यह कभी भी उस बिंदु तक नहीं पहुंचा जहां यह शतरंज का पूरा खेल खेल सके।

1990 के दशक में, क्रिस विटिंगटन ने अधिक शतरंज ज्ञान का उपयोग करने के पक्ष में बात की, और शतरंज सिस्टम ताल नामक एक कार्यक्रम बनाया, जो अपने समय के लिए काफी मजबूत था।

कास्परोव, आनंद और टॉर्ड रोमस्टैड सभी ने उल्लेख किया है कि हायरक्स के कई शीर्ष इंजनों की तुलना में अधिक विस्तृत मूल्यांकन है, जिनकी ताकत एक तेज खोज से आती है।


-2

मूल रूप से उन सभी को!

शतरंज इंजन वास्तव में केवल जानवर-बल का उपयोग करते हैं:

  • बताया गया
  • विश्लेषण कर रहे हैं पदों (समस्या को सुलझाने)
  • एक चेकमेट की तलाश में (समस्या को हल करना, न कि उसके खिलाफ खेलना, जैसे "एन में दोस्त को ढूंढें" शैली की समस्याएं)

अन्यथा उनके पास एक "चयनात्मक खोज" है, यह किसी दिए गए बोर्ड लेआउट के लिए सभी संभव कदमों पर विचार करेगा, लेकिन केवल उनमें से कुछ का पता लगाएं। एक इंजन ब्रूट-फोर्स पर स्विच कर सकता है, हालांकि अगर यह दो समान रूप से चलता है (एक से अधिक मजबूत कदम) या यदि यह एक चाल को पसंद नहीं करता है (कोई मजबूत चाल नहीं)।

वे रक्षा की एक अंतिम पंक्ति के रूप में भी जोर-जबरदस्ती करते हैं, यदि आपने एक चेकमेट संभावना देखी है तो यह देख सकते हैं कि यह आ रहा है और यह वास्तव में ड्रा करने के लिए कठिन प्रयास करना चाहेगा, और कोई रास्ता नहीं खोज सकता ("क्षितिज प्रभाव" "इंजन के साथ एक समस्या है, मान लीजिए कि यह रानी को ढीला करने वाला है, और यह केवल 4 नाटकों को गहराई तक ले जाने के लिए छाया हुआ है; अगर यह पंजे का व्यापार कर सकता है और 4 चालों के लिए रानी की हानि को स्थगित कर सकता है, तो उसे लगता है कि उसने रानी को बचा लिया है। , इस प्रक्रिया में यह कम से कम 1 प्यादे को ढीला कर देगा (जैसा कि अगला कदम क्षितिज को करीब से पहले लाता है) और रानी को बचाने के लिए इसके वजन का मतलब यह हो सकता है कि यह कुछ रक्षा बलिदान करता है, कुछ भी नहीं अगर मृत्यु क्षितिज पर चली जाती है) ।

जब चयनात्मक खोज बहुत उपयोगी नहीं होती है, तो यह भी क्रूरतापूर्ण होगा। यही कारण है कि इंजन को अधिक समय लगता है जब उनके पास 3 टुकड़े बचे होते हैं। उन्हें ब्रूट-फोर्स करना होगा क्योंकि चयन एल्गोरिदम एक कदम नहीं उठा सकता है। मिडगैम गेम के दौरान सिलेक्शन एल्गोरिथ्म बहुत अच्छा है क्योंकि यह "ओह्ह" की तरह हो सकता है, प्यादा के साथ ऐसा करने से उसका [जो कुछ भी] ब्लॉक हो जाता है और मेरा [जो भी] और [जो भी] बैक अप होता है, मेरे पास हमला करने की तुलना में कम संख्या में बचाव होता है - उदाहरण के लिए ।

यदि आपके पास बोर्ड के बीच में एक राजा है 8 चालें हैं, तो चयनात्मक खोज "कुछ भी उपयोगी नहीं है, मैं नहीं बता सकता" की तरह होगा।

आप दो भागों के रूप में चयनात्मक खोज के बारे में सोच सकते हैं, यह रणनीति के अर्थ में सामरिक है और सामरिक चालों को हाजिर करेगा, यह आमतौर पर शामिल टुकड़ों के वजन को अनदेखा करेगा क्योंकि एक रानी किसी भी रणनीति का हिस्सा नहीं है। एक मोहरा से अधिक यह महत्वपूर्ण है। यह भी रणनीतिक है कि यह एक रक्षा करने वाले मूवर्स का पता लगाएगा, और संभावित हमलों के लिए बाद में खुल जाएगा।

इंजन तब आपके दृष्टिकोण से, और आगे और पीछे और आगे और पीछे से समान करता है।

ट्रांसपोज़न टेबल नाम की कोई चीज़ ऐसी चीज़ों की एक बड़ी सूची है जिसके बारे में उसने सोचा है, इस तरह से अगर वह कुछ ऐसा करने पर विचार करता है जो पहले से हो चुका है, तो वह जानता है और उसे फिर से मूल्यांकन करने की ज़रूरत नहीं है।

UNLESS (चयनात्मक :)) यह वहाँ एक अलग तरह से हो जाता है, या आगे का पता लगाना चाहता है। उदाहरण के लिए मान लीजिए कि यह पता चलता है कि आपका ... किश्ती एक आसन्न हमले के लिए आवश्यक है, जब यह पता चलता है तो इंजन एक लाइन का पुनर्मूल्यांकन कर सकता है। पिछला वजन जो उस बदमाश पर डाल दिया (जैसे 5 अंक, आपके लिए कितना महत्वपूर्ण है) एक अनुमान के तहत हो सकता है।

चयनात्मक खोज भी पीछे हट सकती है, जैसे कि किसी बिशप को दुश्मन के क्षेत्र में सही तरीके से स्थानांतरित करने पर विचार करना, चाल चयनकर्ता के लिए यह महत्वपूर्ण नहीं है कि इसे आसानी से लिया जा सकता है। यह कहो कि यह रणनीतिक रूप से एक शानदार कदम है! फिर यह उस वर्ग को बचाने के लिए उस वर्ग की रक्षा करने का एक तरीका खोजने की कोशिश कर सकता है। मान लीजिए कि ऐसा करने के लिए एक मोहरा शामिल है।

ब्रूट-फोर्स विधि उस प्यादा चाल को शामिल करने वाली रेखा पर विचार करेगी, और (ब्रूट बल द्वारा) बिशप चाल भी, और वही सामान जो बोर्ड स्थिति (चयनात्मक खोज ही) को रेट करेगा, वह कहेगा "यह अच्छा है" इसलिए बोर्ड भिन्नताएँ जो अत्यधिक रूप से भिन्न होती हैं, दोनों ही इसे पाती हैं।

ब्रूट-फोर्स पद्धति का उपयोग करके स्थिति को रेट करना बहुत कठिन है, यही कारण है कि चयनात्मक खोज इतनी अच्छी तरह से काम करती है।

प्रारंभिक स्थिति से पशु-बल मिल सकता है कि प्रसिद्ध मेट-इन -4 जिसमें एक बिशप द्वारा कवर किया गया रानी f7 शामिल है, और अगर यह दर थी कि अत्यधिक (मैं एक चाकचौबंद बनूंगा! गलत होगा क्योंकि काला स्पष्ट रूप से मुकाबला करेगा। चयनात्मक खोज एक स्थिति (आगे के मूल्यांकन के लिए) को रेट करता है क्योंकि यह अच्छा प्रतीत होता है। इसका मतलब है जब यह आपकी प्रतिक्रिया पर विचार कर रहा है तो यह तय कर सकता है कि आपके लिए क्या अच्छा होगा ...।

इसलिए सामान जो चयनात्मक खोज का उपयोग चीजों को रेट करने के लिए करता है उसका उपयोग ब्रूट-फोर्स द्वारा किया जाता है, क्योंकि "पाया गया कि एक चेकमेट इस चाल को शामिल करता है" यह कहने के लिए पर्याप्त नहीं है कि चाल अच्छी है।

इसलिए ब्रूट फ़ोर्स शतरंज इंजन द्वारा पहली चाल (वाइट) चुनी जाती है?

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.