वहाँ एक इंजन है जो सबसे अच्छा "व्यावहारिक" चाल पाता है?


25

एक मानक शतरंज इंजन को वह चाल मिल जाएगी जो इसे दोनों ओर से सर्वश्रेष्ठ खेल मानते हुए सर्वश्रेष्ठ मानती है। लेकिन इस कदम से एक तुच्छ लाभ या एक मुश्किल रेखा हो सकती है, जो एक विशिष्ट क्षमता के मानव खिलाड़ी के लिए गलतियों का परिणाम हो सकती है। क्या कोई ऐसा कार्यक्रम है जो उदाहरण के लिए मध्यवर्ती खिलाड़ियों के लिए सबसे अच्छा "व्यावहारिक" कदम पाता है? उदाहरण के लिए, यह एक ऐसा कदम उठा सकता है जो एक बहुत मजबूत हमला करने की स्थिति में ले जाता है जहां प्रतिद्वंद्वी सबसे अधिक गलती करेगा, भले ही इसे सही खेल के साथ बचाव किया जा सकता है।


5
बहुत दिलचस्प सवाल है, लेकिन मुझे लगता है कि इस तरह से कुछ लागू करना मुश्किल हो सकता है क्योंकि "व्यावहारिक", स्थिति के आधार पर बहुत अलग हो सकता है। उदाहरण के लिए, एक ही चाल एक प्रतिद्वंद्वी 200 अंक ऊपर और 200 अंक नीचे के खिलाफ समान रूप से व्यावहारिक होगा? शास्त्रीय खेल बनाम ब्लिट्ज खेल के बारे में क्या?
अकवाल

लगता है कि आप मिनिमैक्स की तुलना में उम्मीद के करीब कुछ करना चाहते हैं?
मेहरदाद

यह मुझे पोकर की याद दिलाता है। मुझे लगता है कि अधिकांश पोकरबोट हमेशा नैश संतुलन मानने के बजाय व्यावहारिक चाल चलते हैं और सैद्धांतिक सर्वश्रेष्ठ चाल खेलने की कोशिश करते हैं।
पॉल

इस बारे में सोचने का एक तरीका यह है कि आप एक अलग उद्देश्य फ़ंक्शन को निर्धारित करना चाहते हैं। जब आप हार रहे होते हैं, तो आप केवल इतना ही नहीं कम करना चाहते हैं कि आप कितना खो रहे हैं (यदि आप एक सेंटिपोन या एक रानी से हार जाते हैं)। इसके बजाय, आप यह कम से कम करना चाहते हैं कि आप कितना खो रहे हैं, वहां अभी भी एक लाइन है जो आपके प्रतिद्वंद्वी के लिए उचित रूप से गिर सकती है। आप केवल "चाल" या स्थितियों की "गणना के लिए" गिर सकते हैं, जहां केवल शीर्ष चाल (या दो) अपना लाभ जारी रखते हैं, लेकिन अन्य चालें आपके लाभ का कारण बनती हैं।
ddunn801

एक सादृश्य के रूप में, अमेरिकी फुटबॉल में आप किक को उल्टा कर देते हैं क्योंकि यह आपको (पतला) मौका जल्दी से स्कोर करने का मौका देता है, हालांकि अपेक्षित परिणाम आपको बदतर बना देगा।
ddunn801

जवाबों:


22

आप ऐसा कुछ वर्णन कर रहे हैं जो अवमानना ​​के समान है । अवमानना ​​के साथ विचार यह है कि यदि आप स्थिति में अधिक गतिशीलता रखते हैं, तो एक कमजोर प्रतिद्वंद्वी से गलतियां होने की अधिक संभावना है जो आप तब शोषण कर सकते हैं। इसलिए, दो चालें जो समान समान उपज देती हैं, उच्च अवमानना ​​स्कोर वाला इंजन उस स्थिति का चयन करेगा जो स्थिति में अधिक गतिशीलता रखता है। वर्तमान सबसे मजबूत पारंपरिक इंजनों में अवमानना ​​लागू है ( कोमोडो के लिए उदाहरण )।

अवमानना ​​का खतरा एक मजबूत प्रतिद्वंद्वी के खिलाफ है, उच्च अवमानना ​​आपको मार सकती है - आप सब के बाद इंजन को खेल को जीवित रखने के लिए एक कमजोर चाल खेलने के लिए मजबूर कर रहे हैं।


1
धन्यवाद, यह वही है जो मैं देख रहा हूं, लेकिन मेरा सवाल समान क्षमता के खिलाड़ियों के लिए भी है। उदाहरण के लिए, एक चाल से 9/10 बार जीत हासिल हो सकती है और प्रतिद्वंद्वी द्वारा किए जाने वाले संभावित कदमों को देखते हुए।
अरी

3
@ श्री हालांकि यह समान है। दो चालें लें, जिनमें से एक ड्रॉ हो जाएगी और दूसरा 90% समय जीत सकता है और शेष 10% समय का नुकसान होगा। एक बहुत उच्च अवमानना ​​सेटिंग वाला इंजन बाद को चुन सकता है (और पूर्ण रक्षा के खिलाफ हार सकता है)।
एल्योर

1
अवमानना ​​इंजन के बिना किसी भी बिंदु पर मजबूर पुनरावृत्ति को छोड़कर नहीं, शायद अवर विरोधियों के खिलाफ सबसे अधिक खेल आकर्षित करेगा।
अक्रिय अज्ञान

1
बहुत अच्छा हो सकता है अगर अन्य खिलाड़ी अपनी घड़ी में समय से बाहर चल रहे हैं।
इयान रिंगरोज 15

@ अरी अगर आपका प्रतिद्वंद्वी आपके समान स्तर पर है, तो यदि आप एक लाइन का मेटा एनालिसिस कर सकते हैं (यानी यह तय नहीं कर रहे हैं कि यह जीत रहा है, बल्कि यह अनुमान लगा रहा है कि आपका प्रतिद्वंदी यह देख सकता है कि यह जीत रहा है), तो वे 'शायद इसका विश्लेषण कर पाएंगे।
Acccumulation

6

मुझे एहसास हुआ कि यह सवाल मुख्य रूप से मानक शतरंज इंजनों पर लागू होता है जो चालों का मूल्यांकन करने के लिए न्यूनतम कार्यों का उपयोग करते हैं। हालांकि अल्फाजो जैसे शतरंज इंजन कई अलग-अलग खेलों का अनुकरण करने के लिए मोंटे कार्लो ट्री खोज का उपयोग करते हैं ताकि वे न केवल सबसे अच्छा संभव कदम देख रहे हों। यह संभव है कि उन्हें पहले से ही सबसे अच्छा "व्यावहारिक" कदम खोजने के लिए इस्तेमाल किया जा सकता है, या उन्हें उस उद्देश्य के लिए अनुकूलित किया जा सकता है। उदाहरण के लिए, मोंटे कार्लो सर्च एल्गोरिदम को "उचित" चाल को देखने के लिए अपडेट किया जा सकता है और जो भी होता है उसका अनुकरण कर सकते हैं।



लेकिन फिर आपको एल्गोरिथम में "उचित" प्रोग्राम करना होगा।
अक्रिय अज्ञान

1

ज़रुरी नहीं।

डेटाबेस उपयोगी हैं क्योंकि वे आपको बता सकते हैं कि अक्सर एक चाल चली जाती है और परिणाम क्या होता है हालांकि वे कई कारणों से परिपूर्ण नहीं होते हैं।

फ्रिट्ज़ 12 (बाद के संस्करणों के बारे में निश्चित नहीं) में "हॉटनेस" मीटर है जो आपको बताता है कि भिन्नता कितनी जटिल है।

जमीनी स्तर। यह चीजों का एक संयोजन है। आप उन चालों की तलाश कर रहे हैं, जहां सबसे अधिक राजसी चालें खराब होती हैं। कोई इंजन आपको बता नहीं सकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.