कंप्यूटर के अनुसार शतरंज की चाल जीतने की संभावना में सुधार क्यों कर सकती है?


14

जब http://grandchesstour.org/ पर सिंकेफील्ड कप को देखते हैं, तो विभिन्न चालों को आज़माना संभव है, और देखें कि आपके सुझाए गए कदम के बाद कंप्यूटर कैसे खड़े होने का मूल्यांकन करता है।

अब, अधिकांश चालें आपकी स्थिति को ख़राब कर देंगी, अगर इसे कंप्यूटर द्वारा सबसे अच्छा कदम नहीं माना जाता है। लेकिन कुछ चालों के लिए (काफी बार) आपको तुरंत जीतने का एक बढ़ा मौका मिलता है, शायद आधा प्यादे का फायदा होता है। मुझे यह समझ में नहीं आता है: यदि किसी एकल चाल में खिलाड़ियों की स्थिति में काफी सुधार की संभावना है, तो क्या यह पहले से ही इस कदम से पहले मौजूदा स्थिति में परिलक्षित नहीं होनी चाहिए? मेरे दिमाग में, किसी भी कदम को कंप्यूटर द्वारा सबसे अच्छा कदम नहीं माना जाता है, एक बिगड़ा हुआ स्थिति की ओर ले जाना चाहिए, जबकि सबसे अच्छी चाल बस सबसे अच्छी तरह से खड़ी रखना चाहिए, वास्तव में खिलाड़ियों की स्थिति में सुधार नहीं करना चाहिए। क्योंकि, अगर कंप्यूटर को पता है कि इस कदम से खिलाड़ियों की स्थिति में सुधार होगा, तो उसे पहले से ही मौजूदा स्थिति में खिलाड़ियों की स्थिति में सुधार करना चाहिए, यह कहते हुए कि "सबसे अच्छा खेलने के साथ, आप आधे मोहरे हैं"?

हम्म, या शायद यह सिर्फ एक परिणाम है कि वेबसाइट grandchesstour.org पर कैसे लागू किया जाता है?


4
कुछ मामलों में, इंजनों को सही चाल खोजने में परेशानी होती है, लेकिन जब आप इसे मैन्युअल रूप से दर्ज करते हैं तो इसका सही मूल्यांकन करते हैं। यह उतना सामान्य नहीं है जितना आप वर्णन कर रहे हैं।
11684

जवाबों:


26

यदि कंप्यूटर खेल के अंत में खेलने की हर पंक्ति का सही मूल्यांकन करने में सक्षम था, तो मूल्यांकन कभी नहीं बदलेगा। दरअसल, हर कदम का मूल्यांकन "जीत", "हार" या "ड्रा" होगा। यह अनिवार्य रूप से एंडगेम टेबलबेस में होता है। * यदि कंप्यूटर हर स्थिति के लिए ऐसा कर सकता है, तो कंप्यूटर के खिलाफ हर गेम में कंप्यूटर शामिल होगा या तो बिना मूव किए इस्तीफा दे सकता है, आपको शुरुआती स्थिति में ड्रॉ की पेशकश करेगा या नाराज हो जाएगा कि आपने इस्तीफा नहीं दिया या उस ड्रा ऑफर को स्वीकार नहीं किया।

हालाँकि, कंप्यूटर उस दूर का मूल्यांकन नहीं कर सकते क्योंकि यह असंभव रूप से लंबा होगा, दोनों क्योंकि खेल बहुत लंबे (सैकड़ों चालें, सिद्धांत रूप में) हो सकते हैं और क्योंकि प्रत्येक चाल पर बहुत संभावनाएं हैं। इसलिए, कंप्यूटर को कई शॉर्टकट लेने पड़ते हैं। इसमें यह पता लगाने की कोशिश करना शामिल है कि सबसे महत्वपूर्ण उम्मीदवार चालें क्या हैं (असुरक्षित टुकड़ा लेना संभवतः एक महान चाल है; आपकी रानी को फांसी देना शायद एक भयानक कदम है ...) और कई चालों के बाद भी खोज को रोकना और कुछ अनुमानों का उपयोग करना। परिणामी स्थिति अच्छी है या नहीं, यह जानने के लिए अधिक खोज करने की बजाय।

समस्या यह है कि ये शॉर्टकट गलत हो सकते हैं। कंप्यूटर यह तय कर सकता है कि एक टुकड़ा लटकाना तब बुरा है जब वह वास्तव में एक प्रतिभाशाली बलिदान हो। यह तय हो सकता है कि वास्तव में ऐसा नहीं होने पर स्थिति स्थिर हो गई है। किसी विशेष चाल के वास्तविक बिंदु को देखने के लिए भविष्य में इसे देखने के लिए पर्याप्त शक्ति नहीं होनी चाहिए।

यहां एक सरल उदाहरण है, हालांकि यह अब बहुत यथार्थवादी नहीं है। माना कि आप मेरी जाँच करने वाले हैं, लेकिन मेरे पास दस चेकों की एक श्रृंखला है जो मैं आपको विलंबित करने के लिए कर सकता हूँ। अगर मैं केवल दस चालों को पहले ही देख लेता हूं, तो मुझे लगता है कि मैं ठीक कर रहा हूं: शायद मैं भी मोहरा हूं, इसलिए मेरा मूल्यांकन है "दस चालों के बाद, मैं अभी भी एक मोहरा हूं, इसलिए मैं अच्छा हूं स्कोर 1 "मैं अपना पहला चेक खेलता हूं, आप जवाब देते हैं, और अब मैं देखता हूं कि यह दस में दोस्त है और इस्तीफा दे। यह तथाकथित "क्षितिज प्रभाव" है जो आधुनिक कार्यक्रमों से बचने की कोशिश करता है (उदाहरण के लिए, उन लाइनों के साथ गहराई से देखकर जिनके पास बहुत अधिक मजबूर चालें हैं) लेकिन यह सामान्य सिद्धांत को दिखाता है।

यदि इंजन भविष्य में दस चालों को देख सकता है, कह सकता है, तो यह खेल में दूर तक देख रहा है क्योंकि प्रत्येक चाल बनी हुई है। प्रारंभिक स्थिति में, यह देख सकता है कि बोर्ड 10 की चाल पर कैसा दिखेगा; एक चाल के बाद, यह 11 और इतने पर आगे बढ़ने के लिए देख सकता है। (फिर से, यह एक सरलीकरण है, क्योंकि कंप्यूटर नहीं करते हैं, इन दिनों, भविष्य में एक निश्चित दूरी देखते हैं, लेकिन यह आपको सामान्य विचार देता है।)

आपके द्वारा दिया गया उदाहरण मेरे द्वारा दिए गए उदाहरणों का सिर्फ एक नाटकीय संस्करण है। जैसे-जैसे अधिक चाल होती है, कंप्यूटर गेम में गहराई से देख सकता है, इसलिए यह अधिक सटीक मूल्यांकन दे सकता है। इसे देखने का एक और तरीका जानकारी के संदर्भ में है: जैसे-जैसे अधिक चालें चलती हैं, कंप्यूटर में अधिक जानकारी होती है। यह अनुमान लगाता था कि आपकी प्रतिक्रिया 1.e4 के बारे में क्या होगी, लेकिन अब यह पता है कि आपने सिसिलियन खेला है, और इसी तरह।


* यहाँ एक मामूली बारीकियों है कि आप वास्तव में दोहराने की स्थिति से बचने के लिए जीत के लिए चाल की संख्या की गणना करने की आवश्यकता है। उदाहरण के लिए, KQ बनाम K के एंडगेम पर विचार करें। हर वह कदम जो रानी को गतिरोध या समर्पण नहीं करता है, इसलिए आपको यादृच्छिक रूप से चलने और कहने के बजाय चेकमेट की ओर ड्राइव करने के लिए एक तंत्र की आवश्यकता है, "वाह, मैं पूरी तरह से जा रहा हूं। इसे जीतने के लिए - लगभग हर चाल जीत जाती है! "


बहुत बढ़िया जवाब! मैंने उस "क्षितिज प्रभाव" के बारे में कभी नहीं सुना, बहुत समझ में आता है, बहुत दिलचस्प है।
पेड्रो ए

स्पष्टीकरण के लिए धन्यवाद। मैं ज्यादातर एक ही कदम के बड़े प्रभाव के बारे में धुंध में हूँ, लेकिन मुझे लगता है कि जिस समय का विश्लेषण करने के लिए कंप्यूटर को अनुमति दी जाती है, वह प्रश्न में वेबसाइट पर काफी सीमित है, जिससे प्रभाव बड़ा हो जाता है।
जोनासफ

4

कोई असंगति नहीं है। जब आप एक चाल बनाते हैं, तो कंप्यूटर को पहले वाली स्थिति को खोजना नहीं पड़ता है। यह अब सभी प्रसंस्करण शक्ति को नई स्थिति में केंद्रित कर सकता है, और इस प्रकार मूल्यांकन बदल सकता है। गेम ट्री बहुत अलग हो सकता है।

यह वैसा ही है जैसे हम शतरंज कैसे खेलते हैं।


4
आप इसके साथ जोड़ सकते हैं कि ऑनलाइन शतरंज इंजन कई चालों का गहराई से विश्लेषण नहीं कर रहा है ताकि शुरुआत में अतिरिक्त प्लाई बहुत अधिक महत्वपूर्ण हो, क्योंकि यह आपके घर पर कंप्यूटर पर होगा।
ब्रायन टावर्स

हम्म, मैं सहमत हूं। फिर भी, मैं उत्सुक हूं कि प्रभाव एकल चाल के लिए इतना बड़ा है। मुझे लगता है कि कंप्यूटर प्रत्येक संभव अगले कदम के लिए एक महत्वपूर्ण विश्लेषण करता है, विशेष रूप से होनहार, और यह पता लगाना चाहिए कि क्या संभव चालों में से एक बहुत बेहतर स्थिति देगा और तदनुसार खड़ी वर्तमान को समायोजित करेगा। लेकिन मैं ब्रायन की टिप्पणी को देखता हूं, जो यहां महत्वपूर्ण होना चाहिए।
जोनासफ
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.