Computer Chess में Artificial Intelligence का उपयोग कैसे करें


19

कुछ (ऐतिहासिक) पत्रों में, शतरंज को कृत्रिम बुद्धिमत्ता का ड्रोसोफिला कहा गया है। जबकि मुझे लगता है कि वर्तमान शोध में, खोज एल्गोरिथ्म का मात्र अनुप्रयोग सबसे अच्छा उन्नत कंप्यूटर विज्ञान में है , मेरा मानना ​​है कि अभी भी ऐसे क्षेत्र हैं जहां एआई-तकनीक लागू कर सकते हैं (और अभ्यास) कर सकते हैं।

एक सरल उदाहरण यह होगा कि पुस्तक सीखने के लिए जहां कोई प्रोग्राम को सिखा सकता है कि उद्घाटन में कुछ चालों का उपयोग करना है या नहीं करना है क्योंकि कार्यक्रम कुछ प्रकार की स्थिति के लिए अनुपयुक्त है। हम पुनर्मूल्यांकन सीखने के एक रूप का उपयोग कर सकते हैं और इसे स्वचालित कर सकते हैं: मुझे लगता है कि मैं खुद के खिलाफ कार्यक्रम खेल सकता हूं और जीतने वाली लाइनों की संभावना बढ़ा सकता हूं और लाइनों को खोने की संभावना को कम कर सकता हूं।

सीखने के मूल्यांकन समारोह का उपयोग करने के लिए अधिक जटिल उदाहरण है (उदाहरण के लिए, कोई टुकड़ा-वर्ग तालिकाओं के मूल्यों को मोड़ सकता है )। हालाँकि, मैं सोच रहा हूँ:

  • यथार्थवादी पदों की एक विशाल राशि होने के कारण सभी शोर दिया (जैसा कि यथार्थवादी उद्घाटन लाइनों की मात्रा के विपरीत)
  • और एक कंप्यूटर शतरंज खेल की लागत (अवधि) के साथ, और लोड खेलने की आवश्यकता है।

कोई इसे प्रभावी ढंग से कैसे कर सकता है? (या मुझे अन्य तकनीकों को देखना चाहिए, उदाहरण के लिए तंत्रिका नेटवर्क।)


3
मानक दृष्टिकोण अल्फ़ा-बीटा प्रुन्ड मिनिमेक्स है। एक अनुमान के साथ। यह मशीन सीखने वाले परिवार के बजाय एआई के खोज परिवार से है।
लिंडन व्हाइट

2
वास्तविक शतरंज के स्वामी मूल रूप से उन सभी खेलों को याद करते हैं जो उन्होंने पहले खेले हैं ... इसलिए उनके पास मजबूत संस्मरण है।

2
काउंटर क्लेम भी है। मुझे याद नहीं है कि यह किसने कहा था लेकिन यह इस तरह से चलता है। जीवविज्ञानी शरीर विज्ञान, आनुवंशिकी और इतने पर की गहरी समझ प्राप्त करने के लिए ड्रोसोफिला पर प्रयोगों का उपयोग करते हैं। एआई लोग शतरंज खेलने में बेहतर और बेहतर होने के लिए शतरंज के कंप्यूटर लिखते हैं। यह हमें कंप्यूटर विज्ञान के बारे में बहुत कुछ नहीं सिखाता है; यह जीवविज्ञानी की तरह होगा जो सुपर-फास्ट, सुपर-स्ट्रॉन्ग ड्रोसोफिला प्रजनन करते हैं और उन्हें एक-दूसरे से लड़ते हैं।
डेविड रिचेर्बी

रूपक, यह "कृत्रिम बुद्धिमत्ता के ड्रोसोफिला" की तुलना में अधिक भिन्न रूप से
गर्भ धारण करने वाला है

जवाबों:


16

शतरंज के लिए पूरे राज्य का स्थान बहुत बड़ा है - इसका अनुमान मोटे तौर पर 10 43 (शैनन नंबर (शैनन, 1950) , ( विकिपीडिया ) के रूप में लगाया जा सकता है ।

आप जो विचार प्रस्तुत करते हैं - खेल सीखने के लिए एक-दूसरे के साथ खेलने वाले सुदृढीकरण सीखने वाले एजेंट - सफलतापूर्वक बैकगैमौन - टीडी-गैमन (टेसाउरो, 1995) , ( सटन एंड बार्टो द्वारा सुदृढीकरण सीखना में अध्याय ) पर लागू किया गया था । यह खेल के मूल्य समारोह का अनुमान लगाने के लिए तंत्रिका नेटवर्क का भी उपयोग करता है। यह समस्या हालांकि बहुत सरल है, क्योंकि बैकगैमौन में राज्यों की संख्या शतरंज की तुलना में काफी कम है, अर्थात्: 18,528,584,051,601,162,496 (बैकगैमॉन फोरम आर्काइव थ्रेड )।

यदि आप, हालांकि, कुछ प्रारंभिक चालों के बाद खेल को समाप्त कर देंगे और केवल "अच्छी शुरुआत" सीखने के उद्देश्य से आप अनुरूप दृष्टिकोण के साथ सफल हो सकते हैं। मुख्य समस्या शुरुआती खेल के बाद खेल का मूल्यांकन करना होगा, जो कठिन लगता है। अच्छी तरह से ज्ञात उद्घाटन के बाद स्थापित पदों के लिए बस एक समानता उपाय पर्याप्त नहीं है, क्योंकि स्थिति उनसे बहुत दूर हो सकती है यदि प्रतिद्वंद्वी एक बेवकूफ कदम उठाएगा (तो यह सीखने की गलती की वजह से नहीं होगा, इसलिए स्थिति यहां तक ​​कि अगर "गलत है" "एक अच्छे परिणाम के रूप में मूल्यांकन किया जाना चाहिए)।

संदर्भ:


1
वास्तव में सबसे मुश्किल हिस्सा खुलने के परिणाम के लिए अनुभवजन्य तरीके के साथ आ रहा है। अलग-अलग उद्घाटन अलग-अलग तरीकों से अच्छे होते हैं, इसलिए संभवतः स्वीकार्य उद्घाटन की भीड़ होती है।
21

3

मुझे पूरा यकीन है कि पाठ्यपुस्तकों में एआई या एमएल के किसी भी संभव (या अजीब) तरीके की कोशिश की गई है और सरल ब्रूट बल की तुलना में बहुत अधिक असफल रहा है।

मेरा व्यक्तिगत दृष्टिकोण यह है कि प्रति सेस आधुनिक एआई के लिए किसी भी अधिक ब्याज का नहीं है ... बस, क्योंकि यह हल किया गया है : बस एक आधुनिक कंप्यूटर और जानवर बल का उपयोग करके। इसलिए, मुझे नहीं लगता कि इसे और अधिक कुशलता से हल करने के लिए एक "बुद्धिमान" प्रणाली बनाने की आवश्यकता है (मेरे सेल फोन में ठीक काम करता है), और मेरा मानना ​​है कि कुछ अज्ञात और अधिक की आवश्यकता भी नहीं है "बुद्धिमान" दृष्टिकोण मौजूद है।


1
मुझे यकीन नहीं है कि यह क्यों घट गया। तर्क है कि शतरंज "हल" है, थोड़ा गलत है, इसमें कोई भी कंप्यूटर किसी भी संभावित स्थिति को नहीं देख सकता है और इसका पूरी तरह से मूल्यांकन कर सकता है। उस ने कहा, iliasfl स्पॉट-ऑन है कि इसने AI अनुसंधान के लिए अपनी अधिकांश अपील खो दी है। एक चीज के लिए, सबसे अच्छा कंप्यूटर शतरंज कार्यक्रम अब सबसे अच्छे मनुष्यों की तुलना में काफी मजबूत हैं, जिसे पर्याप्त प्रसंस्करण शक्ति और समय दिया जाता है। यह प्रोग्रामर के लिए यह मूल्यांकन करना भी कठिन हो जाता है कि एल्गोरिथम कितनी अच्छी तरह काम करता है।
17

1
धन्यवाद, मैंने कहा कि इस अर्थ में कि बल बल एक समाधान है। बेशक एआई समुदाय (सामान्य तौर पर सिर्फ यहां नहीं) उस "समाधान" से खुश नहीं है। हालांकि, हमारे पास पहले से ही एक कम्प्यूटेशनल प्रणाली है जो इस कार्य को हल करने के लिए "बुद्धिमान" व्यवहार प्रस्तुत करती है, और यहां तक ​​कि सर्वश्रेष्ठ मनुष्यों को भी जीतती है। व्यक्तिगत रूप से, मेरा मानना ​​है कि शतरंज कुछ वर्षों के बाद एआई के लिए ऑफ-टॉपिक होगा, जब शिक्षाविदों का वर्तमान द्रव्यमान जो इसे रिटायर करने पर करियर खर्च करता है।

मैं वर्तमान कंप्यूटर शतरंज कार्यान्वयन को 'ब्रूट फोर्स द्वारा हल' के रूप में नहीं कहूंगा - वे अभी भी बड़ी मात्रा में गेमस्टेट्स की खोज कर रहे हैं, लेकिन गैर-ब्रूट बल के कई घटक हैं। बेशक, वे एक "मानव-शैली" समाधान नहीं हैं जो अन्य समस्याओं के लिए अच्छी तरह से सामान्य हो जाएंगे, लेकिन मुझे आश्चर्य नहीं होगा कि अगर हमारे पास "मानव-शैली" शतरंज एआई था, तो यह परिमाण के कई आदेश कम होंगे वर्तमान विशेष समाधानों की तुलना में कुशल, यह केवल अवर बनाता है।
पीटरिस

मुझे लगता है कि यह उत्तर और इसकी टिप्पणियां Google के अल्फ़ाज़ेरो द्वारा काफी स्पष्ट रूप से मना कर दी गई थीं: en.wikipedia.org/wiki/AlphaZero भले ही आप स्टॉकफ़िश के लिए सेटअप के बारे में आलोचना स्वीकार करते हों और उन्होंने सभी मैचों को ड्रा किया हो, एक प्रणाली जो उस स्तर तक पहुंच गई प्रशिक्षण के कुछ घंटों के साथ स्पष्ट रूप से बेहतर है।
कमल

2

मुझे लगता है कि एआई समस्या से निपटने के तरीके को निर्धारित करने के लिए यह ध्यान देने योग्य है कि आपको इसे परिभाषित करना होगा। चाहे वह पूरी तरह से अवलोकन योग्य हो या आंशिक रूप से अवलोकन योग्य हो , और चाहे वह निर्धारक या स्टोचस्टिक / चांस हो।

शतरंज पूरी तरह से अवलोकन योग्य है, (उदाहरण के लिए बैकगैमौन, एकाधिकार या पोकर के विपरीत) यह निर्धारक (जैसे चेकर्स, और उदाहरण के लिए जाएं) अंतिम रूप से, विरोधी मौजूद हैं और इसके कारण जब अगला सबसे अच्छा कदम निर्धारित करते हैं तो यह एडवरसैरियल खोज प्रकार का उपयोग करने के लिए उपयोगी होता है मिनीमैक्स जैसे एल्गोरिदम। एक समस्या को वर्गीकृत करने से हमें यह निर्धारित करने में मदद मिल सकती है कि हम किस प्रकार का खोज एल्गोरिदम लागू करना चाहते हैं। और शतरंज के मामले में, एडवांसरियल सर्च फिट होगा।

विशेष रूप से मिनीमैक्स एक है

हे(n)

हे()

तो शतरंज के मामले में, बी 35 होगा, और मी 100 होगा। इसके चारों ओर तरीके हैं या इसे और अधिक कुशल बनाने के लिए रणनीति है, जैसे अल्फा-बीटा कटऑफ।


इस संदर्भ में भी ध्यान देने योग्य बात यह है कि कुछ टुकड़ों तक शतरंज के लिए अंतिम गेम पहले से ही सारणीबद्ध हैं - एक और अनुकूलन।
बार्टोसजप

यह सामान्य दृष्टिकोण है, लेकिन मशीन-शिक्षण दृष्टिकोण नहीं है। प्रश्न मशीन-सीखने के टैग का उपयोग करता है।
लिंडन व्हाइट

@ ऑक्साबॉक्स हालांकि यह सच हुआ करता था, पूछने वाले ने इस बात का उल्लेख नहीं किया कि शीर्षक या निकाय में वह कहां है जिसे वह मशीन लर्निंग दृष्टिकोण में रुचि रखते थे, केवल अंत में जहां वह एक दृष्टिकोण का एक उदाहरण साझा कर रहा था जो उसके पास था। मशीन लर्निंग को समस्या को प्रतिबंधित करने की आवश्यकता नहीं है, न ही एक लर्निंग एल्गोरिदम (एनएन)।
इकोनोविसी

वास्तव में, यह अच्छा है
लिंडन व्हाइट

सटीक होने के लिए, शतरंज पूर्ण अवलोकन योग्य नहीं है, क्योंकि एक ऐसी स्थिति दी गई है जिसे हम नहीं जानते हैं, उदाहरण के लिए, एक राजा या एक बदमाश पहले से ही चला गया है या नहीं, हालांकि यह कदम पीढ़ी के लिए महत्वपूर्ण है (क्या अभी भी संभव है?)? लेकिन एक प्रोग्रामर गैर-स्थानांतरित राजा / बदमाश को अलग करने और एक अलग आंकड़े के रूप में राजा / बदमाश को अलग करने की स्थिति प्रतिनिधित्व को बदलकर इसे पूरी तरह से अवलोकन योग्य बना सकता है, हालांकि यह कुछ कठिनाइयों को जोड़ता है।
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.