एक विशुद्ध रूप से स्व-प्रशिक्षित शतरंज एआई


46

इन्सोफ़र जैसा कि मैं समझता हूं, ऐसा प्रतीत होता है कि, आगे बढ़ने से पहले, सभी मजबूत शतरंज सॉफ्टवेयर

  1. हजारों या लाखों संभावित, भविष्य के पदों की जांच करता है;
  2. प्रत्येक भविष्य की स्थिति का मूल्यांकन कुछ अनुमान के अनुसार किया जाता है, जिसे मूल्यांकन फ़ंक्शन कहा जाता है ;
  3. पृथक्करण के लिए प्रत्येक भविष्य की स्थिति का अलग-अलग मूल्यांकन करता है , यह तय करने के लिए कि क्या स्थिति से निरंतरता का पता लगाना है;
  4. मिनिमैक्स द्वारा उपलब्ध चालों में से चुनता है ; तथा
  5. एक शुरुआती किताब का उपयोग करता है

अब तक सब ठीक है। हालांकि, एक शतरंज कार्यक्रम की ताकत ज्यादातर इसके मूल्यांकन और गुणवत्ता के मूल्यांकन की गुणवत्ता पर निर्भर करती है - और इसकी शुरुआती किताब पर भी, जो कंप्यूटर के दृष्टिकोण से, अभी तक एक और अनुमानी है। इस तरह के एक शतरंज कार्यक्रम जाहिर तौर पर, केवल खेल के बारे में उतना ही जानता है जितना कि उस मानव ने किया है जिसने अनुमान लगाया है। लगता है कि कार्यक्रम की अपनी कोई अंतर्दृष्टि नहीं है।

क्या कभी किसी ने एक शतरंज कार्यक्रम लिखा है, जिसमें उसकी खुद की अंतर्दृष्टि है? कि अपने दम पर खेल सीखता है? वह खुद को प्रशिक्षित करता है? इस तरह के एक कार्यक्रम को खेल के नियमों के साथ प्रदान किया जाएगा, और निश्चित रूप से आगे कच्चे मिनिमैक्स और quiescence बुनियादी ढांचे के साथ प्रदान किया जाएगा, और अगर यह पाया गया तो एक मजबूर साथी को पहचानने और मुकदमा चलाने में सक्षम होगा। हालाँकि, यह कोई भी आंकड़ा प्रदान नहीं किया जाएगा। उदाहरण के लिए, यह केंद्र की ओर खेल को खोलने के लिए नहीं कहा जाएगा, न ही शूरवीरों को बदमाशों को पसंद करने के लिए, और न ही सिसिलियन रक्षा क्या है। इसे ऐसे सिद्धांतों (या, बेहतर सिद्धांतों की खोज करने के लिए) की खोज करनी होगी।

अपने शुद्ध रूप में, इस तरह के कार्यक्रम को कभी भी अध्ययन करने के लिए मास्टर गेम प्रदान नहीं किया जाएगा, लेकिन केवल अपने खेल, खुद के खिलाफ खेले। केवल एक बार पूरी तरह से प्रशिक्षित होने के बाद इसे मानव प्रतिस्पर्धा पर लाया जाएगा।

क्या ऐसी शुद्ध शतरंज AI मौजूद है? क्या एक यांत्रिक शतरंज ऑटोडिडैक्ट कभी प्रकट हुआ है? वास्तव में, क्या पुराना तुर्क खुद को सिखा सकता है?

यहां एक शुद्ध शतरंज एआई का संक्षिप्त नोटिस प्रतीत होता है जो विफल रहा।

( शतरंज के उद्घाटन के कम्प्यूटरीकृत अध्ययन के बारे में इस साइट पर पहले एक संबंधित प्रश्न सामने आया है।)

अपडेट करें

इस प्रश्न के उत्तर तीन अलग-अलग दिए गए हैं, इस लेखन के समय पर, @WesFreeman द्वारा, @GregE। और @ लांडे। सभी तीनों की दृढ़ता से सिफारिश की जाती है और मैं दोषी महसूस करने जा रहा हूं, जब साइट नीति के अनुसार, मैं औपचारिक रूप से एक को दूसरों के बहिष्कार के लिए स्वीकार करता हूं । मुझे यहां तीनों के लिए धन्यवाद देना चाहिए और तीनों की सराहना करनी चाहिए।

प्रश्न संक्षिप्तता चाहते हैं। जवाबों की प्रतिक्रिया हालांकि लंबे समय तक चल सकती है। इसलिए रुचि रखने वाला पाठक यहां से सीधे उत्तर में जा सकता है और फिर, यदि अभी भी दिलचस्पी है, तो लंबे समय तक अपडेट को पढ़ने के लिए वापस आ सकता है।

जब मैंने सवाल पूछा, तो मेरे मन में निम्नलिखित बातों की तरह कुछ था।

मान लीजिए कि शांगरी-ला के बाहरी इलाके में एक काल्पनिक गांव है जहां लोगों ने शतरंज के बारे में कभी नहीं सुना है। अपनी संक्षिप्त यात्रा के दौरान, आप गाँव के बुजुर्गों को खेल के नियम सिखाते हैं, लेकिन खेल के किसी भी सिद्धांत में उन्हें निर्देश नहीं देते हैं। बड़ों में से दो बड़ों के रूप में एक खेल खेलते हैं, जबकि आप (kibitzing द्वारा नाटक को बाधित नहीं करना चाहते हैं) नियमों के प्रश्नों के लिए अपनी टिप्पणी को सीमित करते हैं। जब आप शांगरी-ला में रहते हैं तो कोई भी पोस्टमॉर्टम खेल का पालन नहीं करता है, न ही शतरंज खेला जाता है या फिर चर्चा की जाती है। हालाँकि, जब आप प्रस्थान करते हैं, तो कभी नहीं लौटते हैं, आप अपने शतरंज सेट को पीछे छोड़ देते हैं।

आपकी अनुपस्थिति में, बुजुर्ग लोगों को खेल सिखाते हैं। कुछ लोग बाद में ख़ाली समय में थोड़ा खेलते हैं, कुछ बढ़ते उत्साह के साथ, जो अपने खुद के शतरंज सेट का फैशन बनाते हैं।

ऐसे ग्रामीणों के लिए यह तुरंत स्पष्ट नहीं हो सकता है कि एक बदमाश एक शूरवीर से बेहतर था, लेकिन लोग अभी भी धीरे-धीरे कई खेलों के खेल पर शतरंज की सापेक्ष ताकत का काम कर सकते हैं। इसी तरह, यह तुरंत उनके लिए स्पष्ट नहीं हो सकता है कि 1. ए 4 एक खराब उद्घाटन थे: वे इसे आज़मा सकते थे और परिणामों पर विचार कर सकते थे।

खेल के बारे में ग्रामीणों की समझ आखिर किस हद तक बाहरी दुनिया में परिवर्तित होगी? एक शुरुआती किताब को खोना, क्या वे अपने स्वयं के उपन्यास के उद्घाटन को विकसित कर सकते हैं? बेशक, किसी को भी ग्रामीणों के खुलने की उम्मीद नहीं होगी, लेकिन पहली बार में, कुछ सदियों के अलगाव को देखते हुए, ग्रामीणों को एक सम्मानजनक उद्घाटन प्रदर्शनों की सूची मिल सकती है, जो मैं जानता हूं।

क्या उनका कोई भी उद्घाटन, स्वतंत्र रूप से विकसित, बाहर की दुनिया के लिए दिलचस्प साबित होगा, जब 200 साल बाद अगले यात्री ने उन पर ध्यान दिया? शंगरी-ला दुनिया को नया, उपन्यास, शांगरी-ला डिफेंस दे सकता है?

यदि ऐसा है, तो, शतरंज एआई पर मेरे मूल प्रश्न के संबंध में, जो मेरे मन में था, वह कमोबेश यही था: क्या शतरंज एआई कम या ज्यादा शंकर-ला की सरहद पर ग्रामीणों की शतरंज प्रगति की नकल कर सकता था?

नीचे दिए गए @ लांडे के जवाब में सुस्मान की कहानी पर गौर करें तो यह निस्संदेह सच है कि मेरे गाँव वाले खेल के प्रति कुछ खास धारणाएँ रखते हैं। उदाहरण के लिए, वे एक ऐसी समझ लाएंगे कि किसी उपयोगी चीज को अधिक से अधिक रखने के लिए आम तौर पर उसके पास कम से कम बेहतर था, और इसलिए कि प्रतिद्वंद्वी के शतरंज को पकड़ने के लिए संभवतः, आमतौर पर किसी के खुद को पकड़ने के लिए बेहतर था। प्रकृति द्वारा शांगरी-ला के काल्पनिक लोग कितने क्षेत्रीय थे, साहित्य के लिए एक प्रश्न है, लेकिन कोई यह मान सकता है कि वे ऐसी स्थिति को पहचानेंगे जो कम स्थान की अपेक्षा अधिक स्थान को श्रेष्ठ मानती है। और किसी भी उज्ज्वल नौसिखिए, एक बार एक शतरंज सेट दिखाया और खेल के नियमों में निर्देश दिया, यह अनुमान लगा सकता है कि एक रानी संभवतः एक मोहरे से बेहतर है, बस इसके द्वारा रानी को 27 चालें उपलब्ध हैं,

इसलिए मेरा सवाल यह है कि शतरंज बोर्ड को किसी भी तरह का ज्ञान लाने के खिलाफ एक निरपेक्ष, सूसमैन-शैली निषेधाज्ञा लागू करने की आवश्यकता नहीं है; बल्कि पूर्व-निर्धारित, शतरंज-विशिष्ट ज्ञान के खिलाफ एक सामान्य निषेधाज्ञा लागू करने के लिए। आखिरकार (खेल के नियमों के विकास के मामले की बहुत पहले से अवहेलना), अतीत में कुछ समय पर, शतरंज का पहला खेल खेला गया था। हो सकता है पहले खिलाड़ी ने ओपनिंग की थी 1. a4; लेकिन अंततः उसने बेहतर सीखा, और अपने शिष्यों को जो सीखा था, वह सिखाया; जो बारी-बारी से हमें कास्परोव को देने के लिए, पीढ़ी दर पीढ़ी अधिक सीखा और पढ़ाया गया।

क्या एआई ऐसा कुछ नहीं कर सकता था, जो सदियों के बजाय केवल हफ्तों में हो?

प्लेटो को संदेह होगा, मुझे लगता है। ह्यूम अधिक आशावादी होगा, लेकिन यह सवाल अब केवल दर्शन द्वारा तय नहीं किया जाएगा। हमारे पास अब इलेक्ट्रॉनिक कंप्यूटर हैं जिनके साथ प्रस्ताव का परीक्षण करना है, और मैं सोच रहा था कि एआई कला की स्थिति क्या थी। वर्तमान में सबसे अच्छा शतरंज एआईएस पूरी तरह से अनजाने विशेषज्ञ प्रणालियों के रूप में प्रतीत होता है जो हर किसी को कुछ भी नहीं दिखाते हुए हरा देता है। मुझे आश्चर्य है कि क्या थोड़ा व्यापक एआई, जो कुछ अर्थों में, वास्तव में शतरंज के बारे में सोचते हैं, उन्हें खुद को खेल सिखाने में काफी सफलता मिली।

मैं इकट्ठा करता हूं कि जवाब नहीं है, शायद नहीं।


4
यह वास्तव में इस साइट पर बेहतर प्रश्नों में से एक है।
प्रिस्वान

5
ऐसा लग रहा है कि जवाब अब हाँ है क्योंकि दीपमिन्द ने अभी हाल ही में एक नए स्टेट ऑफ़ द आर्ट चेस एआई पर शोध किया है जिसे उन्होंने स्क्रैच (केवल सेल्फ प्ले, नो रेफरेंस गेम्स) से प्रशिक्षित किया है। arxiv.org/pdf/1712.01815.pdf
लालचंद

1
@ लैलालैंड की टिप्पणी पर कहा, मुझे लगता है कि 10 घंटे के लिए प्रशिक्षण के बाद यह पूरी तरह से स्टॉकफिश को कुचल दिया (निश्चित नहीं कि कौन सा संस्करण) जैसे कि स्टॉकफिश एक शुरुआत थी। इंजन बनाम इंजन गेम में बहुत ज्यादा अनसुना। अल्फ़ाज़ो शून्य की तरह लगता है ताल की शैली में खेलना पसंद है
एरियाना

2
"क्या कोई एआई कुछ हफ्तों में ऐसा कर सकता है, सदियों से नहीं? शायद नहीं।" ठीक है, तुम एक तरह से सही थे ... केवल कुछ घंटे लगे।
user230452

1
काफी कुछ खिलाड़ियों, जैसे कि कैपबेलैंका, को माना जाता है कि इस खेल को एक बार खेला गया था। और याद रखें कि अल्फा ज़ीरो के पास सोचने के लिए और कुछ नहीं था।
फिलिप रो

जवाबों:


26

आपके पास कुछ बहुत ही दिलचस्प बिंदु हैं। मुझे एआई रिसर्च का थोड़ा अनुभव है (मेरा M.Sc. इस क्षेत्र में था), इसलिए मुझे लगता है कि मैं कुछ अंतर्दृष्टि प्रदान कर सकता हूं।

क्षेत्र में फिर से खोज

सबसे पहले, इस क्षेत्र में अनुसंधान निश्चित रूप से हो रहा है - "विकासवादी दृष्टिकोण शतरंज" की खोज 2001 से इस पेपर के साथ हुई, जो आपने सुझाया था, वही करते हुए न्यूनतम / अधिकतम दृष्टिकोण छोड़ दिया और केवल मूल्यांकन समारोह को संशोधित किया। बहुत अधिक खुदाई करना संभव है, और मुझे ऐसे कई लोगों के बारे में पता है जो सामान्य रूप से इस क्षेत्र में काम कर रहे थे।

सैद्धांतिक संभावनाएं

मेरी राय में, "शुद्ध" शतरंज खेलने वाले एआई के निर्माण के लिए एकमात्र वास्तविक सीमित कारक गणना समय है। ऐसा कोई कारण नहीं है कि वर्तमान दृष्टिकोणों का उपयोग करके ऐसा AI सैद्धांतिक रूप से नहीं बनाया जा सकता है।

चलन

शतरंज ह्यूरिस्टिक फ़ंक्शन को विकसित करने में विकासवादी या आनुवंशिक दृष्टिकोणों का उपयोग करने के साथ दो मुख्य समस्याएं हैं, पहला यह है कि इसके सबसे बुनियादी, शतरंज के लिए एक हेयुरिस्टिक फ़ंक्शन भी बेहद जटिल है। हम सैकड़ों नियम, टुकड़ा मूल्यांकन (जो स्थिति, आदि के आधार पर भिन्न हो सकते हैं), स्थितीय विश्लेषण आदि की बात कर रहे हैं, आपको इन नियमों का वर्णन करने के लिए एक लचीली कंप्यूटर भाषा की आवश्यकता होगी, और फिर ये नियम बेतरतीब ढंग से उत्पन्न हो सकते हैं, उत्परिवर्तित, एक दूसरे के साथ नस्ल, आदि यह निश्चित रूप से संभव है, लेकिन मुझे लगता है कि आप एक नियम सेट के साथ समाप्त होंगे जो कई हजार संस्थाओं से मिलकर बनता है। यह एक बहुत बड़ा नियम है जो गतिशील रूप से विकसित होता है।

दूसरी समस्या यह है कि वास्तव में आपके नए संशोधित नियम का मूल्यांकन करने के लिए, आपको शतरंज के खेल खेलने होंगे, और देखना होगा कि कौन जीतता है। यदि आप इसे "सही ढंग से" करना चाहते हैं, तो आप दोनों खिलाड़ियों को सोचने के लिए पर्याप्त समय देना चाहेंगे, जो कि विशिष्ट गेम की लंबाई के समान है। हालांकि, केवल एक ही प्रतिद्वंद्वी खेलना पर्याप्त नहीं है, आप कई अलग-अलग विरोधियों को खेलना चाहते हैं, और शायद एक ही विरोधियों को भी, कई बार, इससे पहले कि आप वास्तव में आश्वस्त हो सकें कि आपने खेल की ताकत में सुधार पाया है। इसका मतलब होगा कि आपकी आबादी में प्रति व्यक्ति सौ खेल खेलने के लिए, और यह आपको अपने एल्गोरिथ्म की एक पीढ़ी देता है।

आमतौर पर इन प्रकार के दृष्टिकोणों के साथ, आप कम से कम कई सौ पीढ़ियों को देख रहे होंगे, या शतरंज के उत्तराधिकारी के रूप में ऐसे जटिल कार्य, कई सौ हजार (या लाखों) पीढ़ियों के साथ। कुछ त्वरित गणित आपको यह समझाना चाहिए कि एक पीढ़ी के लिए आपको कई हजार सीपीयू समय की आवश्यकता होगी, यहां तक ​​कि महत्वपूर्ण आकार के एक सर्वर फार्म को स्केल करने के लिए, आपको वास्तव में विकसित होने के लिए कई (संभवतः सैकड़ों) वर्षों की आवश्यकता होगी। आप अपने अद्यतन में उल्लेख करते हैं।

उस समय के अंत में, आपके पास एक दिलचस्प एल्गोरिथ्म होगा, जिसमें संभवत: खेल में बहुत सारे अंतर्दृष्टि होंगे जो कभी भी खोजे नहीं गए हैं। यह बताना मुश्किल है कि वे मनुष्यों के लिए उपयोगी या समझने योग्य भी होंगे या नहीं। यह नियम क्यों मौजूद है? क्योंकि कई हजार से अधिक खेल, यह काम करने के लिए लग रहा था।

भविष्य

मुझे कोई संदेह नहीं है कि कंप्यूटिंग शक्ति बढ़ने के साथ ये दृष्टिकोण अधिक लोकप्रियता प्राप्त करेंगे। वर्तमान में, हम एक ऐसे बिंदु पर हैं जहां एक मशीन को केवल (लगभग सभी) मनुष्यों को हरा देने के लिए पर्याप्त कंप्यूटिंग समय है, अगर यह खुफिया सावधानी से हाथ से तैयार किया गया है। 20 वर्षों के समय में, यह काफी संभव है कि प्रोसेसर इतने अधिक स्थानांतरित हो गए होंगे कि गहराई में एक या दो अतिरिक्त कदम "हार्ड-कोडेड" मशीनों को पर्याप्त लाभ नहीं देते हैं, लेकिन विकसित, अजीब सहज मशीनों द्वारा नियमित रूप से पीटा जाता है जो कि उनके पीछे विकास के लाखों घंटे।

अपडेट 2018 मई

जैसा कि रॉबर्ट कॉचर नीचे टिप्पणी में उल्लेख करते हैं, हालिया समाचार यहां एक उल्लेख के पात्र हैं। विशेष रूप से, Google की अल्फा गो परियोजना इस प्रकार के खेलों के लिए वास्तव में व्यवहार्य एआई-आधारित दृष्टिकोण है, और 2017 के अंत में, स्टॉकफिश 2 के खिलाफ जीत का दावा किया गया , कार्य के लिए पुन: purposed होने के बाद।


धन्यवाद। मैंने देखा कि आप जिस लिंक को लिंक करते हैं, वह एम्स को पहले नॉनमास्टर मानव विरोधियों के खिलाफ और बाद में एक्सटेंस चेस सॉफ्टवेयर के खिलाफ प्रशिक्षित करता है, जो कि आपके और मेरे दिमाग में नहीं था। मेरे जैसा एक प्लैटोनिस्ट यह जानकर आश्चर्यचकित नहीं होगा कि जिस प्रकार की एआई और मैं जिस पर चर्चा कर रहे हैं वह एक व्यावहारिक अक्षमता थी (हम जानते हैं कि यह कोई सैद्धांतिक असंभवता नहीं है क्योंकि शतरंज को न्यूनतम रूप से सिद्धांत रूप में हल किया जा सकता है); लेकिन क्या कोई जवाब मुझे चौंकाता है, यह बात नहीं है। यह कहना है कि क्या किसी एआई ने प्रस्तावित उपलब्धि हासिल की है। लगता है उत्तर नहीं होगा।
THB

2
@ मुझे लगता है कि इस प्रकार के एआई में काफी संख्या में प्रयास हुए हैं, हालांकि आप उन्हें "असफल" मान सकते हैं। मुझे संदेह है कि एक बेहद सफल प्रयास (आज) शायद बहुत कमजोर शौकिया स्तर पर खेल रहा होगा; एक बड़ी उपलब्धि, सिर्फ जनता की नजर में नहीं। इसके अलावा, मुझे नहीं लगता कि मौजूदा कार्यक्रमों के खिलाफ प्रशिक्षण और मानव प्रति धोखा दे रहा है, प्रति se - बस एक बहुत बड़ा अनुकूलन, जो कि एआई के नाटक शैली की दिशा को स्थानांतरित कर सकता है।
डैनियल बी

1
यदि आप "शुद्ध" दृष्टिकोण पर अधिक पढ़ने में रुचि रखते हैं, तो संभवतः आपके पास "प्रतिस्पर्धी तालमेल" दृष्टिकोण की खोज करने के लिए अधिक भाग्य होगा। यह वाक्यांश के लिए प्रयोग किया जाता है जब प्रदर्शन का एक बाहरी उपाय प्रदान करने का कोई अच्छा तरीका नहीं है (अर्थात हम अन्य शतरंज इंजनों के खिलाफ नहीं खेल सकते हैं), इसलिए एआई प्रशिक्षण को स्वयं के विभिन्न संस्करणों को खेलकर विकसित करना होगा। यह निश्चित रूप से काम करता है, लेकिन इसमें बहुत अधिक समय लगता है, शायद यही वजह है कि यह एक कम खोज वाला दृष्टिकोण है।
डैनियल बी

1
@DanielB क्या अल्फा एअर इंडिया ऐसा है?
हैरी वेस्ले

1
आप अपने उत्तर को अपडेट करना चाह सकते हैं। chess.com/news/view/…
रॉबर्ट कौशर

17

मुझे संदेह है कि आप जो पूछ रहे हैं, उसे किसी प्रकार के आनुवंशिक एल्गोरिथम या विकासवादी एल्गोरिथम दृष्टिकोण के रूप में वर्गीकृत किया जाएगा । मुझे संदेह है कि इस तरह के एल्गोरिदम को आंतरिक स्तर पर डिजाइन करने का कोई वास्तविक तरीका नहीं है, ताकि मानव पूर्वाग्रह को मौलिक स्तर पर कुछ हद तक एम्बेड किया जा सके, क्योंकि प्रोग्रामर को अभी भी किसी स्थिति की स्थैतिक विशेषताओं (सामग्री की गिनती, प्यादा संरचना, रंग परिसरों, आदि) को परिभाषित करना है। जिसके अनुसार एआई विभिन्न खेलों से पदों की वर्गीकरण और तुलना करेगा। यदि आप शतरंज के संदर्भ में उपरोक्त एल्गोरिथम शब्दावली पर एक Google खोज करते हैं, तो आपको कई परिणाम मिलेंगे, लेकिन शायद गंभीर शोध के तरीके में बहुत कम है जो वास्तव में सफल, प्रतिस्पर्धी एआई के निर्माण के लिए उपयोग किया गया है।

तथ्य यह है कि, मूर के कानून के परिणामस्वरूप, कंप्यूटर अब ऐसी शक्तिशाली गणना करने वाली मशीनें हैं जो अत्यंत परिष्कृत AI तरीके न केवल अनावश्यक हैं (सर्वश्रेष्ठ मानव विरोधियों की तुलना में उच्च स्तर पर खेलने के मामले में), बल्कि गर्भधारण भी काउंटर-उत्पादक हो सकते हैं। शतरंज एक ऐसा खेल है जिसमें - मुख्य रूप से किसी भी स्थिति में उचित चाल की तुलनात्मक रूप से छोटे खोज स्थान के कारण और सामरिक संयोजनों को मजबूर करने के अस्तित्व (चेक के अनुक्रम दृश्यों, टुकड़ा पकड़ना, दोस्त की धमकी या भयावह सामग्री का नुकसान,) आदि) - कुछ रूढ़िवादी खोज-पेड़ छंटाई के साथ एक जानवर-बल दृष्टिकोण एक साथ सबसे एल्गोरिदमिक सरल और सबसे प्रभावी दृष्टिकोण है। यदि आप एंडगेम टेबल की उपलब्धता और किताबें खोलने में कारक हैं, तो उस दृष्टिकोण का तर्क बढ़ता है। मैं समझता हूं कि वहां सा अभी भी सैद्धांतिक रुचि और उपन्यास एआई के प्रकार में संभावित मूल्य है जिसके बारे में आप बात कर रहे हैं, लेकिन मुझे लगता है कि शतरंज गलत है जिसमें इसे विकसित करना है। दूसरी ओर, गो जैसा खेल, जो स्वभाव से कम सामरिक है और इसमें एक विशाल रूप से बड़ा खोज स्थान शामिल है, जो जानवर-बल के दृष्टिकोण को अव्यवहारिक बनाता है, अत्याधुनिक अनुसंधान के लिए एक बेहतर उम्मीदवार हो सकता है।


मैंने आपके उत्तर के प्रकाश में AI प्रश्न को अपडेट किया है। अद्यतन कम नहीं है, इसलिए, आपके विकल्प पर, जब आपके पास कुछ समय होता है, तो आप इसकी समीक्षा कर सकते हैं कि यह किस हद तक आपके हित में है।
thb

2
ऐसे किसी मानवीय पूर्वाग्रह की आवश्यकता नहीं होगी। बस कानूनी शतरंज खेलने में सक्षम 1000 यादृच्छिक एल्गोरिदम उत्पन्न करते हैं, उन्हें एक टूर्नामेंट में एक दूसरे के खिलाफ गड्ढा करते हैं, फिर शीर्ष 20% लेते हैं और अगली पीढ़ी के निर्माण के लिए उत्परिवर्तन और क्रॉसओवर लागू करते हैं। कई पीढ़ियों के लिए कई आबादी में दोहराएं और आपको अंत में कुछ आधा रास्ता सभ्य होना चाहिए। केवल फिटनेस फंक्शन की जरूरत होगी जीत / हार।
super

15

सामान्य गेम खेलते हुए विकिपीडिया का पेज देखें । यह एक सक्रिय अनुसंधान क्षेत्र है। एक वार्षिक जीजीपी टूर्नामेंट है जिसमें कार्यक्रमों को एक नए खेल के नियम दिए जाते हैं, कुछ समय के लिए इसके बारे में सोचते हैं, और फिर एक दूसरे के खिलाफ खेल खेलते हैं।

यदि आप शतरंज के नियमों को एक GGP कार्यक्रम को देते हैं, तो मुझे लगता है कि आप पाएंगे कि यह एक मानव शुरुआती की तुलना में अधिक मजबूत है और उद्देश्य-लिखित शतरंज कार्यक्रम की तुलना में बहुत कमजोर है।


13

यह स्टॉकफिश 8 के खिलाफ अल्फाज़ेरो की हालिया हड़ताली सफलता के प्रकाश में इस प्रश्न को फिर से देखने के लायक है । दीपमाइंड के अल्फ़ागो और अल्फ़ागो ज़ीरो कार्यक्रमों का एक और विकास , अल्फ़ाज़ेरो ने ग्रह पर सबसे मजबूत "पारंपरिक" शतरंज इंजनों में से एक के खिलाफ 5: = 72 -0 के चौंका देने वाले स्कोर के साथ समाप्त किया।

अल्फाज़ेरो ने खुद को सुदृढ़ीकरण सीखने के माध्यम से खेलना सिखाया, अपने खिलाफ खेल की श्रृंखला के माध्यम से अपने तंत्रिका नेटवर्क वास्तुकला का प्रशिक्षण दिया। साथ के कागज के अनुसार :

  1. स्थिति का वर्णन करने वाली इनपुट सुविधाएँ, और चाल का वर्णन करने वाली आउटपुट सुविधाएँ, विमानों के एक सेट के रूप में संरचित हैं; यानी तंत्रिका नेटवर्क वास्तुकला बोर्ड की ग्रिड-संरचना से मेल खाता है।
  2. अल्फाज़ेरो को खेल के नियमों का सही ज्ञान प्रदान किया जाता है। इनका उपयोग MCTS के दौरान किया जाता है, चालों के अनुक्रम से उत्पन्न पदों को अनुकरण करने के लिए, गेम समाप्ति को निर्धारित करने के लिए, और टर्मिनल राज्य तक पहुंचने वाले किसी भी सिमुलेशन को स्कोर करने के लिए।
  3. नियमों का ज्ञान इनपुट विमानों (जैसे कि कास्टलिंग, पुनरावृत्ति, कोई प्रगति नहीं) और आउटपुट विमानों (कैसे टुकड़े चलते हैं, पदोन्नति, और शोगी में टुकड़े गिरता है) को एनकोड करने के लिए भी उपयोग किया जाता है।
  4. अन्वेषण शोर को स्केल करने के लिए कानूनी चरणों की विशिष्ट संख्या का उपयोग किया जाता है (नीचे देखें)।
  5. शतरंज और शोगी गेम अधिकतम चरणों की संख्या (विशिष्ट गेम की लंबाई द्वारा निर्धारित) को समाप्त कर दिए गए थे और उन्हें एक परिणाम निकाला गया था; गो गेम को समाप्त कर दिया गया और ट्रॉम्प-टेलर नियमों के साथ स्कोर किया गया, इसी तरह पिछले काम (29) में।

अल्फाज़ेरो ने ऊपर सूचीबद्ध बिंदुओं से परे किसी भी प्रकार के डोमेन ज्ञान का उपयोग नहीं किया।

"- मुझे यकीन है कि एक भिन्न हार्डवेयर की तरह चीजों के बारे में सवाल उठा सकते हैं इस्तेमाल किया जा रहा हूँ AlphaZero ... 4 के साथ एक मशीन का इस्तेमाल किया tpusसूखी हुई मछली ... [अपनी] सबसे मजबूत कौशल स्तर 64 धागे का उपयोग कर और एक हैश आकार में खेला 1GB का है। " - लेकिन किसी भी मामले में अल्फाज़ेरो का परिणाम एक उल्लेखनीय है, और ओपी की नस में बहुत अधिक है।

शतरंज में स्टॉकफिश की पिटाई के अलावा, कम से कम डोमेन-विशिष्ट ज्ञान खेलने के लिए शायद और भी अधिक समर्थन का खुलासा करते हुए, अल्फ़ाज़ेरो ने शोगी को चैंपियन कार्यक्रम एल्मो को सर्वश्रेष्ठ करने के लिए प्रशिक्षित किया, और निश्चित रूप से गो में अपने पूर्ववर्ती अल्पीगो ज़ीरो को भी पीछे छोड़ दिया। ।

यहां स्टॉकफिश के खिलाफ खेल में से एक है, एक बर्लिन जिसमें सामग्री असंतुलन अंततः अल्फाज़ेरो है जिसमें बिशप की जोड़ी एक नाइट के खिलाफ है और स्टॉकफिश के लिए 4 प्यादे हैं 31.Qxc7। उस स्थिति में, अल्फाज़ेरो के सभी टुकड़े बैक रैंक पर हैं, बिशप अपने मूल वर्गों पर वापस। अंतत: रानियों के बाद सफेद मोहरे लेने के लिए काले टुकड़ों को धीरे-धीरे छलनी करने के लिए, और वह पर्दे हैं।

स्टॉकफ़िश - अल्फाज़ेरो, 2017-12-04, 0-1
1. E4 E5 2. Nf3 NC6 3. BB5 Nf6 4. d3 Bc5 5. Bxc6 dxc6 6. OO Nd7 7. Nbd2 OO 8. QE1 F6 9. Nc4 Rf7 10 ए 4 Bf8 11. Kh1 Nc5 12. a5 NE6 13। Ncxe5 fxe5 14. Nxe5 Rf6 15. NG4 Rf7 16. Ne5 Re7 17. ए 6 सी 5 18. F4 Qe8 19. axb7 Bxb7 20. Qa5 ND4 21. QC3 RE6 22. Be3 RB6 23. Nc4 RB4 24. बी 3 a5 25. Rxa5 Rxa5 26. Nxa5 Ba6 27. Bxd4 Rxd4 28. Nc4 Rd8 29. G3 h6 30. Qa5 Bc8 31. Qxc7 BH3 32. Rg1 Rd7 33. Qe5 Qxe5 34. Nxe5 Ra7 35. Nc4 G5 36. RC1 Bg7 37। Ne5 Ra8 38. Nf3 Bb2 39. Rb1 Bc3 40. Ng1 Bd7 41. Ne2 Bd2 42. Rd1 Be3 43. Kg2 Bg4 44. Re1 Bd2 45. Rf1 Ra2 46. ​​h3 Bxe2 47. Rf2 Bxf4 48. Rx2। Be5 49 RF2 Kg7 50. g4 BD4 51. re2 Kf6 52. E5 + Bxe5 53. केएफ 3 RA1 54. RF2 1 रुपया 55 Kg2 + BF4 56. सी 3 RC1 57. d4 Rxc3 58. dxc5 Rxc5 59 बी 4 RC3 60. h4 Ke5 61 । hxg5 hxg5 62. Re2 + Kf6 63. Kf2 Be5 64. Ra2 Rc4 65. Ra6 + Ke7 66. Ra5 Ke6 67. Ra6 + Bd6 0-1

11

मुझे लगता है कि इस तरह के एआई का उत्पादन करने का मुख्य कारण "प्रशिक्षण" को प्रभावी बनाने के लिए आवश्यक स्थान के कारण है।

इसके अलावा (आपके स्व-प्रशिक्षण टिप्पणी की प्रतिक्रिया के रूप में), इस तरह के एआई को बेहतर बनाने की कोशिश करते हुए स्व-प्रशिक्षण हानिकारक हो सकता है - मैंने टिक-टैक-टो (आमतौर पर बहुत सरल) के साथ कुछ शोध किया है, और यह सभी प्रकार का पाया गया जीतने के लिए भयानक तरीके (और उन भयानक तरीकों को प्रशिक्षित करना) क्योंकि दोनों पक्षों ने भयानक रूप से खेला था। टिक-टैक-टू में एक अच्छे लुक-फॉरवर्ड AI के खिलाफ प्रशिक्षण की तुलना में स्व-प्रशिक्षण के साथ उचित प्रदर्शन प्राप्त करने में बहुत अधिक समय लगा।

हालांकि, मुझे लगता है कि यह एक हाइब्रिड को देखना दिलचस्प होगा जो गहरी खोज और "प्रशिक्षण" दोनों का उपयोग करता है - मध्यम गेम (केवल एंडगेम और ओपनिंग के बजाय) के लिए कुछ प्रकार के संग्रहीत डेटाबेस। इसके लिए काफी जगह की जरूरत होगी।

हो सकता है कि आप अधिक "वास्तविक" एआई दृष्टिकोण के बारे में सोच रहे हों जो स्थिति जीतने / हानि / आकर्षित करने के बजाय स्थिति संबंधी अवधारणाओं को सीखेंगे, लेकिन मुझे नहीं लगता कि यह बहुत प्रभावी होगा (मजबूत इंजनों की तुलना में)।


उत्तर की सराहना की है। मेरा मानना ​​है कि मेरे मन में एआई था (ए) के पास एक न्यूनतम क्षमता थी लेकिन (बी) में एक पूर्व निर्धारित मूल्यांकन समारोह का अभाव था। इस तरह के एआई को शुद्ध रूप से मिनिमैक्स द्वारा टिक-टैक-टो के रूप में इतने छोटे खेल को हल करना आवश्यक है। शतरंज में, एक गेम केवल न्यूनतम रूप से अतिसंवेदनशील होता है, एआई बोर्ड पर वर्तमान स्थिति नहीं बल्कि भविष्य के पदों का मूल्यांकन करेगा, जिसके बाद मिनिमैक्स इस कदम का चयन करेगा। यह शायद ही कहा जा सकता है कि निमोज़ोवित्च ने ज्ञात मूल्यांकन उत्तराधिकार को त्याग कर शतरंज में क्रांति ला दी। यदि हां, तो क्या कोई मशीन इसी तरह काम कर सकती है?
thb

1
तो आप कह रहे हैं कि यह अपना मूल्यांकन कार्य विकसित करेगा?
ईव फ्रीमैन

2
@thb, एक प्रोग्रामर के रूप में, मुझे लगता है कि आपकी धारणा के साथ मुद्दा यह है कि जहां तक ​​मैं देख सकता हूं, कोई भी प्रशंसनीय शतरंज AI मूल्यांकन समारोह के लिए पूरी तरह से खाली स्लेट के साथ शुरू नहीं हो सकता है। कोई ऐसा एआई लिख सकता है जो पैटर्न के लिए गेम का विश्लेषण करता है और इसके मूल्यांकन और निर्णय लेने की क्षमता को ठीक करने के लिए सांख्यिकीय / संभाव्य विधियों (जैसे, बायेसियन इंट्रेंस) का उपयोग करता है, लेकिन प्रोग्रामर को पहचानना होगा कि क्या रूपांकनों, स्थिति कारकों, चाल अनुक्रमों का गठन किया है। और उनका आकलन करने के लिए कौन से मापदंड हैं। दूसरे शब्दों में, मूल्यांकन समारोह के मूल मूल को अभी भी मानव-डिज़ाइन करने की आवश्यकता होगी।
ग्रेग ई।

1
यह देखना दिलचस्प हो सकता है कि जेनेटिक मिनिमैक्स इंजन किस चीज के साथ आता है, उदाहरण के लिए, यदि आप जीत / हानि / ड्रा के आधार पर एक ही सामग्री मूल्य के साथ सभी टुकड़े शुरू करना चाहते थे, और भौतिक मूल्यों को म्यूट कर दें। मुझे यकीन है कि इंजन रचनाकारों ने पहले ही इनका उपयोग करने की कोशिश की है, जैसे शूरवीर 2.9 और बिशप 3.1 प्यादे बनाना।
ईव फ्रीमैन

1
@thb, मैं कोई विशेषज्ञ नहीं हूं, लेकिन मुझे लगता है कि ऐसा ही है। यहां तक ​​कि आपके द्वारा लिंक किया गया AI प्रोग्रामर बायसेज़ द्वारा बाध्य है। यदि आप मूल शोध पत्र पढ़ते हैं, तो यह नोट करता है कि "फीचर वेक्टर" मूल्यांकन फ़ंक्शन को प्रशिक्षित करने में बोर्ड की विशेषताएं शामिल हैं जो "ध्यान से डिजाइन किए गए थे।" यही है, प्रोग्रामर को अभी भी स्थिर स्थितीय कारकों के सेट को निर्दिष्ट करना है जो एआई अपने निर्णय लेने के आधार पर करता है। इस विशेष परियोजना के लिए एक तंत्रिका जाल का प्रमुख लाभ, मुझे लगता है कि प्रशिक्षण को समानांतर किया जा सकता है, जिससे बड़ी मात्रा में खेल के कुशलतापूर्वक प्रसंस्करण के अतुल्यकालिक प्रसंस्करण की अनुमति मिलती है।
ग्रेग ई।

10

मैं यहाँ ग्रेग के और वेस के उत्तर पर विस्तार करना चाहता हूँ। इस प्रकार के AI का प्रस्ताव है कि बस इस आवेदन के लिए आवश्यक परिष्कार के साथ मौजूद नहीं है। और अगर उन्होंने किया भी, तो मुझे संदेह है कि वे इस पर विफल होंगे। ऐसा लगता है जैसे thb एक सामान्य सामान्य उद्देश्य AI चाहता है जिसे खेल के बुनियादी नियम सिखाए जा सकते हैं और फिर आगे भेजे जा सकते हैं। लेकिन अगर आप सामान्य उद्देश्य एआई को देखें जो विकास में हैं, तो उन्हें 1 से 2 साल के स्तर पर वस्तु और भाषण मान्यता जैसी चीजें सिखाई जा रही हैं। किसी भी सामान्य उद्देश्य एआई को सबसे पहले यह समझने में सक्षम होने के लिए परिष्कार की आवश्यकता होगी कि कोई खेल क्या है इससे पहले कि वह समझ सके कि गेम कैसे खेलें। आप एक सामान्य उद्देश्य एआई को डिज़ाइन नहीं कर सकते हैं और उम्मीद कर सकते हैं कि यह एक संकीर्ण या विशेष एआई की तरह प्रदर्शन करे। एक सामान्य उद्देश्य एआई को एक व्यक्ति की तरह शतरंज सिखाने की आवश्यकता होगी और आप दो नौसिखिए खिलाड़ियों को शतरंज के इतिहास का ज्ञान नहीं होने की उम्मीद कर सकते हैं और खुले तौर पर और रणनीतिक विषयों को फिर से स्थापित कर सकते हैं। यह एआई के कई सैकड़ों उदाहरणों को एक-दूसरे से खेलते हुए ले जाएगा, जिनमें से सभी अपने गेम के ऐतिहासिक डेटा तक कई हज़ारों पुनरावृत्तियों तक पहुंचेंगे। और प्रत्येक AI को विभिन्न स्तरों पर भारित कुछ विशिष्ट विशेषताओं की आवश्यकता होगी।

यह से प्राप्त करने के लिए लगभग 500 साल मनुष्यों ले लिया रॉड्रिगो (Ruy) लोपेज डी सेगुरा और पेड्रो डमिआओ को पॉल मोर्फी और फिर आगे के परिवर्तन के खेल के बीच हुई पर विचार Steinitz और एल्काइन। और यह सभी परिवर्तन विभिन्न स्वभावों और अन्य प्रभावशाली विशेषताओं (जैसे बेतरतीब ढंग से शूरवीरों पर शूरवीर या शूरवीरों से अधिक शूरवीर) के साथ कई सैकड़ों हजारों खिलाड़ियों की गतिशीलता के माध्यम से खेल शैली और फैशन का उल्लेख नहीं करने के लिए हुआ। इन सभी चीजों ने परिवर्तन के डायनेमो में योगदान दिया जिसने सदियों से शतरंज को प्रभावित किया। कोई कमजोर एआई - यहां तक ​​कि एक कमजोर सामान्य उद्देश्य एआई- डायनेमो के उस प्रकार की नकल नहीं कर सकता है क्योंकि इसमें इच्छा की कमी है। केवल इच्छा कुछ दिनों के लिए घंटों तक बैठने के लिए कुछ ड्राइव कर सकती है ताकि इसका पर्दाफाश करने के इरादे से इसका विश्लेषण किया जा सके या प्रतिद्वंद्वी "पर्दाफाश" के बाद इसे सुधार सके। वास्तव में यह विश्लेषण और तैयारी के लिए इस तरह की ड्राइव है जो शताब्दियों के खेल को बेहतर बनाता है - समान रूप से कमजोर खिलाड़ियों के बीच लाखों खेलों का अंधा खेल नहीं।

यह उन लोगों का झुंड लेने जैसा है जो अंग्रेजी नहीं बोलते हैं और जिन्होंने कभी अपनी मातृभाषा के साहित्य को नहीं पढ़ा और उन्हें दूसरी भाषा की पुस्तकों के रूप में अंग्रेजी के साथ एक कमरे में डाल दिया और उनसे शेक्सपियर की रचनाओं की तरह कुछ करने की उम्मीद की। यह कभी नहीं, कभी होने वाला है।

EDIT : मुझे यह दावा करने से बेहतर पता होना चाहिए था क्योंकि ऐसा हुआ है

"अल्फा ज़ेरो को पारंपरिक अर्थों में खेल सिखाया नहीं गया था," शतरंज डॉट कॉम बताते हैं। "इसका मतलब है कि कोई खुलने वाली किताब, कोई एंडगेम टेबल नहीं है, और जाहिर तौर पर कोई जटिल एल्गोरिदम केंद्र प्यादे और साइड प्यादों के बीच मिनट के अंतर को विच्छेदित नहीं करता है। यह एक रोबोट के लिए हजारों धातु बिट्स और भागों तक पहुंच प्रदान किया जाएगा, लेकिन दहन इंजन का कोई ज्ञान नहीं है, फिर यह फेरारी का निर्माण करने तक हर संयोजन के साथ कई बार प्रयोग करता है। ... इस कार्यक्रम में खुद को खेलने के लिए चार घंटे थे, कई बार, जिससे खुद के शिक्षक बन गए। "

मेरा जारी रखा, जाहिर है निराधार blathering:

हम उन सभी निहित ज्ञान को प्राप्त करते हैं जो हमारे पास दुनिया के बारे में हैं। यह समझने में सक्षम होने के लिए कि अगर मुझे लकड़ी और एक कील के टुकड़े करना है, तो एक हथौड़ा मेरे लिए एक पेचकश की तुलना में अधिक उपयोगी है, मुझे पहले यह समझना होगा कि कुछ चीजों में अन्य चीजों की तुलना में कुछ स्थितियों में कुछ वर्गों के उपयोगी होते हैं। मुझे यह भी समझना होगा कि चीजों का एक उपयोग है जिसे एक लक्ष्य पर लागू किया जा सकता है। ये उत्तराधिकार हैं। यदि एआई को यह नहीं बताया जा सकता है कि कुछ टुकड़ों का दूसरों की तुलना में अधिक मूल्य है, तो यह भी कैसे समझ सकता है कि दोस्त क्या है? यदि इसे विशिष्ट उत्तराधिकार के साथ प्रोग्राम नहीं किया जा सकता है, तो यह "मूल्य" और "उपयोगिता" फॉर्म अनुभव जैसे इन विचारों को एक्सट्रपलेशन करने में सक्षम होना चाहिए। और वह संकीर्ण AI का डोमेन नहीं है। यह सामान्य उद्देश्य, मजबूत AI का डोमेन है।


1
बहुत बढ़िया जवाब। मुझे लगता है कि आपका पहला पैराग्राफ वास्तव में इस विचार को रोशन करता है कि मैं पार पाने की कोशिश कर रहा था, लेकिन ऐसा अधिक आकर्षकता के साथ होता है।
ग्रेग ई।

धन्यवाद, ग्रेग। मैं सिर्फ यह जोड़ना चाहता हूं कि मैं एक सामान्य सामान्य उद्देश्य AI के बारे में बात कर रहा हूं। मेरा मानना ​​है कि एक सच्चा स्ट्रांग एआई एक अत्यधिक संकुचित समय सीमा में कई पुनरावृत्तियों पर कई उदाहरणों के माध्यम से ऐसा कर सकता है। लेकिन हमारे पास अभी तक मजबूत AI नहीं है। en.wikipedia.org/wiki/Strong_AI
रॉबर्ट कौशर

मैं इच्छा पर खंड को छोड़कर आपकी कही हर बात से सहमत हूं। एआई घंटों तक बैठकर यह कर सकता है कि डिज़ाइनर जो भी करना चाहें - पर्याप्त कंप्यूटर शक्ति शतरंज को हल कर सकते हैं, यह सिर्फ इतना है कि हमारे पास अभी तक पर्याप्त शक्ति नहीं है।
ईव फ्रीमैन

यह सच है, वेस, लेकिन फिर हम "प्रोग्रामर" या एआई में जो कुछ भी है, उसके पूर्वाग्रह को इंजेक्ट कर रहे हैं; जो उन चीजों में से एक है जो प्रश्न के लेखक नहीं चाहते थे।
राबर्ट कौचर

@EveFreeman, मुझे लगता है कि आप गलत कह रहे हैं कि मैं क्या कह रहा हूं। मैं यह नहीं कह रहा हूं कि कंप्यूटर "शतरंज को हल नहीं करेंगे" मैं कह रहा हूं कि ओपी का विशिष्ट परिदृश्य इस बिंदु पर हैमस्ट्रिंग है कि यह काम नहीं करेगा। यदि सिस्टम के पास कोई उत्तराधिकार नहीं है, तो यह टुकड़ों पर एक मूल्य कैसे डाल सकता है?
बजे रॉबर्ट काचर

9

कृपया निम्नलिखित AI कोन के बारे में ध्यान दें:

उन दिनों में जब सुस्मान नौसिखिया थे, एक बार पिंस -6 में हैकिंग करते हुए मिंस्की उनके पास आए। "आप क्या कर रहे हैं?", मिंस्की से पूछा। "मैं टिक-टैक-टो खेलने के लिए एक बेतरतीब ढंग से वायर्ड तंत्रिका जाल का प्रशिक्षण दे रहा हूं" सुस्मान ने कहा। "क्यों नेट बेतरतीब ढंग से वायर्ड है?", Minsky पूछा। "मैं नहीं चाहता कि इसे कैसे खेलें, इसकी कोई पूर्व धारणा है", सूसमैन ने कहा। मिन्स्की ने फिर अपनी आँखें बंद कर लीं। "आप अपनी आँखें क्यों बंद करते हैं?", सूसमैन ने अपने शिक्षक से पूछा। "ताकि कमरा खाली हो जाए।" उस समय, सूसमैन प्रबुद्ध था।

हमारे अनुप्रयोगों में हमेशा पूर्व धारणाएं होती हैं, चाहे आप अपनी आँखें बंद करें या नहीं ...


आपका किस्सा सबसे ज्यादा प्रेरक है। आपकी रुचि किस हद तक है, आपके किस्से ने मुझे एक अपडेट के साथ सवाल का विस्तार करने के लिए प्रेरित किया है, जिसे आप ऊपर देख सकते हैं जब आपके पास कुछ समय होता है।
थ्रू जूल

8

क्या कभी किसी ने एक शतरंज कार्यक्रम लिखा है, जिसमें उसकी खुद की अंतर्दृष्टि है? कि अपने दम पर खेल सीखता है? वह खुद को प्रशिक्षित करता है?

हाँ। की जाँच करें जिराफ शतरंज इंजन मैथ्यू लाइ ने लिखा है। उन्होंने कंप्यूटर विज्ञान में स्नातकोत्तर डिग्री के लिए अपने आर्टिफिशियल इंटेलिजेंस अनुसंधान के हिस्से के रूप में शतरंज इंजन लिखा।

TalkChess शतरंज प्रोग्रामिंग फोरम पर पिछले साल इस बारे में बहुत चर्चा हुई थी । मुझे पता है क्योंकि मैं एक शतरंज इंजन लेखक हूं, जिसका इंजन जिराफ जितना मजबूत है। हालाँकि, मैंने अपने इंजन को पारंपरिक तकनीकों का उपयोग करते हुए लागू किया, जबकि जिराफ के लेखक ने "गहरे तंत्रिका नेटवर्क के साथ अस्थायी-अंतर सुदृढीकरण सीखने" का उपयोग करते हुए अपने इंजन को प्रशिक्षित किया। मैथ्यू को अभी भी गतिशील रूप से एक स्थिति का मूल्यांकन करने के लिए पारंपरिक अल्फा / बीटा खोज को लागू करना था- दूसरे शब्दों में, कई चालों को देखने के लिए। उनका नवाचार एक स्थिर स्थिति का मूल्यांकन करने के लिए इंजन को प्रशिक्षित करने में है । इसकी तुलना में, मैंने अपने इंजन के स्थैतिक मूल्यांकन दिनचर्या में विशिष्ट ज्ञान लिखा।

मैंने कण झुंड एल्गोरिथ्म का उपयोग करके मूल्यांकन मापदंडों को ट्यून करने के लिए कोड लिखा था ( तकनीकी चर्चा के लिंक के लिए मेरे ब्लॉग पर धन्यवाद पृष्ठ देखें ) जो सकारात्मक परिणाम देता था- एक मजबूत इंजन। हालाँकि, यह इंजन को "सीखने" के लिए प्राप्त करने का काम नहीं था, क्योंकि मूल्यांकन मापदंडों के एक बहुत बड़े स्थान में त्रुटि को कम करना (10 ^ 150 असतत पैरामीटर संयोजन का क्रम)।

मैथ्यू टॉकसैस फोरम पर अपने शोध प्रबंध पर चर्चा करता है । वह Google के लिए डीपमाइंड पर काम करता है, अगर मुझे सही याद है।

इसके अलावा, थॉमस पेटज़के के ब्लॉग को देखें । उन्होंने इंजन के स्थैतिक मूल्यांकन को बेहतर बनाने के लिए एक बेहद मजबूत शतरंज इंजन, iCE, और आनुवंशिक एल्गोरिदम का उपयोग किया है। 2013 और उससे पहले के पदों को देखें, जैसे कि जनसंख्या आधारित वृद्धि सीखना


मंच पर आपका स्वागत है! एक और।
लघुशंका


5

एक Google खोज की तरह इस परिणाम को इस तरह से बदल सकती है ।

विशेष रूप से, मुझे विश्वास है कि आप इस कागज को देखना चाहेंगे । वे अपने इंजन को कुछ प्रारंभिक डेटा जैसे कि टुकड़ा मान देते हैं, इसलिए यह बिल्कुल वैसा नहीं है जैसा आप पूछ रहे हैं, बल्कि इसने काफी अच्छा प्रदर्शन किया है।


+1 क्योंकि मैं दिलचस्प IEEE प्रशस्ति पत्र की सराहना करता हूं। मैं पहले से ही NeuroChess पेज से परिचित है। हालांकि, उनमें से कोई भी ऐसा नहीं कर रहा है जो मेरे दिमाग में था, हालांकि।
thb

3

यह मशीन सीखने के साथ संभव है।

शतरंज के इंजनों की किताबें खोलना मशीन सीखने का उपयोग करता है। इंजन उन्हें खेलकर किताब में खुलने वाली लाइनों का परीक्षण करता है, यदि एक रेखा दूसरे की तुलना में बेहतर स्कोर करती है, तो यह उस लाइन को शुरुआती पेड़ में बढ़ावा देती है। समय में, इंजन बेहतर लाइनों को सीखता है।

चरण समाप्त होने के बाद, इंजन पुस्तक का उपयोग करना बंद कर देता है, और मूल्यांकन फ़ंक्शन का उपयोग करना शुरू कर देता है।


मशीन लर्निंग का उपयोग करके एक स्व-शिक्षण इंजन को कैसे लागू किया जाए?

एक पुस्तक का उपयोग कर इंजन की कल्पना करेंएक मूल्यांकन समारोह के बिना । और शुरू में किताब खाली है। इसलिए इंजन को शतरंज के बारे में कोई जानकारी नहीं है।

इंजन इस खाली पुस्तक के साथ खेलना शुरू कर देता है, और खेल के अंत तक पुस्तक को बंद नहीं करता है। हम इसे एक नियमित इंजन की तरह सोच सकते हैं जो खेल के अंत तक एक शुरुआती किताब का उपयोग करता है।

समय के साथ, इंजन को सर्वश्रेष्ठ निरंतरता सांख्यिकीय रूप से मिलेगी, क्योंकि खराब लाइनें समय में खराब हो जाएंगी। लेकिन निश्चित रूप से, एक अच्छी किताब प्राप्त करने के लिए बहुत सारे खेल खेले जाने चाहिए। मैं नहीं जानता कि कितने हैं, लेकिन जितना हम अव्यवहारिक कह सकते हैं।

दिसंबर 2017 अपडेट : ठीक है, मुझे लगता है कि अल्फा ज़ीरो ने मुझे खुद को प्रशिक्षित करके गलत साबित कर दिया कि खेलों की व्यावहारिक मात्रा के साथ, सबसे मजबूत इंजनों में से एक स्टॉकफिश को हरा दिया ।


2

इस क्षेत्र में आप जो भी प्रयास करते हैं, पहले टोरी की कहानी यहाँ अवश्य पढ़ें: http://waitbutwhy.com/2015/01/artific-intelligence-revolution-2.html

टी एल; डॉ; बिगाड़ने वाला संस्करण प्रति अनुरोध:

टोरी की कहानी में टरी की सेल्फ ट्रेनिंग एआई को अच्छे हस्तलिखित नोट्स लिखने और मनुष्यों से छुटकारा पाने के लिए अंत करना होगा क्योंकि उन्हें अच्छे हस्तलिखित नोट्स लिखने के स्पष्ट रूप से सहज लक्ष्य को प्राप्त करने की आवश्यकता नहीं है। सादृश्य यह है कि AI के साथ एक स्व-प्रशिक्षित शतरंज इंजन भी मनुष्यों से छुटकारा पा लेगा क्योंकि उन्हें शतरंज के कौशल में सुधार के जाहिरा तौर पर लक्ष्य को बेहतर बनाने की आवश्यकता नहीं है।


आपका जवाब दिलचस्प है, हालांकि शायद बहुत प्रेरक नहीं है। मैंने आपकी सलाह पर लिंक किए गए लेख (दोनों भागों) को पढ़ा है। लेखक कुछ भूसे पुरुषों पर हमला करके अपने मामले को थोड़ा कमजोर करता है, लेकिन वह एक विचारशील साथी है। मुझे नहीं लगता कि मेरे मन में लेख की तुर्री की तरह कुछ भी था। एक 8-बाई-8 चेसबोर्ड जिस पर दो खिलाड़ी 40 या इतने असतत मोड़ लेते हैं, बस एक मौलिक रूप से सरल मामला है। मुझे यह उल्लेखनीय लगता है कि एआई सामान्य तरीके से शतरंज के बारे में सोच भी नहीं सकता है। एक विपरीत दृश्य के लिए, असाइन किया गया पढ़ना: फेसर, एडवर्ड। अंतिम अंधविश्वास। फिर भी, ब्याज के लिए +1।
thb

1

और अल्फाज़ो है। शतरंज इंजनों की एक पूरी नई पीढ़ी का जश्न मनाएं


0

कंप्यूटिंग सिस्टम के साथ काम करते समय एन्थ्रोपोमोर्फिक शब्दावली का उपयोग पेशेवर अपरिपक्वता का एक लक्षण है

से हम कैसे सत्य बताऊँ कि हानि पहुंचा सकता है? Edsger W.Dijkstra द्वारा गलत तरीके से आपके प्रश्न को समझने की गलती हुई। आर्टिफिशियल इंटेलिजेंस कृत्रिम हो सकता है लेकिन यह मानवीय अर्थों में खुफिया नहीं है।

में बीबीसी 1984 रीथ व्याख्यान अमेरिकी दार्शनिक जॉन Searle वास्तव में बताता है कि कठिन ऐ साथ कुछ गड़बड़ है। उनके तर्क का "बहुत लंबा, सुन नहीं" सारांश है "सिंटैक्स शब्दार्थ नहीं है" लेकिन मैं आपको कम से कम 2 व्याख्यान सुनने के लिए प्रोत्साहित करूंगा "बीयर के डिब्बे और मांस मशीनें " ।

एक बार जब आप समझ गए कि 30 साल से अधिक समय पहले दिक्जस्त्र और शीरेल क्या कह रहे थे तो आप पहचानेंगे कि आपके सवालों में क्या गलत है:

क्या कभी किसी ने एक शतरंज कार्यक्रम लिखा है, जिसमें उसकी खुद की अंतर्दृष्टि है? कि अपने दम पर खेल सीखता है?

मनुष्य के पास "अंतर्दृष्टि" है और वह सीख सकता है। कंप्यूटर नहीं कर सकते। सदियों से आपके आदिम मनुष्यों का गाँव शतरंज के उद्घाटन सिद्धांत को पुन: पेश कर सकता था लेकिन कंप्यूटर नहीं।


क्या आप तर्क देते हैं कि कंप्यूटर मानव स्तर की बुद्धिमत्ता तक नहीं पहुँचेंगे, या यह भी कि "सोच" और "समझ" मनुष्यों के लिए आरक्षित है?
BlindKungFuMaster

@BlindKungFuMaster यदि आप ऊपर दिए गए लिंक में "बीयर कैन और मीट मशीन" सुनने के लिए परेशानी उठाते हैं, तो यह आपके लिए स्पष्ट हो जाएगा कि जॉन सियरल क्या सोचते हैं। उन्होंने मुझे आश्वस्त किया और मैंने उनके विचार को साझा किया।
ब्रायन टावर्स

एअर इंडिया कंप्यूटर प्रोग्राम्स की सियरल की सरल समझ, यह सब केवल 1984 के बाद है। लेकिन आधुनिक एआई आर्किटेक्चर केवल मानव मन की वास्तुकला की नकल करते हैं, इसलिए केवल आर्किटेक्चर को वाक्यगत रूप से वर्णित किया जाता है, न कि अंत में "सोच"। "मानव मस्तिष्क की शक्ति के बराबर शक्ति (अभी तक नहीं)" सीखने "से बड़ी मात्रा में डेटा प्राप्त करने से आती है।" केवल इस कदम पर सिमेंटिक सामग्री कैप्चर की गई है।
BlindKungFuMaster

इसलिए चीनी कक्ष तर्क यह मानकर त्रुटिपूर्ण है कि आप अकेले एक बड़ी नियम पुस्तिका के साथ समझ का अनुकरण कर सकते हैं, जो कि वास्तव में अपेक्षाकृत बेतुका है, और इस संभावना को आगे बढ़ाते हुए कि इसके बजाय बड़ी मात्रा में डेटा से उपयुक्त वास्तुकला द्वारा सिमेंटिक सामग्री को पकड़ा जा सकता है। वास्तव में, यह प्राकृतिक भाषा प्रसंस्करण है जो इन दिनों के बारे में है: cs224d.stanford.edu/syllabus.html
BlindKungFuMaster

@BlindKungFuMaster में एक महत्वपूर्ण शब्द है जो आप कहते हैं कि यह मेरे लिए प्रतीत होता है जिसे आप नहीं समझते हैं। यह "अनुकरण" शब्द है। मैं 35 साल से एक कंप्यूटर सॉफ्टवेयर इंजीनियर हूं और उस समय के दौरान मेरे पास कई सिमुलेटर हैं और अपने खुद के कुछ भी लिखे हैं। सिमुलेटर अक्सर एक परियोजना के महत्वपूर्ण घटक होते हैं लेकिन एक रीयलटाइम परियोजना में वे पूरी तरह से लक्ष्य उपकरण को कभी नहीं बदलते हैं। कोई संदेह नहीं है कि कंप्यूटर खुफिया और अर्थ संबंधी समझ का अनुकरण करने में उत्कृष्ट हैं, लेकिन वे कभी भी चेतना, इच्छाशक्ति, समझ हासिल नहीं कर सकते हैं।
ब्रायन टावर्स

0

यह उत्तर मूल प्रश्न के प्रश्नकर्ता द्वारा प्रश्न के चार साल बाद दिया जाता है। यह पहले दिए गए उत्तरों के लिए या सुपरसेड के लिए विकल्प नहीं देता है, पहले के अधिकांश उत्तरों के लिए यह एक से अधिक दिलचस्प है। हालाँकि, यह उत्तर कुछ अतिरिक्त संदर्भ जोड़ सकता है।

जहां तक ​​मैं बता सकता हूं, ज्यादातर एआई शोध का अनुमान है कि इस आधार को मंजूरी देना कि विचार और कारण पूरी तरह से भौतिक घटना थे, या कम से कम यह विचार से अप्रभेद्य होता है और कारण जरूरी है कि पूरी तरह से सामग्री प्रक्रियाओं द्वारा प्राप्त किया जाना चाहिए। मैं आधार का विवाद नहीं करता हूं (न ही यहां इसे बढ़ावा देता हूं, उस बात के लिए)। मैं केवल देख सकते हैं कि ऐसा लगता है होना करने के लिए एक आधार है।

और, आखिरकार, AI शोध में, यह कैसे एक आधार नहीं होना चाहिए? एआई शोधकर्ताओं को सामग्री प्रक्रियाओं के माध्यम से काम करना चाहिए, चाहे वे करेंगे या शून्य।

डुन स्कॉट्स, सेंट थॉमस, अरस्तू और प्लेटो के माध्यम से वापस यथार्थवादी दर्शन के स्कूली छात्रों ने मन के सिद्धांत के बारे में बहुत कुछ कहा है। कांट जैसे प्रतिनिधिवादियों के पास कहने के लिए अलग चीजें थीं। एआई शोध शायद कांट के करीब है, लेकिन इससे स्कूली छात्रों को गलत नहीं लगता है।

जाहिर है, एक भगवान की आपत्ति है जो वर्तमान प्रकार की बातचीत में इस बिंदु पर पॉप अप करने के लिए जाता है, फिर भी एक पेशेवर दार्शनिक आपको बताएगा कि भगवान के अंतराल आपत्ति एक पुआल आदमी पर हमला करती है, यह आपत्ति केवल उन व्यक्तियों के खिलाफ उपयोगी है, जिन्होंने बिना दर्शनशास्त्र का अध्ययन किए और इस प्रकार यह नहीं जानते कि वे किस बारे में बात कर रहे हैं। अरस्तू के अनुसार, यह औपचारिक और अंतिम कारण है जिसे स्व-प्रशिक्षित शतरंज एआई के प्रश्न में फंसाया जा सकता है। फिर भी अरस्तू के संदर्भ में, एआई शोधकर्ता विशुद्ध रूप से सामग्री के साथ और विशेष रूप से, कुशल कार्य करता है(शायद स्पष्ट रूप से छोड़कर, इंसानी प्रशिक्षकों के रूप में व्यक्तिगत रूप से सिस्टम में औपचारिक और अंतिम तत्व लाते हैं)। यदि कारण औपचारिक है, अगर विचार अंतिम है, अगर सेरेल का चीनी कमरा एक ontological impossibility (जैसा कि यह हो सकता है) साबित होता है, तो यह हो सकता है कि शुद्ध रूप से स्व-प्रशिक्षित शतरंज AI भी सिद्धांत रूप में प्राप्त नहीं किया जा सकता है।

मुझे संदेह है कि विशुद्ध रूप से स्व-प्रशिक्षित शतरंज एआई को वास्तव में प्राप्त किया जा सकता है, और यह होगा - कि, अरस्तू के संदर्भ में, यह प्रश्न केवल कुशल कार्य-कारण के मद्देनजर पर्याप्त रूप से भयावह साबित होगा। मैं आम तौर पर मजबूत एआई से अधिक उलझन में हूं, लेकिन ये अनुभव में साबित होने के लिए हैं, क्या वे नहीं हैं? वास्तव में कोई नहीं जानता।

कार्य और मन का दर्शन सूक्ष्म है, कुछ लोगों द्वारा समझ लिया गया है (और शायद कुछ एआई शोधकर्ताओं के बीच, जो अधिक व्यावहारिक हैं)। यदि आप ऐसे दर्शन सीखना चाहते हैं, तो यह सीखने लायक है; लेकिन सलाह दी जाती है कि इंटरनेट पर और यहां तक ​​कि अक्सर प्रिंट में, अनकही गलतफहमियों के आधार पर भ्रामक स्पष्टीकरण खोजना बेहद आसान है। मेरे पैसे के लिए, इस विषय पर आज सबसे अच्छा परिचयात्मक शिक्षक लेखन एडवर्ड फेसर है, जिनकी किताबें उचित मूल्य पर प्रिंट में रहती हैं। आप उससे बहुत कुछ सीख सकते हैं।

हालाँकि, एक संदेह है कि डॉ। फेसर वर्तमान प्रश्न पर एक आधिकारिक जवाब देंगे! एआई की प्रयोगशालाओं में जवाब साबित होना बाकी है।


-3

मैं चाहता हूं कि वे कोड जारी करें, फिर हम बात कर सकते हैं। शतरंज को हल करना इतना आसान नहीं है, आधी सदी में भी अल्फा इसे हल नहीं करेगा। मजेदार रूप से, यह अभी भी 1.d4 खेलता है। क्यों? क्योंकि यह मानव खेलों पर प्रशिक्षित किया गया है और मानव सिद्धांत 1.d4 के लिए उच्चतम प्रदर्शन दर देता है। खराब चीज 1 नहीं जानती ... c5 ठीक 8 चालों में एक ड्रॉ हासिल करता है। अब वे चाहते हैं कि मेरा मानना ​​है कि अल्फा ने एक नकली उद्घाटन पुस्तक का उपयोग नहीं किया है ... वे कहते हैं कि अल्फा ने शानदार शुरुआत की। खैर, हां, कुछ अपवादों के साथ। 1.d4 निश्चित रूप से उस स्तर की बुद्धिमत्ता के बारे में नहीं बोलता है जो कार्यक्रम को प्राप्त हुई है। सौभाग्य से, एसएफ शुरुआती चरण में भी कमजोर है। :)


3
आप यह कहते हुए साहसिक दावा करते हैं कि 1. ... c5 8 चालों में एक ड्रॉ हासिल करता है और यह कि स्टॉकफिश शुरुआती चरण में कमजोर है। क्या आप इन दावों के संदर्भ प्रदान कर सकते हैं?
पाब्लो एस। ओकाल

1
1.d4 निश्चित रूप से उस स्तर की बुद्धिमत्ता के बारे में नहीं बोलता है जो कार्यक्रम को प्राप्त हुई है। एक 1.d4 खिलाड़ी के रूप में, मुझे आश्चर्य है कि अगर मुझे यह विचार करना चाहिए कि मेरी बुद्धिमत्ता का अपमान किया जा रहा है।
Evargalo

हालांकि वे कोड जारी नहीं किया है या यहां तक कि कागज, प्रकाशित एक परियोजना उनके परिणाम पुन: पेश करने की शुरूआत की है: lczero.org तुम भी पर विकसित हो रहा है "AlphaZero" के साथ खेल सकते play.lczero.org
Junyan जू
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.