नैश संतुलन के कम्प्यूटेशनल रूप से बाध्य संस्करण?


14

मुझे आश्चर्य है कि अगर नैश संतुलन अवधारणा का एक कम्प्यूटेशनल रूप से बाध्य संस्करण है, तो निम्नलिखित पंक्तियों के साथ कुछ है।

कुछ प्रकार के दो-खिलाड़ी सही सूचना गेम की कल्पना करें, जो बोर्ड पर खेला जाता है , और जो इस मायने में जटिल है कि इष्टतम खेल EXPTIME-hard है। मान लीजिए कि सादगी के लिए भी यह संभव नहीं है। एक दूसरे के खिलाफ इस खेल को खेलने वाले यादृच्छिक बहुपद-काल ट्यूरिंग मशीनों की एक जोड़ी की कल्पना करें। प्रत्येक के लिए , चलो संभावना है कि हो सकता है धड़कता आदेश- पर खेल। (संक्षिप्तता के लिए, मान लीजिए कि को प्रायिकता 0.5 के साथ पहले खेलने को मिलता है।) मुझे लगता है कि यह अच्छा होगा यदि कोई जोड़ी के अस्तित्व को साबित कर सके( , बी ) एन पी , बी ( एन ) बी एन ( , बी ) ,n×n(A,B)npA,B(n)ABnA(A,B)संपत्ति है कि कोई मशीन ट्यूरिंग बेतरतीब बहुपद समय के साथ हावी (जहां " हावी " का अर्थ है सभी पर्याप्त रूप से बड़े के लिए ) , और इसी प्रकार कोई बेतरतीब बहुपद समय मशीन ट्यूरिंग हावी (जहां " हावी का अर्थ है" सभी पर्याप्त रूप से बड़े के लिए )।A एक 'पी ' , बी ( एन ) > पी , बी ( एन ) एन बी ' बी बी ' बी पी , बी ' ( एन ) < पी , बी ( एन ) एनAAApA,B(n)>pA,B(n)nBBBBpA,B(n)<pA,B(n)n

किसी तरह, मुझे संदेह है कि यह बहुत अधिक है, लेकिन क्या इस तरह के कुछ के लिए कोई उम्मीद है कि यह सच है, शायद खेल के प्रतिबंधित वर्ग के लिए?

इस सवाल के लिए एक प्रेरणा यह है कि मैं इस धारणा को औपचारिक रूप देने की राह देख रहा हूं कि किसी दिए गए शतरंज की स्थिति "व्हाइट के लिए फायदेमंद" है। शास्त्रीय रूप से, एक स्थिति या तो व्हाइट के लिए एक जीत है या यह नहीं है। हालांकि, शतरंज के खिलाड़ी, दोनों मानव और कंप्यूटर, एक सहज समझ है कि व्हाइट के लिए इसका क्या फायदा है। ऐसा लगता है कि व्हाइट को जीत हासिल करने की संभावना के साथ कुछ करना है, यह देखते हुए कि खिलाड़ी कम्प्यूटेशनल रूप से बंधे हुए हैं और उन्हें सर्वश्रेष्ठ कदम का अनुमान लगाना होगा। रैंडमाइज्ड एल्गोरिदम की एक विशिष्ट जोड़ी के लिए, एक निश्चित रूप से इस संभावना के बारे में बात कर सकता है कि व्हाइट जीत जाएगा, लेकिन मैं सोच रहा हूं कि क्या हो सकता है, कुछ अर्थों में, एक विहित कम्प्यूटेशनल रूप से बंधे हुए खिलाड़ियों की जोड़ी, जिनके जीतने की संभावनाएं उस स्थिति के लिए एक मान उत्पन्न करती हैं जो केवल खेल पर ही निर्भर करती है और खिलाड़ियों की आदर्शवादिता पर नहीं।


कम्प्यूटेशनल रूप से बंधे हुए संतुलन अवधारणाओं को मैं एक अलग स्वाद के बारे में जानता हूं - हैल्पर, पास और सीमैन के बारे में सोचकर, लोक प्रमेय के मिथक के पीछे की सच्चाई के रूप में , 2014। वहां हम यह नहीं मानते हैं कि दिए गए खेल के लिए एक संतुलन रणनीति खोजना। कठिन है (किसी दिए गए खेल के लिए, यह हो सकता है या नहीं भी हो सकता है)। इसके बजाय, हम किसी भी रणनीति को एक संतुलन बनाने की अनुमति देते हैं यदि किसी खिलाड़ी के लिए लाभदायक विचलन की गणना करना कठिन है। (ध्यान दें यह घातीय रणनीति स्थान मानता है, अन्यथा हम सभी विचलन की जांच कर सकते हैं।)
usul

जवाबों:


1

मैं किसी भी तरह से सोच भी नहीं सकता कि इस सवाल का एक आसान, पूरी तरह से सुरुचिपूर्ण / संतोषजनक जवाब हो सकता है, खासकर क्योंकि समाप्त होने वाली अदायगी की गणना करना बहुत कठिन है; हालाँकि, मेरे विचार एक टिप्पणी के रूप में पोस्ट करने के लिए बहुत लंबे हैं।

मेरे पास सबसे अच्छा विचार यह है: शतरंज के मामले में, इस संभावना को अनुमान लगाने की कोशिश करें कि व्हाइट उस सटीक राशि के साथ पदों का चयन करके किसी दिए गए पद के लिए व्हाइट के भौतिक लाभ (यानी, अतिरिक्त मोहरे, शूरवीर, आदि) के आधार पर जीत जाएगा। -ऑफ़-सामग्री कॉन्फ़िगरेशन। शायद "ऑल-रॉक्स चेस" के मामले में, हम कह सकते हैं, "व्हाइट को ब्लैक के 17 रूक्स के लिए 8 रॉक्स के साथ जीतने की कितनी संभावना है?" शायद यह संभावना 4% है; इसकी गणना करने के लिए, हमें 1000 अलग-अलग यादृच्छिक रूप से उत्पन्न शतरंज पदों की जांच करनी होगी, जिसमें 8 सफेद बदमाश और 17 काले बदमाश हैं, और फिर आगे देखें (कहते हैं) हर मामले में 10 कदम गहरा है, और देखें कि नई सामग्री कॉन्फ़िगरेशन क्या है । फिर, अंत में सामग्री विन्यास के आधार पर अपेक्षित बाधाओं को लें,

बेशक, यह आवश्यक होगा कि एम सफेद बदमाशों की हर प्रासंगिक संभावना ( एम , एन ) के लिए भौतिक विन्यास को एन काले बदमाशों के लिए जाना जाए ... संभवतया सबसे कम ऑर्डर किए गए जोड़े ( एम = 1, एन = 1) पर काम करना और काम करना वहाँ से।

मूल स्थिति के लिए, आप केवल उस आंकड़े के साथ मत जाइए जिसे आप प्राप्त करते हैं (यानी, यदि मूल स्थिति में ( M = 6, N = 7) बदमाश हैं, तो बस यह मत मान लीजिए कि व्हाइट के जीतने की 25% संभावना है क्योंकि (6,7) के लिए जीत की अपेक्षित संभावनाएं; इसके बजाय, क्योंकि आप अधिक सटीक हो सकते हैं, केवल इस एक स्थिति के साथ 10 चालें सामान्य रूप से देखें और हर संभव समाप्ति की स्थिति का पता लगाएं। फिर, 10-चाल-डीप-कॉनफ़िगरेशन के लिए सही रास्ता (जिसमें दोनों तरफ से इष्टतम खेल शामिल है) खोजें, और मूल स्थिति की अपेक्षित बाधाओं के रूप में इस पथ की अपेक्षित बाधाओं का चयन करें।

मुझे लगता है कि यह प्रक्रिया बहुपद समय में की जा सकती है। खोज रहे हैं कश्मीर तय करने के लिए गहरी चाल कश्मीर शतरंज में बोर्ड के आकार में बहुपद है, और सफेद और काले रंग तक किश्ती की कुल संख्या एकल में व्यक्त किया है (एक अर्थ में), क्योंकि उस नंबर बोर्ड के आकार से छोटी होनी चाहिए।

यदि यह समझने में जटिल और कठिन लगता है, तो ऐसा इसलिए है क्योंकि यह है। मैं क्या वर्णन कर रहा हूँ का एक और अधिक संक्षिप्त सार है: उपयोग प्रत्यावर्तन और बुनियादी आंकड़े सफेद दिया के लिए जीत की बाधाओं की गणना करने के एम सफेद किश्ती और एन बोर्ड पर काले किश्ती। इसके बाद k मूव्स को देखने के लिए इन वैल्यूज का उपयोग करें और यह पता लगाएं कि ओरिजिनल पोजीशन में व्हाइट की जीत होगी।

अंतिम टिप्पणी: मुझे लगता है कि यह समस्या गैर-एक्सपीटाइम-पूर्ण गेम, जैसे टिक-टैक-टो के लिए भी दिलचस्प है, जो कि विकिपीडिया के अनुसार PSPACE- पूर्ण है। इसके अलावा, मेरा मानना ​​है कि ऊपर वर्णित एक प्रक्रिया भी वहां उपयोगी हो सकती है, हालांकि जाहिर है कि टिक-टैक-टो में "सामग्री" लाभ होना असंभव होगा; X या O की स्थिति की श्रेष्ठता को पहचानने के लिए कोई अन्य आधार होना चाहिए।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.