नैश संतुलन गणना के लिए एल्गोरिदम।


10

मैंने यह देखने के लिए मंच खोजा कि क्या यह पहले पूछा गया है, और जबकि एल्गोरिथमिक गेम थ्योरी पर चर्चा की गई है, मैं इस विशेष मुद्दे को संबोधित नहीं कर पाया। मैं यह पता लगाने की कोशिश कर रहा हूं कि एक परिमित एन-व्यक्ति खेल में अनुमानित (मिश्रित-रणनीति) नैश संतुलन के लिए सबसे अच्छा ज्ञात एल्गोरिदम क्या है। बेशक, यह एल्गोरिथ्म PPAD होगा। मैं एल्गोरिथ्म की सही सटीकता की तुलना में गति / दक्षता में अधिक रुचि रखता हूं।

धन्यवाद, फिलिप


यदि आप अधिक विवरण देते हैं तो हम आपकी बेहतर मदद कर सकते हैं। उदाहरण के लिए आपके मन में का क्या मूल्य है? क्या आपके पास अदायगी समारोह की कोई विशेष संरचना है? क्या आपको वास्तव में एक नैश संतुलन की जरूरत है या एक सहसंबद्ध संतुलन पर्याप्त होगा? क्या आप अच्छे व्यावहारिक सीमाओं के साथ कुछ देख रहे हैं या अच्छे व्यावहारिक प्रदर्शन के साथ कुछ कर रहे हैं? n
वॉरेन शूडी

जवाबों:


7

संक्षिप्त उत्तर यह है कि हालांकि, अनुमानित रूप से अनुमानित नैश संतुलन को खोजने के लिए कुछ बहुपद समय एल्गोरिदम हैं, वे सभी अपेक्षाकृत खराब अनुमान लगाते हैं - शायद इतना अच्छा नहीं है यदि आप वास्तव में एक गेम खेलने के लिए एल्गोरिदम खोजने की कोशिश कर रहे हैं। अधिक n खिलाड़ी खेलों के लिए 2 खिलाड़ी खेल के लिए जाना जाता है।

यदि आप जो करने की कोशिश कर रहे हैं, वह वास्तव में एक (अनुमानित) नैश संतुलन है, तो एक आसान कोड चीज़ जिसे आप आज़मा सकते हैं, गेम प्ले का अनुकरण कर रहा है, प्रत्येक खिलाड़ी यादृच्छिक भारित बहुमत एल्गोरिथ्म का उपयोग करके (http://en.wikipedia.org/) wiki / Randomized_weighted_majority_algorithm)। यह काम करने की गारंटी नहीं है, लेकिन कई मामलों में (और गेम के कुछ वर्गों में शून्य-राशि के खेल की गारंटी दी जाती है)। विशेष रूप से, यदि यह प्रक्रिया बिल्कुल भी परिवर्तित हो जाती है, तो इसे नैश संतुलन के रूप में परिवर्तित करने की गारंटी है। खतरा यह है कि यह अभिसरण नहीं करेगा, और हमेशा के लिए चक्र - लेकिन इस मामले में भी, खेल खेलने का अनुभवजन्य इतिहास मोटे सहसंबद्ध संतुलन के सेट में परिवर्तित होगा।


मैंने उपरोक्त उत्तर में उल्लिखित कागज पर एक नज़र रखना शुरू कर दिया। मुझे यह सब समझ में नहीं आया (या पहली नज़र में इसका बहुत कुछ) ... क्या आप बता सकते हैं कि यह अनुमान "अपेक्षाकृत खराब" क्यों है? इसके अलावा, क्या आप संक्षेप में बता सकते हैं कि "मोटे सहसंबद्ध संतुलन" क्या है? मुझे पता है कि एक सहसंबद्ध संतुलन क्या है, लेकिन इस तरह के एक eq के लिए इसका क्या मतलब है। मोटे होना। अंत में, "गेम प्ले का अनुभवजन्य इतिहास अभिसरण करेगा ..." [आदि] से आपका क्या मतलब है? CCE के सेट के साथ अभिसरण करने वाली चीज़ कभी कैसे हो सकती है? आपके उत्तर के लिए धन्यवाद, मैं अब विकिपीडिया लेख देख रहा हूँ।
फिलिप व्हाइट

एल्गोरिदम पर कुछ पृष्ठभूमि के लिए जो वितरण का उत्पादन करते हैं जो मोटे सहसंबद्ध या सहसंबद्ध संतुलन में परिवर्तित होते हैं, मैं यहां शुरू करूंगा: cs.cmu.edu/~avrim/Papers/regret-chapter.pdf
हारून रोथ

यदि आप एक सहसंबद्ध सहसंबद्ध बराबरी के बजाय सहसंबद्ध संतुलन चाहते हैं तो आप एक आंतरिक-आंतरिक-पछतावा सीखने वाले का उपयोग कर सकते हैं। उदाहरण के लिए (बेशर्म प्लग) cs.brown.edu/~ws/papers/regret.pdf । बहुपद समय में सीधे सहसंबद्ध समतुल्य गणना के लिए एल्गोरिदम भी हैं।
वॉरेन शूडी


4

यदि आप उन एल्गोरिदम में रुचि रखते हैं जो वास्तव में सॉफ़्टवेयर में लागू होते हैं, तो कई ऐसे हैं जो मुझे पता है:

  1. GAMBIT पैकेज (http://www.gambit-project.org/doc/index.html) 2-खिलाड़ी और n- खिलाड़ी सामान्य रूप के लिए कई नैश संतुलन एल्गोरिदम लागू करता है, और कुछ मामलों में व्यापक रूप में खेल।

  2. GameTracer (http://dags.stanford.edu/Games/gametracer.html) एन-खिलाड़ी सामान्य फॉर्म गेम के लिए गोविंदन एंड विल्सन के GNM और IPA एल्गोरिदम को लागू करता है।

  3. बड़े खेलों के लिए, सामान्य रूप का प्रतिनिधित्व समस्याग्रस्त है क्योंकि आकार खिलाड़ियों की संख्या में तेजी से बढ़ता है। इसके बजाय, यदि आपके गेम की उपयोगिता फ़ंक्शन में कुछ प्रकार की संरचना है, तो आप बहुत कम जगह का उपयोग करके इसे व्यक्त करने के लिए एक "संक्षिप्त प्रतिनिधित्व" (जैसे ग्राफिकल गेम, सममित खेल, एक्शन-ग्राफ गेम) का उपयोग कर सकते हैं; और इसके अलावा कम्प्यूटेशनल स्पीडअप के लिए संरचना का अक्सर शोषण किया जा सकता है। सॉफ्टवेयर के संदर्भ में, AGG सॉल्वर (http://agg.cs.ubc.ca) GameTracer के GNM एल्गोरिथ्म और GAMBIT के सिम्प्दिव एल्गोरिदम को एक्शन-ग्राफ गेम (AGG) प्रतिनिधित्व को दर्शाता है। (अस्वीकरण: मैं इस सॉफ्टवेयर pacakge के विकास में शामिल हूं।)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.