जब करते हैं


9

नैश इक्विलिब्रिया सामान्य रूप से अविश्वसनीय हैं। एकϵ-Nash संतुलन रणनीतियों का एक सेट है, जहां विरोधियों की रणनीतियों को देखते हुए, प्रत्येक खिलाड़ी अधिकतम संभावित अपेक्षित अदायगी के के भीतर प्राप्त करता है । एक ढूँढना -Nash संतुलन, यह देखते हुए और एक खेल है -Complete।ϵϵϵPPAD

परिभाषाओं के कड़ाई से जाने पर, यह विश्वास करने का कोई विशेष कारण नहीं है कि किसी दिए गए -Nash संतुलन की रणनीतियाँ कहीं भी किसी भी NAT संतुलन की रणनीतियों के करीब हैं। हालाँकि, हम अक्सर साहित्य को कुछ हद तक एक वाक्यांश का उपयोग करते हैं जैसे "लगभग एक नैश संतुलन" की तरह जब यह कहने का अर्थ है "एक अनुमानित-नैश संतुलन की गणना"।ϵ

तो, मैं सोच रहा हूँ जब दूसरा पहले का मतलब है; यह है कि, हम किन खेलों के लिए अपेक्षा कर सकते हैं कि -Nash संतुलन को नैश संतुलन के लिए "करीब" होना चाहिए?ϵ


औपचारिक रूप से, मान लीजिए कि मेरे पास खिलाड़ियों और रणनीति प्रोफाइल ।n(s1(1),,sn(1)),(s1(2),,sn(2)),(s1(3),,sn(3)),

प्रत्येक एक -Nash संतुलन है, और अनुक्रम शून्य में करता है।(रों1(मैं),...,रोंn(मैं))εमैंε1,ε2,ε3,...

मेरे सवाल:

  1. कब (किन शर्तों / मान्यताओं के तहत) सभी रणनीतियाँ अभिसरित होती हैं? यही है, प्रत्येक खिलाड़ी , आवश्यक रूप से परिवर्तित हो जाते हैं।जेरोंजे(1),रोंजे(2),रोंजे(3),...

  2. इस सीक्वेंस की सीमा आगे चलकर वास्तव में खेल का नैश संतुलन है? (यह मुझे प्रतीत होता है कि आगे की धारणाओं की आवश्यकता नहीं होनी चाहिए; अर्थात , यदि सभी रणनीतियां अभिसरित हों, तो सीमा एक NE होनी चाहिए।)

  3. जब कंप्यूटिंग के लिए एक एल्गोरिथ्म -Nash संतुलन अनिवार्य रूप से एक नैश संतुलन के लगभग कंप्यूटिंग रणनीति के लिए एक एल्गोरिथ्म करता है? क्या उपरोक्त स्थितियाँ पर्याप्त हैं?ε

बहुत बहुत धन्यवाद!


संपादित करें 2014-03-19

राहुल के जवाब में संदर्भ को पढ़ने के बाद, अभिसरण अनुक्रमों के बजाय वितरणों के बीच दूरियों के संदर्भ में सोचना अधिक उचित लगता है । इसलिए मैं सवालों को फिर से समझने की कोशिश करूंगा और कुछ नए विचार भी रखूंगा।1

  1. (ठीक है, यह बहुत एल्गोरिथ्म-निर्भर है जिसका वास्तव में उत्तर है। एल्गोरिथ्म पर प्रतिबंध के बिना, आपके पास दो अलग नैश संतुलन हो सकते हैं और फिर, जैसा कि आप एल्गोरिथ्म में छोटे और छोटे में प्लग करते हैं, क्रमिक रूप से दूरी। आउटपुट अभी भी बड़े हो सकते हैं क्योंकि आउटपुट संतुलन के बीच दोलन करते हैं।)ε1

  2. मान लीजिए कि एक स्ट्रैटेजी प्रोफाइल है, जो खिलाड़ियों की रणनीतियों पर उत्पाद वितरण है। हम किस खेल के लिए कह सकते हैं कि एक -Nash संतुलन का तात्पर्य _- _ _q कुछ नैश संतुलन , जहाँ से रूप में ? (ध्यान दें कि पेऑफ्स से बंधे होने पर कांसेप्ट सुरक्षित रहता है ।)पीपीεपी-क्ष1δक्षδ0ε01

    यह वास्तव में मुश्किल है क्योंकि हम जिस जटिलता को "गेम" कहते हैं, वह वास्तव में द्वारा शुद्ध किए गए गेम का एक क्रम है , शुद्ध रणनीतियों की संख्या ("क्रियाएं")। तो रूप में , और सापेक्ष दर मायने है। यहाँ जवाब दिखाने के लिए एक सरल जवाबी कार्रवाई है "सभी खेल" नहीं है। मान लीजिए कि हम को कम करने का एक क्रम तय करते । फिर प्रत्येक , क्रियाओं पर दो-खिलाड़ी गेम का निर्माण करें , जहां अगर कोई खिलाड़ी पहली कार्रवाई करता है, तो उन्हें भुगतान मिल जाता है, भले ही दूसरे खिलाड़ी की भूमिका हो; यदि कोई खिलाड़ी दूसरी क्रिया करता है, तो उन्हें का भुगतान मिलता हैnnε0ε1,ε2,...εnn11-εnदूसरे खिलाड़ी के खेलने की परवाह किए बिना; और यदि कोई खिलाड़ी किसी अन्य क्रिया को खेलता है, तो उसे भुगतान मिलता है, भले ही वह दूसरा खिलाड़ी क्यों न खेले।0

    इस प्रकार प्रत्येक गेम में एक (दोनों दूसरी क्रिया खेलते हैं) जो अधिकतम रूप से में इसके केवल नैश संतुलन से दूरी है (दोनों ही पहली क्रिया खेलते हैं)।nεn1

    तो, दो दिलचस्प उप-प्रश्न:

    1. एक निश्चित गेम और फिक्स्ड , चाहे "छोटे पर्याप्त" लिए उपरोक्त शर्त रखती है (सभी -equilibria नैश संतुलन के करीब हैं)।nεε
    2. शायद एक ही सवाल अनिवार्य रूप से, लेकिन क्या यह शर्त रखती है कि यदि भुगतान में अंतर रूप में एक निरंतर द्वारा बाध्य है ।n
  3. (2) के रूप में एक ही सवाल है, लेकिन एल्गोरिदम द्वारा गणना की वास्तविक संतुलन से संबंधित है। मुझे लगता है कि शायद हमें या तो एल्गोरिदम / रचनात्मक उत्तर मिलेंगे या कोई भी नहीं, इसलिए भेद ज्यादा मायने नहीं रखता।


वहाँ हमेशा एक सीमा बिंदु होता है, जिसके लिए एप्सिलॉन-इक्विलिब्रिया का उप-अनुक्रम परिवर्तित होता है, और यह सीमा एक सटीक नैश संतुलन होगी। यह मिश्रित रणनीति प्रोफाइल के स्थान की उपयोगिता और मिश्रित रणनीति संभावनाओं के एक समारोह के रूप में उपयोगिता कार्यों की निरंतरता से निहित है। (रों1*रोंn*)
नोम

जवाबों:


5

निम्न पत्र कम से कम सटीक संतुलन के करीब होने की धारणा को औपचारिक रूप देता है, और कुछ संबंधित संरचनात्मक परिणामों को साबित करता है।

प्रांजल अवस्थी, मारिया-फ्लोरिना बॅल्कन, एव्रीम ब्लम, या शेफ़ेट, और संतोष वेम्पला (2010)। सन्निकटन-स्थिर खेलों के नैश संतुलन पर। एल्गोरिथम गेम थ्योरी (SAGT'10) पर तीसरे अंतर्राष्ट्रीय सम्मेलन की कार्यवाही में, 78-89।

विशेष रूप से, पेपर प्रश्न 3 के लिए खेल के वर्ग का एक उदाहरण देता है।


धन्यवाद! मुझे लगता है कि यह कला की स्थिति है। मैं अपने प्रश्न में कुछ विचार जोड़ूंगा।
usul
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.