रोसेन के विकर्ण सख्त अनुरूपता की स्थिति


9

खिलाड़ियों के साथ एक गेम पर विचार करें , जिसमें स्ट्रैटेजी स्पेस , जहां सेट बाउंड है, और प्लेयर का फंक्शन । रोसेन की स्थिति ( जेबी रोसेन। अस्तित्व और व्यक्ति के खेल के लिए संतुलन बिंदुओं की विशिष्टता। इकोनोमेट्रिक, 33 (3): 520–534, 1965 ) एनएएस इक्विलिब्रियम की विशिष्टता के लिए n खिलाड़ियों के खेल में कहा गया है कि एक्कुलिब्रियम अद्वितीय होगा।nSRSiπi:SnR

  1. अदायगी फ़ंक्शन में स्वयं की रणनीति में अवतल हैπi(s)iN
  2. इसमें वेक्टर ( जैसे कि फ़ंक्शन तिरछे कड़ाई से अवतल होते हैंz(iN)(zi0) (iN)(zi>0)σ(s,z)=i=1nziπi(s)

N खिलाड़ियों के सेट को दर्शाता है।

विकर्ण सख्त समतलता की अवधारणा को परिभाषित करने के लिए, फंक्शन ' ' को 'pseudogradient' के रूप में परिभाषित करता है, जिसके साथ परिभाषित होता है: फिर, समारोह होना कहा जाता है तिरछे सख्ती से प्रमुख में तय करने के लिए अगर हर के लिए निम्नलिखित रखती है: σ

g(s,z)=(z1π1(s)s1z2π2(s)s2...znπn(s)sn)
σsSz0s0,s1S
(s1s0)g(s0,z)+(s0s1)g(s1,z)>0

यह दिखाया गया है, कागज में मैं शुरुआत में उद्धृत करता हूं, कि तिरछे सख्त लहजे में होने के लिए लिए एक पर्याप्त शर्त यह है कि मैट्रिक्स , जहाँ में "के लिए ऋणात्मक अवहेलना है , सम्मान के साथ pududogradient का याकूबियन है । मैं 'का उपयोग मैट्रिक्स के स्थानान्तरण को दर्शाने के लिए करता हूं। विकर्ण सख्त अवशिष्ट स्थिति के पीछे अंतर्ज्ञान क्या है?σ[G(x,z)+G(x,z)]sSG(x,z)gs

जवाबों:


3

तो आप अधिकतम खोजना चाहते हैं । यदि तिरछे कड़ाई से अवतल है, तो आप किसी भी बिंदु पर शुरू करके और ग्रेडिएंट अनुसरण करते हुए कर सकते हैं जब तक कि आप अधिकतम और कोई फर्क नहीं पड़ता कि आप कहां से शुरू करते हैं, आप हमेशा एक ही बिंदु पर समाप्त करेंगे (प्रारंभ करें) निचले काले बिंदुओं पर और ढाल की दिशा (सबसे तेज चढ़ाई की दिशा) का पालन करें।)। σ(s,z)σg(s,z)एक तिरछे कड़ाई से अवतल कार्य में ढाल के बाद

हालाँकि, अगर तिरछे कड़ाई से अवतल नहीं होता है, तो आप एक मनमाने बिंदु पर शुरू करके और ढाल का पालन करके अलग-अलग मैक्सिमा पर समाप्त हो सकते हैं (दो निचले काले बिंदुओं से शुरू होने वाली सबसे तेज चढ़ाई की दिशा का पालन करें; आप ऊपर आ जाएंगे;) दो अलग-अलग बिंदुओं पर।) σएक गैर-तिरछे कड़ाई से अवतल कार्य में ढाल के बाद


आपके उत्तर के लिए धन्यवाद! आप जो लिखते हैं वह मूल रूप से रोसेन के पेपर के परिणामों में से एक है। जब मैं अंतर्ज्ञान कहता हूं तो मेरा मतलब है कि खेल में रणनीतिक अंतःक्रिया की कौन सी संपत्ति सख्त अवमानना ​​स्थिति द्वारा कब्जा कर ली गई है? उदाहरण के लिए, क्या यह स्थिति इस बारे में कुछ कहती है कि अन्य खिलाड़ियों की हरकतें खिलाड़ी के भुगतान पर क्या प्रभाव डालती हैं, या खिलाड़ी की कार्रवाई से अन्य खिलाड़ियों के खेल में भुगतान प्रभावित होता है। क्षमा करें यदि मैं प्रश्न में पर्याप्त स्पष्ट नहीं था।
निज्जी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.