मिश्रित रणनीतियों में नैश के संतुलन का पता लगाना [बंद]


-2

निम्नलिखित गेम में मिश्रित रणनीति संतुलन कैसे पाएं:

                     P2

               L            R

     L      (3,1)         (0,1)
P1   M      (1,1)         (1,1)
     R      (0,1)         (4,1)

हम P1 के लिए M को समाप्त कर सकते हैं लेकिन इसे समाप्त किए बिना भी हमें समान मिश्रित रणनीति संतुलन की गणना करने में सक्षम होना चाहिए। यह कैसे करना है ?
Sub-Optimal

4
मैं इस प्रश्न को ऑफ-टॉपिक के रूप में बंद करने के लिए मतदान कर रहा हूं क्योंकि यह एक मूल प्रश्न है और किसी समाधान पर दिखाया गया प्रयास नहीं है। क्योंकि साइट होमवर्क समस्याओं को हल करने के उद्देश्य से नहीं है, इसलिए हम इन सवालों से बचने की कोशिश करते हैं। यदि आप लिखते हैं कि आपने अभी तक क्या प्रयास किया है तो सवाल फिर से खुल सकता है और आपको शायद उपयोगी प्रतिक्रिया मिलेगी।
denesp

मैंने प्रभुत्व वाली रणनीति को खत्म करके इस सवाल को हल करने की कोशिश की है। खिलाड़ी P1 के लिए, M एक कड़ाई से वर्चस्व वाली रणनीति है क्योंकि यदि वह L और M के बीच 0.5 को यादृच्छिकता के साथ जोड़ देता है, तो उस मिश्रित रणनीति के लिए अपेक्षित अदायगी (1.5,1) और (2,1) जो किसी भी स्थिति में हैं P1 के लिए बेहतर है कि वह एम। प्ले करके क्या हासिल करता है, इसलिए M को समाप्त किया जा सकता है। और फिर हमें खेल में नैश के संतुलन की अनंत संख्या मिलती है। हालांकि, अगर मैं एम को पहले से खत्म नहीं करना चाहता हूं, लेकिन इस दिए गए ढांचे के साथ इस खेल को हल करें, तो मैं इसका समाधान खोजने में असमर्थ हूं। कृपया मदद कीजिए।
Sub-Optimal

जवाबों:


1

जैसा कि आपने एक टिप्पणी में सुझाव दिया है, $ M $ किसी भी नैश संतुलन में सकारात्मक संभावना के साथ नहीं खेला जाएगा। यह किसी भी सख्ती से वर्चस्व वाली कार्रवाई के लिए सही है।

यह देखते हुए कि $ M $ में शून्य संभावना है, आपके बाकी प्रश्न का उत्तर आपके दूसरे प्रश्न में एक और सूत्र में दिया गया है एक खेल में अनंत नैश संतुलन कैसे संभव है?


हम कैसे विश्वास दिलाते हैं कि एम सकारात्मक संभावना के साथ नहीं खेला जाएगा। मुझे उस की गणना में दिलचस्पी है।
Sub-Optimal

एक रणनीति प्रोफ़ाइल एक नैश संतुलन है यदि प्रत्येक खिलाड़ी के लिए, उस खिलाड़ी के लिए निर्दिष्ट रणनीति कम से कम अच्छी उपयोगिता के रूप में पैदावार देती है क्योंकि किसी भी अन्य वैकल्पिक रणनीति ने बाकी की रणनीतियों को दिया है। इसका एक लक्ष्य यह है कि प्रत्येक रणनीति जो सकारात्मक संभावना के साथ निभाई जाती है, उसे दूसरों की रणनीतियों के लिए सबसे अच्छी प्रतिक्रिया होनी चाहिए। M की सख्ती से गणना की गई है जैसा कि आपने गणना की है, जिसका अर्थ है कि अन्य खिलाड़ी जो भी चुनते हैं, वह खिलाड़ी 1 के लिए कम भुगतान की गणना करता है (आपके द्वारा गणना की गई तुलना में), जिसका अर्थ है कि यह दूसरों की किसी भी संभावित रणनीति प्रोफ़ाइल के लिए सबसे अच्छी प्रतिक्रिया नहीं है।
ramazan

उपरोक्त संरचना में प्रोब को दें। पंक्ति खिलाड़ी और प्रो के लिए क्रमशः L, M, R, p1, P2, p3 हो। कॉलम प्लेयर के लिए L, R का q और q-1 होना चाहिए। अब अगर हम यहां संभावनाओं की गणना करने की कोशिश करते हैं, तो समाधान क्या होगा। मैं इस तरह से मिश्रित संतुलन का पता लगाने की कोशिश कर रहा हूं। आदर्श रूप से यह होना चाहिए कि P2 = 0, p1 और P2 0 से 1 और q = 4/7 से कुछ भी हो सकते हैं। जैसा कि मैंने दूसरे प्रश्न में गणना की है। तो क्या हम पी 1, पी 2, पी 3 और क्यू के लिए हल करके एक ही समाधान का पता लगा सकते हैं।
Sub-Optimal

आप इसे इस तरह साबित करने की कोशिश कर आगे नहीं बढ़ सकते। यहां गारंटीकृत विधि मामला विश्लेषण है। आप कहेंगे: Case1: क्या p1 & gt; 0, P2 & gt; 0; pp = 0 के साथ एक संतुलन है? Case2: क्या p1 & gt; 0, P2 = 0, p3 & gt; 0 के साथ एक संतुलन है? Case3: क्या p1 = 0, P2 & gt; 0, p3 & gt; 0 के साथ एक संतुलन है? Case4: क्या p1 & gt; 0, P2 & gt; 0, p3 & gt; 0 के साथ एक संतुलन है? Case5: क्या एक शुद्ध रणनीति संतुलन है? हालांकि, यह स्वीकार करना कि सख्त वर्चस्व के कारण पी 2 = 0 आपको अपने मामलों का एक बड़ा हिस्सा खत्म करने देता है, जो अच्छा है। लेकिन अगर आपको उस शॉर्टकट का एहसास नहीं होता है, तो भी आप ठीक हैं। ज्यादा काम लेकिन फिर भी काम होगा।
ramazan
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.