सिग्नलिंग गेम में एक रिसीवर को कार्रवाई के दौरान यादृच्छिक करना चाहिए?


10

मान लीजिए कि एक परिमित संदेश अंतरिक्ष M , परिमित क्रिया स्थान A और परिमित प्रकार स्थान साथ एक संकेतन खेल है T। यहां तक ​​कि सरल, सभी प्रेषक प्रकारों की समान प्राथमिकताएं होती हैं (रिसीवर विभिन्न प्रकारों के जवाब में अलग-अलग कार्यों को प्राथमिकता देता है)। क्या रिसीवर कभी भी प्रतिक्रियाओं के बीच यादृच्छिकता से कड़ाई से बेहतर कर सकता है? जब एक संतुलन मौजूद होता है जहां रिसीवर केवल शुद्ध कार्य करता है?

सर्वव्यापक ने मेरे प्रश्न को अच्छी तरह से संक्षेप में कहा, "क्या यह कभी ऐसा मामला है कि उच्चतम रिसीवर भुगतान के साथ संतुलन जरूरी मिश्रित रणनीति शामिल है?"

चलो अनुक्रमिक संतुलन के साथ चलते हैं। यदि आप कुछ संकेतन के साथ शुरू करना चाहते हैं।

σt(m) संभावना है कि हैtT भेजताmM

σRm(a) संभावना है कि करने के लिए रिसीवर प्रतिक्रियाm के साथaA. μmΔT अवलोकन करने के बाद रिसीवर की मान्यताओं देताm

एक अनुक्रमिक संतुलन की आवश्यकता है σt दिया दे इष्टतम प्रतिक्रियाओं σR , σR इष्टतम दिया है μ और μ बायेसियन दिया है σ । यह वास्तव में एक कमजोर अनुक्रमिक की परिभाषा है, लेकिन सिग्नलिंग गेम में कोई अंतर नहीं है।

मेरा अंतर्ज्ञान यह कहता है कि जब कोई संतुलन मौजूद होता है, जहां रिसीवर केवल शुद्ध कार्य करता है, लेकिन मैं हमेशा इस तरह के सामान के साथ भयानक रहा हूं। हो सकता है कि हमें यह भी कहना पड़े कि यह शून्य-राशि का खेल नहीं है, लेकिन मैं केवल इसलिए कह रहा हूं क्योंकि मुझे याद है कि खिलाड़ियों को उन खेलों में रैंडमाइज करने की क्षमता बेहतर होती है। शायद यह कहीं एक कागज में एक फुटनोट है?

नीचे दिए गए खेल पर विचार करें जहां प्रेषक प्राथमिकताएं समान नहीं हैं। मैं निम्न गुणवत्ता के लिए माफी चाहता हूं। तीन प्रेषक प्रकार हैं, प्रत्येक समान रूप से संभावना है। हम बना सकते हैं कि मेरा मानना ​​है कि रिसीवर (खिलाड़ी 2) इष्टतम संतुलन है यदि वे संदेश प्राप्त करने पर यादृच्छिक करते हैं तो 1 प्रकार 1 और 3 खेलेंगे , एक अलग संतुलन बना सकते हैं। यदि रिसीवर m 1 के जवाब में एक शुद्ध रणनीति का उपयोग करता है , तो एक प्रकार 1 या 2 विचलित हो जाएगा और रिसीवर को बदतर बना देगा।m2m1

σRm1(a)=.5=σRm1(r)=.5

यहाँ छवि विवरण दर्ज करें


क्या रिसीवर द्वारा की जाने वाली क्रियाओं को प्रकार के कार्य के रूप में प्रेषक द्वारा भेजे गए संदेश पर प्रभाव पड़ता है या ये स्वतंत्र हैं?
मार्टिन वान डेर लिंडेन

मुझे बिल्कुल यकीन नहीं है कि आपका क्या मतलब है। एक रिसीवर प्रकार है। उनकी रणनीति संदेशों को कार्यों के वितरण में बदल देती है। उनके पास केवल संदेश इंसोपर का प्रभाव होता है क्योंकि प्रेषक सबसे अच्छी प्रतिक्रिया निभा रहे हैं।
पैबर्ग

2
मान लीजिए कि एक संतुलन मौजूद है जिसमें रिसीवर कार्यों के सेट पर यादृच्छिक हो जाता है । इसका अर्थ यह है कि परिभाषा के अनुसार, उसे α - किन्हीं भी , जिनमें सारा भार एक ही क्रिया (शुद्ध कार्यनीति) पर रखा गया है, पर दो संभावित वितरण के बीच उदासीन होना चाहिए । तो नहीं, मिश्रित रणनीति कभी भी सबसे अच्छी शुद्ध रणनीति से बेहतर नहीं हो सकती। या मैंने सवाल को गलत समझा? αα
सर्वव्यापी

@ सर्वव्यापी मुझे समझ में आता है, लेकिन मैं सोच रहा था कि क्या कुछ अजीब रोग संबंधी मामले हो सकते हैं। उदाहरण के लिए, मैं केवल एक प्रमेय पा सकता था, "सही याद के साथ एक परिमित व्यापक रूप के खेल में अदायगी के सामान्य विकल्पों के लिए, अदायगी अनुक्रमिक संतुलन के प्रत्येक जुड़े घटक पर स्थिर होती है।" सामान्य कैविटी ने मुझे आश्चर्यचकित कर दिया।
पेबर्ग

1
@Pburg हाँ, मैं देख रहा हूँ। ऐसा लगता है कि हमारे मन में अलग-अलग सवाल थे। मैं सोच रहा था "यह कभी ऐसा होता है कि रिसीवर के है अद्वितीय किसी दिए गए इस रणनीति के लिए सबसे अच्छी प्रतिक्रिया मिली-जुली रणनीति है?", जबकि ऐसा लगता है आपके सवाल का वास्तव में है "यह कभी मामला है कि उच्चतम रिसीवर भुगतान के साथ संतुलन जरूरी शामिल मिश्रित रणनीति? "
सर्वव्यापी

जवाबों:


3

शायद मेरे पास एक पलटवार है!

m1,m2,m3t1,t2,t3पीआर(टी=टी2)=1Pr(t=t3)=12ϵ पीआर(टी=टी1)=1Pr(t=t2)=14मीटर30Pr(t=t1)=14+ϵm30

संदेश के लिए रिसीवर प्रतिक्रियाओं का सेट is { a , r }m=m1,m2{a,r}

ut(a,m1)=1>ut(a,m2)=β>ut(r,)=0

यू आर ( टी 3 , एम आई , ) = 1uR(t1,m1,a)=uR(t2,m2,a)=2 , ,uR(t3,mi,a)=1

यू आर ( टी 3 , एम आई , आर ) = uR(t2,m1,a)=uR(t2,m1,a)=0 , ,uR(t3,mi,r)=2

uR(t1,mi,r)=uR(t2,mi,r)=1

फिर संतुलन में, सभी प्रेषकों को एक ही उपयोगिता प्राप्त करनी चाहिए, सही? अन्यथा, एक दूसरे की रणनीति का अनुकरण करेगा।

तो, केवल शुद्ध रणनीति संतुलन सभी प्रेषकों के लिए चुनने के लिए है । या पर पूलिंग , चुनने के लिए सबसे अच्छी प्रतिक्रिया है । कोई शुद्ध रणनीति यदि छोड़कर संतुलन को अलग है और भेजने , और साथ रिसीवर प्रतिक्रिया । तब सभी संदेशों के बीच उदासीन है, क्योंकि वह निश्चित रूप से भुगतान साथ मुलाकात करेगा । यह सब रिसीवर को पेऑफm 1 m 2 r t 1 t 2 m 2 r t 3 0 3m3m1m2rt1t2m2rt3032ϵ

फिर उस मामले पर विचार करें जहां औरअब, प्रेषक उन दो संदेशों को भेजने के बीच उदासीन हैं। फिर, और लिए । फिर रिसीवर की रणनीति तर्कसंगत है।σ मीटर 2 आर ( एक ) = 1. σ टी 3 ( मीटर 1 ) = ε + 1 / 4σRm1(a)=βσRm2(a)=1.σटीमैं(मीटरमैं)=1मैं=1,2σt3(m1)=ϵ+1/4ϵ+1/2=1σt3(m1)σti(mi)=1i=1,2

या दिए गए से रिसीवर की अपेक्षित उपयोगिता 1.5 है। से अपेक्षित उपयोगिता 1.5 से थोड़ी अधिक है, । तो पूर्व निर्धारित अपेक्षित अदायगी से ऊपर है, ऊपर वर्णित शुद्ध संतुलन से बेहतर है। इसके अलावा, यह पृथक्करण केवल मिश्रण द्वारा बनाए रखा जाता है। रिसीवर द्वारा ली गई कोई भी अन्य शुद्ध रणनीति प्रेषक पूलिंग को प्रेरित करेगी, जिसका अर्थ है कि रिसीवर के चुनने पर केवल एक शुद्ध रणनीति संतुलन है । a r m 2 a 3m1arm2aआर32ϵr

मैं होना चाहिए के लिए बाईं ओर स्थित इस भुगतान के लिए नीचे चित्र में रों । मुझे लगता है कि प्रमुख घटक है।a β < βaβ<1

यहाँ छवि विवरण दर्ज करें


3

मुझे लगता है कि यह जोखिम से हिचकते प्रेषकों, जोखिम तटस्थ रिसीवर, और साथ ऐसा नहीं हो सकता अमीर पर्याप्त।A

उदाहरण के लिए, और विहित सिग्नलिंग मॉडल से चिपके रहने के लिए, मान लीजिए कि पॉजिटिव रियल लाइन है और समय में रिसीवर की यूटिलिटी यूटिलिटी कम हो रही है और सेंडर की यूटिलिटी बढ़ रही ।यू एक एकAuaa

(जाहिर है, यह केवल एक आंशिक उत्तर है क्योंकि रूपरेखा बहुत कम सामान्य है कि आपके प्रश्न में एक है, इसलिए यह आपके लिए संतोषजनक नहीं हो सकता है। मैं अभी भी एक तर्क प्रदान करता हूं कि आप इन मान्यताओं के साथ ठीक थे)

एक विरोधाभास प्राप्त करने के लिए, मान लीजिए कि एक संतुलन और में कुछ । चलोσ मीटर आर ( एक " ) > 0 एक 'एक "σRm(a)>0σRm(a)>0aaA

aσRm(a)σRm(a)+σRm(a)a+σRm(a)σRm(a)+σRm(a)a.

जोखिम उठाने से

u[a]>σRm(a)σRm(a)+σRm(a)u(a)+σRm(a)σRm(a)+σRm(a)u(a).
[σRm(a)+σRm(a)]u(a)>σRm(a)u(a)+σRm(a)u(a).

कुछ निरंतरता धारणा के तहत, वहाँ भी मौजूद होना चाहिए

a<a

ऐसा है कि

[σRm(a)+σRm(a)]u(a)=σRm(a)u(a)+σRm(a)u(a).

तो निम्नलिखित तरीके से निर्मित विचार करेंσRm

  • σRm(a)=σRm(a)=0 ,
  • σRm(a)=σRm(a)+[σRm(a)+σRm(a)]
  • अन्य सभी ,a~σRm(a~)=σRm(a~)

यदि यह प्रेषकों द्वारा भेजे गए संकेतों को परिवर्तित नहीं तो प्राप्तकर्ता over पसंद करेंगे , क्योंकि इसमें कम अपेक्षित क्षतिपूर्ति शामिल है। लेकिन निर्माण के द्वारा, प्रेषक और बीच उदासीन होते हैं , इसलिए उन्हें उसी संकेतों को में भेजना चाहिए । इस प्रकार एक संतुलन नहीं हो सकता है जिससे पता चलता है कि हम एक संतुलन पर सकारात्मक संभावना के साथ दो अलग-अलग क्रियाएं नहीं कर सकते हैं। Σ मीटर आर σ मीटर आरσRmσRm Σ मीटर आर σ मीटर आर σ मीटर आरσRmσRmσRmσRm


इस मॉडल में, रिसीवर हमेशा चुन सकता ? a=0
4

मैं यह जरूरी मामला नहीं है। रिसीवर हमेशा choses तो नहीं संकेत बात, वह प्रोत्साहित "उच्च" प्रकार एक "उच्च" संकेत गर्त उनके प्रकार प्रकट करने के लिए नहीं है। यह एक पूलिंग संतुलन में इष्टतम हो सकता है, लेकिन एक अलग संतुलन में नहीं। उदाहरण के लिए देखें। Mas-Colell, Whinston और Green का सेक्शन 13.C, हालाँकि सेटअप फिर से आपसे थोड़ा अलग है (जैसे अलग-अलग प्रकार के श्रमिकों के लिए प्रतिस्पर्धा करने वाली दो फ़र्में हैं)a
Martin Van der Linden

"रिसीवर की लीनियर यूटिलिटी घटती है" तो क्या मतलब है?
पेबर्ग

खेद है कि बहुत स्पष्ट नहीं था। स्पेंस सिग्नलिंग मॉडल में, मेरे पास रिसीवर को भेजने के लिए मजदूरी का भुगतान करने की क्रिया है। रिसीवर की उपयोगिता प्रेषक टी के प्रकार पर निर्भर करती है, वेतन का भुगतान − w घटा। मूल रूप से, रिसीवर जोखिम तटस्थ है: वह केवल उस अपेक्षित वेतन की परवाह करता है जिसे उसे भुगतान करना होगा, और अपेक्षित प्रकार वह काम करेगा।
मार्टिन वान डेर लिंडेन

ठीक है, मुझे लगता है कि मैंने इसे द्विघात हानि के रूप में देखा है,इस सुझाव के लिए धन्यवाद, हालांकि मैं कुछ और सामान्य के लिए देख रहा हूँ, लेकिन असतत कार्यों के साथ। (tw)2.
14
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.