ओसबोर्न, नैश संतुलन और मान्यताओं की शुद्धता


12

ओसबोर्न के एन इंट्रोडक्शन टू गेम थ्योरी नैश संतुलन में निम्नानुसार वर्णित है (पृष्ठ 21–22):

सबसे पहले, प्रत्येक खिलाड़ी तर्कसंगत विकल्प के मॉडल के अनुसार अपनी कार्रवाई का चयन करता है, अन्य खिलाड़ियों के कार्यों के बारे में उसे विश्वास दिलाता है। दूसरे, हर खिलाड़ी का दूसरे खिलाड़ियों के कार्यों के बारे में विश्वास सही है।

मुझे ऐसा लगता है कि यह परिभाषा एक रणनीति प्रोफ़ाइल के रूप में नैश संतुलन की सामान्य परिभाषा के पूरी तरह से समकक्ष नहीं है, जहां प्रत्येक खिलाड़ी की रणनीति दूसरों की रणनीतियों के लिए सबसे अच्छी प्रतिक्रिया है।

सामान्य परिभाषा विश्वासों के बारे में कुछ नहीं कहती है और इसलिए इस संभावना के लिए अनुमति देता है कि विश्वास गलत हो सकते हैं।

एक तुच्छ संभावना लेने के लिए, कैदी की दुविधा पर विचार करें। मान लीजिए कि प्रत्येक खिलाड़ी का मानना ​​है कि अन्य खिलाड़ी कबूल नहीं करेगा। चूंकि कबूल करना एक प्रमुख रणनीति है, प्रत्येक खिलाड़ी अभी भी कबूल करेगा। इसलिए क्रियाओं का एक नैश संतुलन होता है, भले ही खिलाड़ियों का विश्वास वास्तविक संतुलन क्रियाओं से पूरी तरह विपरीत हो।

क्या मैं इस समझ में सही हूं कि ओसबोर्न की परिभाषा नैश के संतुलन के अलावा कुछ और है?


नहीं करता है "सामान्य परिभाषा विश्वासों के बारे में कुछ नहीं कहती है और इसलिए इस संभावना के लिए अनुमति देता है कि विश्वास गलत हो सकता है।" बस इस तथ्य पर टिका है कि आप इन परिभाषाओं में हमेशा एक अंतर्निहित तर्कसंगतता की धारणा रखते हैं?
थोर्स्ट

जवाबों:


9

यहां मान्यताओं की भाषा प्रस्तुत करना थोड़ा अजीब है, यह देखते हुए कि खेल सिद्धांत के अन्य भागों में मान्यताओं का बहुत विशिष्ट अर्थ है।

aii1ai

i{aj}jiai1i


i

  • यदि खेल एक ऐसा है जो अक्सर खेला जाता है (अन्य परिणामों के मुद्दों को एक तरफ रखकर, जो कि बार-बार के खेल में बनाए रखा जा सकता है) तो हम नैश को इस अर्थ में एक संतुलन के रूप में सोच सकते हैं कि अगर हम वहां जुटे तो हम एक ऐसा मानदंड विकसित कर सकते हैं, जिससे हम आगे बढ़ सकें उस संतुलन को अनिश्चित काल तक खेलने के लिए (और दूसरों से भी ऐसा ही करने की अपेक्षा करें)।
  • यदि खेल वास्तव में एक-शॉट है तो हम आमतौर पर इस विचार को लागू करते हैं कि खिलाड़ी यह भविष्यवाणी करने की कोशिश करने जा रहे हैं कि अन्य क्या करेंगे और हमारी संतुलन धारणा इस विचार को एम्बेड करती है कि ये पूर्वानुमान सही होने चाहिए।

ऐसा लगता है कि दूसरे बिंदु में पूर्वानुमान ओसबोर्न द्वारा लागू "मान्यताओं" के अनुरूप हैं। हालाँकि, यह कहना महत्वपूर्ण है कि ये भविष्यवाणियाँ / "मान्यताएँ", केवल एक अनौपचारिक / सहज ज्ञान युक्त उपकरण हैं जो हमें इस बात की अवधारणा करने में मदद करती हैं कि संतुलन में क्या चल रहा है और इस तरह के संतुलन की परिभाषा का हिस्सा नहीं हैं। नैश संतुलन की अवधारणा स्वयं मान्यताओं की धारणा पर पूरी तरह से अज्ञेयवादी है (जैसा कि आप टिप्पणी में ध्यान दें, यह केवल कार्यों पर परिभाषित किया गया है), यही कारण है, जब ओसबोर्न नैश संतुलन को औपचारिक रूप से परिभाषित करता है, तो वह बिना आह्वान के ऐसा करता है। सभी पर विश्वासों का विचार।


4

प्रस्तुत विश्वास पीईबी और अनुक्रमिक संतुलन जैसी अन्य परिशोधन अवधारणाओं की तुलना में एनई की अवधारणा बनाता है, लेकिन एनई का अर्थ नहीं बदला है।

Mas-Colell, Whinston, और Green (MWG) द्वारा स्नातक माइक्रो पाठ्यपुस्तक का एक परिणाम है

σΓEμ

  1. σμ HPr(H|σ)>0
  2. विश्वासों की प्रणाली जब भी संभव हो बायस के नियम के माध्यम से रणनीति प्रोफाइल से ली गई है।σμσ

इस प्रकार, कैदी की दुविधा का उदाहरण आप देते हैं जहां खिलाड़ियों के पास विरोधी की वास्तविक रणनीति के विपरीत विश्वास है जो दूसरी शर्त को विफल करता है, जिसके लिए जब भी संभव हो बेयस के नियम से व्युत्पन्न विश्वासों की आवश्यकता होती है। वास्तव में, यह ओसबोर्न की परिभाषा की दूसरी आवश्यकता के गणितीय समकक्ष है: कि एक खिलाड़ी का दूसरे खिलाड़ियों के कार्यों के बारे में विश्वास सही है।


मुझे लगता है कि MWG और ओसबोर्न में अंतर है। MWG कह रहे हैं कि एक नैश संतुलन के लिए "वहाँ मौजूद है" विश्वासों की एक प्रणाली जो इसे समझदार बनाती है। हम इस बात पर चुप हैं कि क्या विश्वास है, अगर कोई है, तो खिलाड़ियों को वास्तव में है। ओसबोर्न कह रहे हैं कि खिलाड़ियों का वास्तव में विश्वास है और वे सही हैं। मुझे लगा कि उत्तरार्द्ध NE के वैचारिक अर्थ को बदल देता है क्योंकि सामान्य परिभाषा में मान्यताओं का उल्लेख नहीं है और कैदी की दुविधा उदाहरण से पता चलता है कि रणनीतियां विशिष्ट रूप से मान्यताओं का निर्धारण नहीं करती हैं।
ज्योतिर्मय भट्टाचार्य 1

@ ज्योतिर्मय भट्टाचार्य: मुझे नहीं लगता कि MWG "क्या मान्यताओं पर चुप है, यदि कोई है, तो खिलाड़ियों को वास्तव में है"। प्रस्ताव की शर्त 2 में वास्तव में आवश्यकता है कि यह विश्वास जब भी संभव हो बेयस नियम का उपयोग करते हुए संतुलन रणनीति प्रोफ़ाइल से प्राप्त किया जाए। इस प्रकार, पीडी उदाहरण में, जब एक खिलाड़ी प्रायिकता 1 के साथ दोष चुनता है, तो दूसरे खिलाड़ी के विश्वास को भी एक्शन दोष पर प्रोबेबिलिटी 1 डालना चाहिए और इस तरह के विश्वास को देखते हुए सबसे अच्छा जवाब देना चाहिए (जो उसे दोष भी चुनता है)।
हिर के।

@ ज्योतिर्मय भट्टाचार्य: एनई के लिए विश्वास अद्वितीय होने की आवश्यकता नहीं है, हालांकि। ऐसा इसलिए है क्योंकि यदि किसी दिए गए संतुलन के लिए, गेम ट्री पर एक पथ को संभावना शून्य के साथ लिया जाता है, तो बेय्स का नियम लागू नहीं होता है, और इसलिए उस रास्ते पर कोई भी विश्वास एक NE में "सही" माना जाएगा। यही कारण है कि क्रमिक सन्तुलन जैसी परिशोधन की शुरुआत की जाती है, ताकि सन्तुलित रास्तों से अनुचित मान्यताओं को दूर किया जा सके।
हिर के।

@ ज्योतिर्मय भट्टाचार्य: इसके अलावा, क्योंकि यह एक अंडरग्राउंड पाठ्यपुस्तक है, ओसबोर्न ने शायद ऐसी भाषा को चुना है, जो शैक्षणिक कारणों से गणितीय रूप से कठोर है। मेरे लिए, ओसबोर्न की परिभाषा में दो स्थितियां MWG के प्रस्ताव में सटीक समकक्ष हैं।
हिर के।

3

आपके कैदी की दुविधा का उदाहरण केवल इसलिए काम करता है क्योंकि यह एक गेम है जिसमें प्रमुख रणनीति है। ओसबोर्न सही है।

किसी अन्य खिलाड़ी की रणनीति का सबसे अच्छा जवाब देने के लिए, जैसा कि आप देते हैं, मुझे उनकी रणनीति पता होनी चाहिए। दूसरे शब्दों में, मुझे विश्वास होना चाहिए कि वे क्या कर रहे हैं, और उन मान्यताओं को सही होना चाहिए। यह तर्कसंगतता की अवधारणा की मजबूती है।

आप इस बारे में एक दिलचस्प बात करते हैं कि आप प्रमुख रणनीतियों के साथ कैसे अजीब "संतुलन" खेल में प्राप्त कर सकते हैं। यह समतुल्य और जहां गलत हो सकता है और गैर-तर्कसंगत रणनीतियों पर सकारात्मक भार रख सकता है। लेकिन, मैंने कभी भी एक नैश संतुलन को नहीं देखा है जिसमें विश्वास शामिल हैं। मुझे याद है कि परिभाषाएँ, " एक रणनीति प्रोफ़ाइल " एक नैश संतुलन है अगर( σ , μ 2 ) μ 2 σ Σ σ मैंबी मैं ( σ - मैं )(σ,μ1)(σ,μ2)μ2σΣσiBi(σi)... "मेरा मानना ​​है कि इसका मतलब यह है कि मान्यताओं को परिभाषित करना अनावश्यक है, क्योंकि विश्वास रणनीति प्रोफाइल का सही आकलन है। मेरी किताबों में से एक, यह नैश (1950) प्रशस्ति पत्र के साथ सामान्य परिभाषा देता है।" फिर दो अंतर्निहित मान्यताओं पर चर्चा करने के लिए जाता है। एक सही विश्वास है और दूसरा तर्कसंगत खेल है जिसे सही मान्यता दी जाती है।


लेकिन किसी चीज को डिसप्राइव करने के लिए पर्याप्त है। यदि आप ओसबोर्न को यह दावा करने के लिए लेते हैं कि उसकी परिभाषा नैश के बराबर है तो कैदी की दुविधा के साथ एक समझौता कैसे करता है। मैं समझता हूं कि ओसबोर्न की परिभाषा तर्कसंगतता को मजबूत करने वाली है, मैं प्रस्तुत करता हूं कि यह सरल कारण के लिए नैश संतुलन नहीं है कि यहां संतुलन को कार्यों और विश्वासों पर परिभाषित किया गया है जबकि नैश संतुलन पूरी तरह से विश्वासों के बारे में है।
ज्योतिर्मय भट्टाचार्य

1
यह परिभाषा है, प्रमाण नहीं।
पेबर्ग

काफी उचित। लेकिन यह एक अवधारणा की परिभाषा है जिसमें पहले से ही एक और अच्छी तरह से स्वीकृत परिभाषा है। इसलिए मुझे उम्मीद है कि अगर लेखक का उल्लेख नहीं है अन्यथा वह दावा कर रहा है कि दो परिभाषाएं समान हैं।
ज्योतिर्मय भट्टाचार्य 5

स्पष्ट होना, क्या वह उन टिप्पणियों को परिभाषा में शामिल करता है, या चर्चा में है? ps मैंने अपना उत्तर संपादित किया
Pburg

मैंने जो हिस्सा उद्धृत किया है वह चर्चा है। इसके तुरंत बाद वह कहता है (p.22) "ये दो घटक निम्नलिखित परिभाषा में सन्निहित हैं" और फिर रणनीतियों के लिए सर्वश्रेष्ठ प्रतिक्रिया के संदर्भ में मानक परिभाषा देता है जिसमें विश्वासों का उल्लेख बिल्कुल नहीं है। तो मान्यताओं को परिभाषा में कहां सन्निहित है? और समस्या सिर्फ प्रमुख रणनीतियों वाले खेलों में नहीं है। यह उन उदाहरणों का निर्माण करना संभव है जहां कोई प्रमुख रणनीति नहीं है, लेकिन नैश संतुलन रणनीतियों को संतुलन खेलने से अलग मान्यताओं के लिए सबसे अच्छी प्रतिक्रियाएं हैं।
ज्योतिर्मय भट्टाचार्य

2

मैं उन बातों को दोहरा सकता हूं, जो पहले कही गई हैं, लेकिन यहां इस पर मेरी राय है।

मुझे लगता है कि दो अलग-अलग मॉडलों की तुलना करते समय हम एक सामान्य समस्या का सामना करते हैं। एक "समतुल्यता" का अर्थ पूरी तरह से स्पष्ट नहीं है क्योंकि दो परिभाषाएं अलग-अलग दुनिया, या विभिन्न मॉडलों में निहित हैं। हालांकि, अगर "तुल्यता" को ठीक से परिभाषित किया गया है, तो मुझे लगता है कि कोई ओसबोर्न परिभाषा की समझ बना सकता है और यह दिखा सकता है कि यह वास्तव में "एनई" के बराबर है।

उद्धृत खंड में अंतर्निहित समाधान अवधारणा कुछ इस तरह होगी:

sbi

ui(si | si=bi)ui(s | si=bi) for all sSi
bi=si

p

यह मुश्किल हिस्सा है। इसका क्या अर्थ है कि "हर NE एक BE है"? निश्चित रूप से ऐसा नहीं है कि "एनई प्लस किसी भी विश्वास प्रोफ़ाइल एक बीई है", जैसा कि ओपी ने अपने काउंटर-उदाहरण के साथ दिखाया। फिर भी, यह मामला है कि "किसी भी एनई को कुछ विश्वास प्रोफ़ाइल के लिए बीई बनाया जा सकता है "। मुझे लगता है कि यह इस अर्थ में है कि किसी को ओसबोर्न के "तुल्यता" दावे को समझना चाहिए

सूचना है कि हम भी निम्न अधिक "तुल्यता की तरह" बयान है: "एक परिणाम खेल का एक NE परिणाम यदि और केवल यदि यह एक बीई नतीजा है कि"।


लेकिन हर बीई एक एनई नहीं है क्योंकि बीई अवधारणा तर्कसंगतता का कमजोर होना है जो हमें एनई से कड़ाई से कमजोर है।
ज्योतिर्मय भट्टाचार्य

जैसा कि मैंने लिखा है, मुझे यह समझने में परेशानी है कि बीई के लिए "एनई" न होने का क्या मतलब है क्योंकि वे विभिन्न मॉडलों में रहते हैं। क्या आपका मतलब है कि बीई में खेली जाने वाली कुछ रणनीतियाँ NE नहीं हैं? मैंने सोचा कि यह गलत था, लेकिन मैं कुछ याद कर सकता था। अगर आपका यही मतलब है, तो क्या आप मुझे एक काउंटर-उदाहरण की ओर इशारा कर सकते हैं? यह बहुत मददगार होगा।
मार्टिन वान डेर लिंडेन

मुझे यकीन नहीं है कि बीई तर्कसंगतता की कमजोरी है। मेरी समझ में, बीई तर्कसंगत होने के साथ-साथ इस शर्त के साथ है कि अनुमान सही हैं, है ना? अगर यह सही है, तो क्या हम तर्कसंगतता से मजबूत नहीं होंगे? (यह निश्चित रूप से उस पर निर्भर करता है जिसे "कमजोर / मजबूत" समाधान अवधारणा कहा जाता है)
मार्टिन वैन डेर लिंडेन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.