असंबद्ध अर्ध-निजी सिक्कों के साथ रेफरी खेल


31

मैं वास्तव में इस प्रश्न के उत्तर में दिलचस्पी ले रहा था, क्योंकि यह उन खेलों की जटिलता पर एक दिलचस्प बदलाव है, जिन्हें हल नहीं किया गया है, इसलिए मैंने एक इनाम की पेशकश की। मुझे लगा कि मूल प्रश्न बहुत कठिन था, इसलिए मैंने तीन संबंधित प्रश्न पोस्ट किए जो कि इस योग्य भी होंगे। इनाम की समय सीमा समाप्त होने से पहले किसी ने कोई जवाब नहीं दिया। मैं बाद में संबंधित प्रश्नों में से दो (मेरे मूल पद के नीचे चर्चा किए गए प्रश्न 3 और 4) का उत्तर देने में सक्षम था, जिसमें दर्शाया गया था कि सहसंबद्ध अर्ध-निजी सिक्कों के साथ रेफरी किए गए खेलों के मूल्य का अनुमान लगाया गया था (नीचे परिभाषित) पूरा-पूरा था। मूल प्रश्न अभी भी अनुत्तरित है। मैं दिलचस्प जटिलता कक्षाओं में PSPACE और EXPTIME के ​​बीच संबंधित गेम डालने वाले किसी भी परिणाम में दिलचस्पी लेता हूं।

मूल पोस्ट:

यह सवाल इताई के हेक्स प्रश्न पर चर्चा से प्रेरित था । एक रेफरीड गेम एक ऐसा खेल है जिसमें दो कम्प्यूटेशनल अनबाउंड खिलाड़ी एक बहुपद-समय सत्यापनकर्ता के माध्यम से संवाद करते हैं, जो निजी सिक्कों को फ्लिप कर सकते हैं (इस प्रकार मोड़ की संख्या और संचार की मात्रा भी बहुपद-समय पर होती है)। खेल के अंत में, रेफरी पी में एक एल्गोरिथ्म चलाता है जो यह निर्धारित करता है कि कौन जीतता है। यह निर्धारित करना कि कौन इस तरह के खेल को जीतता है (यहां तक ​​कि लगभग) पूरा पूरा हो गया है। यदि आपके पास सार्वजनिक सिक्के और सार्वजनिक संचार हैं, तो ऐसे खेल PSPACE में हैं। ( फीज और किलियन को देखें, "मेकिंग गेम्स शॉर्ट।" ) मेरा प्रश्न इन दो परिणामों के बीच की सीमा की चिंता करता है।

  • प्रश्न: मान लीजिए कि आपके पास दो कम्प्यूटेशनल रूप से अनबाउंड खिलाड़ी हैं जो एक बहुपद-लंबाई का खेल खेलते हैं। रेफरी की भूमिका सीमित है, प्रत्येक चाल से पहले, प्रत्येक खिलाड़ी को कुछ संख्या में निजी सिक्का फ़्लिप (दूसरे खिलाड़ी के साथ असंबद्ध) दिया जाता है। खिलाड़ी की सभी चालें सार्वजनिक हैं, और इसलिए उसे अपने प्रतिद्वंद्वी द्वारा देखा जाता है - केवल निजी जानकारी सिक्का फ़्लिप है। खेल के अंत में, सभी निजी सिक्का फ़्लिप प्रकट होते हैं, और पॉली-टाइम रेफरी इन सिक्कों के फ़्लिप और खिलाड़ी की चाल का उपयोग करके यह तय करता है कि कौन जीतता है।

    रेफरी के खेल के परिणाम से, इस संभावना का अनुमान लगाते हैं कि पहला खिलाड़ी जीत गया है, और यह भी स्पष्ट रूप से PSPACE- हार्ड है। कौन सा (यदि या तो) है? क्या इस समस्या के बारे में कुछ पता है?

ध्यान दें कि खिलाड़ियों को मिश्रित रणनीतियों का उपयोग करना पड़ सकता है, क्योंकि आप इस तरह से शून्य-राशि मैट्रिक्स गेम (एक ला वॉन न्यूमैन) खेल सकते हैं।

जोड़ा गया सामग्री:

चलो इस जटिलता वर्ग RGUSP (सभी भाषाओं फोन , जैसा कि ऊपर वर्णित जो Uncorrelated Semiprivate सिक्के के साथ एक संदर्भित खेल को कम किया जा सकता है, जैसे कि अगर एक्स एल , खिलाड़ी संभावना के साथ 1 जीत 2 / 3 , और यदि , खिलाड़ी 1 प्रायिकता साथ जीतता है )। मेरे तीन संबंधित प्रश्न हैं:LxL2/3xL1/3

  • प्रश्न 2: RGUSP काफी मजबूत लगता है। उदाहरण के लिए, यदि हम गेम बदलते हैं तो रेफरी संदेश नहीं भेजता है, लेकिन केवल खिलाड़ी 1 और 2 के सार्वजनिक संदेशों को देखता है, और उनसे निजी संदेश प्राप्त करता है, तो इस गेम के मूल्य का अनुमान लगाना अभी भी RGUSP के बराबर है। मैं यह प्रदर्शित करना चाहता हूं कि RGUSP मजबूत है, इसलिए मैं उस व्यक्ति को इनाम देने को तैयार हूं जो एक प्राकृतिक जटिलता वर्ग C पाता है, ताकि C RGUSP, जहां से कोई भी सम्‍मिलित न हो।

  • प्रश्न 3: मुझे यह भी संदेह है कि वर्ग आरजीसीएसपी (रेफरीड गेम्स विद कोरिलेटेड सेमिप्लिटिक सिक्के) एक्सपीटाइम पूरा हो गया है, और मैं इस तथ्य को साबित करने वाले किसी व्यक्ति को इनाम देने को तैयार हूं। आरजीसीएसपी में, पहले चरण में, रेफरी दो खिलाड़ियों को सहसंबद्ध यादृच्छिक चर देता है (उदाहरण के लिए, वह पहले खिलाड़ी को एक बड़े प्रक्षेप्य तल में एक बिंदु दे सकता है, और दूसरा खिलाड़ी एक पंक्ति जिसमें यह बिंदु होता है)। इसके बाद, एक बहुपद संख्या के लिए दोनों खिलाड़ी वैकल्पिक रूप से एक-दूसरे के पॉली-आकार के सार्वजनिक संदेश भेजते हैं। खेल खेले जाने के बाद, पॉली-टाइम रेफरी तय करता है कि कौन जीता। खिलाड़ी 1 के लिए जीतने की संभावना का अनुमान लगाने की जटिलता क्या है?

  • प्रश्न 4: अंत में, मेरे पास एक प्रश्न है जो वास्तव में क्रिप्टोग्राफी और संभाव्यता वितरण के बारे में हो सकता है: क्या दो खिलाड़ियों में एक अनियंत्रित अर्ध-निजी सिक्कों के साथ एक रेफरीड गेम में अनजान ट्रांसफर करने की क्षमता देता है जो उन्हें सहसंबद्ध सिक्कों के साथ एक मनमाने रेफरी खेल खेलने देता है। (या वैकल्पिक रूप से, क्या यह उन्हें विजेता का निर्धारण करने वाला गेम खेलने देता है जो EXPTIME-complete है)?


3
एक अवलोकन यह है कि रेफरी को केवल खेल की शुरुआत में खिलाड़ियों को यादृच्छिक सिक्के देने की आवश्यकता होती है। तुम बस लेने के अपने निजी यादृच्छिक सिक्के के कुछ लोगों द्वारा उसके इस कदम से पहले खिलाड़ी 1 के लिए यादृच्छिक सिक्के उत्पन्न कर सकते हैं खेल की शुरुआत से और उनके साथ एक स्ट्रिंग XOR'ing रों खिलाड़ी 2. द्वारा आपूर्ति की यह है कि खिलाड़ी को दिखाने के लिए आसान है 2 ऐसा नहीं कर सकते किसी भी चुनने की तुलना में बेहतर रों यादृच्छिक पर (जिसमें मामले रों XOR आर भी यादृच्छिक है)। rssरोंआर
पीटर शोर

3
मुझे "आधा-निजी आधा-सार्वजनिक" वाक्यांश से नफरत है। अर्ध-निजी के बारे में कैसे?
पीटर शोर

16
इसे 'फेसबुक प्राइवेट';) कह सकते हैं। आपको लगता है कि यह निजी है, लेकिन यह नहीं है
सुरेश वेंकट

3
यह मुझे प्रतीत होता है कि इस प्रश्न का उत्तर देने के लिए Feige-Kilian प्रमाण को आसानी से अनुकूलित नहीं किया जा सकता।
पीटर शोर

2
मुझे लगता है कि मैजिक: द गैदरिंग (और शायद अन्य संग्रहणीय कार्ड गेम) इस कमजोर प्रकार के रेफरी गेम के आदर्श उदाहरण हैं। मैं जादू नहीं खेलता, लेकिन प्रत्येक खिलाड़ी के पास एक डेक होता है, और खिलाड़ी अपने स्वयं के डेक को फेरना शुरू करते हैं, इसलिए सभी यादृच्छिकता असंबंधित होती है।
पीटर शोर

जवाबों:


12

मैं अपने मूल प्रश्न का उत्तर नहीं दे सकता, लेकिन मैं प्रश्न 3 (और 4) का उत्तर दे सकता हूं, जो मैंने तब जोड़ा जब मैंने एक इनाम दिया क्योंकि मुझे लगा कि मूल प्रश्न बहुत कठिन था। वास्तव में, मेरे पास प्रश्न 3 के दो प्रमाण हैं।

यहाँ प्रश्न 3 के लिए सेटिंग है: हमारे पास एक बहुपद-समय रेफरी है, जो खेल की शुरुआत में, खिलाड़ियों को 1 और 2 सहसंबद्ध यादृच्छिक चर देता है। खिलाड़ी 1 और 2 फिर रेफरी से किसी भी हस्तक्षेप के बिना, खेल खेलते हैं। खेल के अंत में, रेफरी प्रतिलेख को देखता है और निर्णय लेता है कि कौन जीतता है। मैं दिखा सकते हैं कि निर्णय लेने से जो इस तरह के खेल जीतता EXPTIME पूरा हो गया है, भले ही आप वादा दिया जाता है कि संभावना कम से कम के साथ विजेता जीत 2/3

======== प्रमाण 1 ============

पहला प्रमाण इस तथ्य का उपयोग करता है कि सुरक्षित दो-पक्षीय संगणना के लिए गुमनामी हस्तांतरण सार्वभौमिक है। इस प्रकार, यदि खिलाड़ी 1 और 2 अनजान स्थानांतरण कर सकते हैं, तो वे एक मनमाने ढंग से बहुपद-समय रेफरी का अनुकरण कर सकते हैं, इसलिए पिछले परिणाम जो रेफर किए गए खेल हैं, वे पूरी तरह से लागू होते हैं।

अब, खेल की शुरुआत में 1-2 गुमनामी हस्तांतरण प्राप्त करने के लिए, रेफरी दो खिलाड़ियों को बड़ी संख्या में "गुमनामी हस्तांतरण बक्से" देता है। हम इन गुमनामी हस्तांतरण बक्से में से एक का वर्णन करते हैं। P1 को दो यादृच्छिक संख्याएँ मिलती हैं, और r 2 । P2 को इनमें से एक रैंडम नंबर, r i और वेरिएबल i ( = 1 या 2 ) मिलता है, जो कहता है कि P1 के कौन से रैंडम नंबर उसे मिले। अनजान ट्रांसफर करने के लिए, P1 डेटा के दो टुकड़े लेता है, जिसे वह ट्रांसफर करना चाहता है, और XOR ने उन्हें r 1 और r 2आर1आर2आरमैंमैं=12आर1आर2। P2 फिर इनमें से एक को डीकोड कर सकता है, लेकिन P1 यह नहीं बता सकता कि कौन सा पी 2 डीकोड कर सकता है। यह 1-2 गुमनामी हस्तांतरण है। (जाहिर है, रेफरी को भी खिलाड़ियों को अनजान ट्रांसफर बॉक्स को दूसरे तरीके से निर्देशित करना होगा, पी 2 से पी 1 तक।)

जब मैंने पहली बार प्रश्न 4 पूछा, तो मुझे चिंता थी कि सुरक्षित दो-पक्षीय संगणना परिणाम रेफरी के साथ इस तरह की संवादात्मक संगणना पर लागू नहीं होता है, लेकिन वास्तव में यह दिखाना काफी आसान है कि वे करते हैं।

=========== सबूत 2 ===========

अब प्रश्न 3 के लिए दूसरे प्रमाण के लिए। यहाँ, हमें वापस जाने और Feige-Kilian के प्रमाण को संशोधित करने की आवश्यकता है। इस प्रमाण में, वे एक ट्यूरिंग मशीन T पर विचार करते हैं, जो एक घातीय समय गणना चल रही है। फीज और किलियन ने एक बड़े परिमित क्षेत्र GF ( p ) के ऊपर एक मल्टीलाइनर बहुपद Q t ( x_1 , , x_n ) में समय टी पर टेप पर बिट्स को एनकोड किया । अब, रेफरी पी 1 को एक बिंदु देता है और पी 2 को इस बिंदु से युक्त एक रेखा देता है, और दो खिलाड़ी बिंदु का मूल्यांकन और क्यू टी पर लाइन को रेफरी को वापस देते हैं। रेफरी टाइम टी खोजने के लिए बाइनरी सर्च का उपयोग करता है2nटीक्यूटी(,...,)पीक्यूटीटीजहां की P1 और P2 के मूल्यांकन सहमत हैं, लेकिन के अपने मूल्यांकन क्यू टी + 1 , असहमत जिसके बाद उन्होंने P1 एक चतुर सवाल जो कि क्या वह एक है जो झूठ बोल रहा है पता चलता है पूछता है।क्यूटीक्यूटी+1

पहली चीज जो हम उपयोग करेंगे, वह यह है कि असंबद्ध यादृच्छिक सिक्कों के साथ भी, रेफरी खिलाड़ियों को 1 और 2 बिट कमिटमेंट कर सकता है, उनके पास XOR डेटा होने से वे यादृच्छिक सिक्कों के साथ कमिटमेंट करना चाहते हैं। इस प्रकार, हम पी 1 और पी 2 के बारे में सीलबंद लिफाफों में बातें कर सकते हैं।

एक बात आप Feige-Kilian सबूत अनुकरण करने के लिए कोशिश कर सकते हैं है: रेफरी P1 विभिन्न बिंदुओं का एक बहुत देता है , और P2 लाइनों का एक बहुत मैं , ताकि पी मैं पर है मैं । अब, द्विआधारी खोज के प्रत्येक चरण में, खिलाड़ी क्यू टी ( पी i ) और क्यू टी ( envelop i ) मूल्यों को सील लिफाफे में डालते हैं , और फिर रेफरी खिलाड़ियों को खोलने के लिए यादृच्छिक रूप से चुनता है। दोनों खिलाड़ी तय करते हैं कि क्या मूल्य सुसंगत हैं, और तदनुसार बाइनरी खोज के साथ आगे बढ़ें। अब, हमने ( p i) को बर्बाद कर दिया हैपीमैंमैंपीमैंमैंक्यूटी(पीमैं)क्यूटी(मैं) जोड़ी है, क्योंकि दोनों खिलाड़ियों बिंदु और रेखा के मूल्य पता है, लेकिन हम अभी भी अन्य (बिंदु, रेखा) जोड़े है कि हम उपयोग कर सकते हैं की एक बहुत कुछ है।(पीमैं,मैं)

(कैसे रेफरी एक चुन सकते हैं बेतरतीब ढंग से करता है, तो वह केवल खेल की शुरुआत में खिलाड़ियों निर्देश देता है? वह अपने निर्देश मूल्यों वह शुरुआत में दो खिलाड़ियों के लिए देता है के XOR में सांकेतिक शब्दों में बदलना कर सकते हैं और दोनों खिलाड़ी अनुदेश को तब तक नहीं पढ़ सकते जब तक वे दोनों प्रासंगिक समय पर मूल्यों को प्रकट नहीं करते।)(पीमैं,मैं)

क्यूटी(पीमैं)क्यूटी(पीj)पीकश्मीर'कश्मीर'P2 के लिए लाइनों का सेट। बता दें कि प्रत्येक डमी लाइन के दो बिंदु हैं। यदि P1 एक रेखा पर एक डमी बिंदु के लिए सही मान देने और दूसरे डमी बिंदु के लिए गलत मान देने के लिए होता है, तो उसने खुद को एक झूठा के रूप में प्रकट किया है, क्योंकि P2 के लिए एक पंक्ति के लिए मान देने का कोई तरीका नहीं है जो है इस पर P1 के दो बिंदुओं में से एक के लिए सही और दूसरा नहीं। हम P2 उत्तर को लगातार बनाने के लिए एक समान चाल कर सकते हैं। तब केवल एक चीज बची हुई दिखाई दे रही है कि फीगे-किलियन प्रमाण का अंतिम चरण अभी भी काम करता है। यह सीधा हो जाता है, हालांकि विवरणों के माध्यम से जाने से यह उत्तर अधिक लंबा हो जाएगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.