गेम थ्योरी का उपयोग करके एक शोध विषय चुनना


19

यह हालिया गेम थ्योरी प्रश्न मुझे सोचने पर मजबूर कर गया (यह एक स्पर्शरेखा है, निश्चित रूप से): क्या खेल के सिद्धांत का उपयोग करने के लिए शोध प्रश्नों को चुनने के लिए व्यक्तिगत रणनीति को कुशलतापूर्वक अनुकूलित करना संभव है?

प्रश्न के औपचारिककरण की ओर जाने के लिए, मैं निम्नलिखित (अनौपचारिक रूप से कहा गया) अनुमान लगाऊंगा:

  • मैं समान रूप से मेरे लिए काम करने के लिए उपलब्ध किसी विशेष समस्या का "आनंद" लेता हूं ("नरम" (और सही!) से बचने के लिए "आपको जो पसंद है!") का उत्तर दें।
  • मैं किसी भी समस्या का जवाब खोजने में सफल हो सकता हूं या नहीं हो सकता है, जिस पर मैं काम करता हूं। किसी भी समस्या के लिए, मुझे इस समस्या की संभावना का कुछ अनुमान है कि मैं किसी समस्या को हल करने में कितना अच्छा होगा (इसमें निवेश करने के बाद)।
  • मेरा लक्ष्य लाइन का मूल्यांकन करते समय अपने भुगतान को अधिकतम करना है (नौकरी के लिए आवेदन करना, कार्यकाल के लिए आवेदन करना, फेलोशिप के लिए आवेदन करना, आदि), जो कि कितनी समस्याओं का समाधान करता है और कितनी महत्वपूर्ण या कठिन समस्याएं हैं । मेरे पास प्रति समस्या के सटीक भुगतान का स्पष्ट विचार नहीं है, लेकिन मैं एक उचित अनुमान लगा सकता हूं।
  • समस्या अदायगी और समस्या कठिनाई के बीच एक ढीला उलटा संबंध है। मेरे लक्ष्य का एक और कथन मतभेदों को "खेल" करने के लिए है (यानी "कम लटकने वाले फल के लिए देखो")।
  • इस समग्र समस्या का एक उदाहरण अनुसंधान प्रश्नों की एक सूची (संभवतः संख्या में अनंत) द्वारा निर्दिष्ट किया जाता है, जिससे मैं दृढ़ता से (बिना किसी कम्प्यूटेशनल लागत पर; इसे इनपुट के रूप में दिया जाता है) प्रश्न के मूल्य और प्रश्न की कठिनाई का अनुमान लगाता हूं। मैं एक विरोधी (मेरा मूल्यांकन करने वाला व्यक्ति) के खिलाफ यह खेल खेल रहा हूं; प्रकृति ने निर्णय लिया, मुझे दी गई समस्या को हल करने की संभावना को देखते हुए, क्या मैं इसे सफलतापूर्वक हल करने के बाद इसे चुनने का प्रयास करता हूं।

वास्तव में क्या हो रहा है (और निर्बाध या बहस / चर्चा-प्रकार की प्रतिक्रियाएं) को औपचारिक रूप देने के प्रयास में, मैं इस समस्या को एक असीम कार्रवाई के सेट के साथ अपूर्ण जानकारी के साथ एक व्यापक रूप के खेल के रूप में देखूंगा


प्रश्न : मेरा मानना ​​है कि इस प्रकार के खेल कुशलता से गणना योग्य नहीं हैं। हालांकि, क्या मेरे भुगतान को अधिकतम करने के लिए एक बहुपद समय एल्गोरिथ्म है? एक PTAS के बारे में क्या?

या, वैकल्पिक रूप से, क्या इस समस्या के लिए एक अधिक सटीक गेम-सिद्धांत मॉडल है? यदि ऐसा है, तो एक ही सवाल है: क्या मैं (लगभग) अपने भुगतान को कुशलतापूर्वक अधिकतम कर सकता हूं? यदि हां, तो कैसे?


4
इसे एक खेल के रूप में तैयार करने के साथ एक संभावित समस्या यह है कि आपका विरोधी, आपका मूल्यांकन करने वाला व्यक्ति, जरूरी नहीं कि आपके खिलाफ खेल रहा हो। वास्तव में यह अक्सर ऐसा होता है कि वे आपकी तरफ होते हैं, और केवल यह देखने के लिए तैयार होते हैं कि क्या आपने आवश्यकताओं को पूरा नहीं किया है। एक अन्य संभावित विरोधी अन्य सभी शोधकर्ता हैं , क्योंकि वे एक ही समस्या पर (संभवतः सहयोगी) काम कर रहे हैं और इस प्रकार आपके द्वारा परिणाम प्राप्त करने से पहले परिणाम प्राप्त करने की कोशिश करके सफलता प्राप्त करने के खिलाफ काम कर रहे हैं।
डेव क्लार्क

इस प्रश्न के प्रयोजनों के लिए (मैं जितना संभव हो उतना चर्चा को रोकना चाहूंगा, तो यह एक अच्छा प्रश्न है ...), मान लें कि मेरा मूल्यांकन करने वाला व्यक्ति वास्तव में एक को चुनने के लिए कुछ गंभीर दबाव में है और केवल एक सबसे अच्छा व्यक्ति के लिए एक विशेष इनाम, इसलिए वे प्रतिकूल हैं। इसके अलावा, मान लें कि "कुछ भी वास्तव में मूल सिर्फ इतना ही होगा: मूल", इसलिए अन्य शोधकर्ता गंभीर चिंता का विषय नहीं हैं। मैं निश्चित रूप से (!) व्यक्तिगत रूप से अन्य संभावनाओं में रुचि रखता हूं, लेकिन मुझे लगता है कि इसे खुला छोड़ना बुरे उत्तरों को आमंत्रित करेगा। :)
डैनियल एपोन

समस्या का एक कारक जो एक अलग मॉडल का गुणन कर सकता है: मैं उस समस्या के प्रति सफलता / इनाम संरचना की संभावना का मूल्यांकन करता हूं जिस पर मैं काम करता हूं।
डैनियल एपोन

2
खेल को मॉडल करने का एक तरीका यह है: आप समय पर अवधि समाप्त होने से पहले अनुसंधान बिंदुओं को इकट्ठा करने की कोशिश कर रहे हैं । प्रत्येक प्रश्न आप पर काम कर सकते हैं लायक है अनुसंधान अंक, और प्रत्येक प्रश्न के लिए एक समारोह है है जो इसे सुलझाने यदि आप समय बिताने की संभावना देता है उस पर। घड़ी खत्म होने से पहले पर्याप्त अंक एकत्र करने की अपनी संभावनाओं को अधिकतम करें। आप इस खेल के लिए सबसे अच्छी रणनीति के बारे में कुछ कहने में सक्षम हो सकते हैं। आरटीआरमैंपीमैं(टी)टी
पीटर शोर

2
बेशक, वास्तविक जीवन में, आपके द्वारा उत्तरित प्रत्येक प्रश्न अधिक प्रश्नों को अनलॉक करता है, जिसे आप पहले से अनुमान नहीं लगा सकते हैं, लेकिन जो आपके द्वारा शुरू किए गए प्रश्नों के सेट की तुलना में काफी आसान और / या अधिक मूल्य के हैं, लेकिन एक बार जब आप रणनीति के पेड़ बनाना शुरू करते हैं इस तरह के खेल के बारे में आप कह सकते हैं कि दिलचस्प कुछ भी खोजने का मौका नाटकीय रूप से नीचे चला जाता है।
पीटर शोर

जवाबों:


4

मैं प्रश्न के लिए एक वैकल्पिक मॉडल का प्रस्ताव करके आपको सवाल का जवाब देने की कोशिश करने जा रहा हूं। मैं आमतौर पर यहां से अधिक प्रश्न पूछता हूं, इसलिए मुझे आशा है कि यदि आपका उत्तर इष्टतम नहीं है, तो मैं आपको क्षमा करूंगा, हालांकि मैं अपना सर्वश्रेष्ठ कर रहा हूं।

मुझे लगता है कि गेम थ्योरी को उपयोगी बनाने की अनुमति देने वाले प्रश्न को वाक्यांशित करने का तरीका अधिक प्रतिस्पर्धी परिदृश्य ग्रहण करना होगा। यानी, विभिन्न अभिनेताओं के बीच प्रतिस्पर्धा करने की आवश्यकता है। तो, मैं निम्नलिखित मानूंगा:

  • उपलब्ध शोध प्रश्नों के एक ही सेट को आगे बढ़ाने का प्रयास करने वाले अन्य शोधकर्ताओं का एक बड़ा लेकिन परिमित नंबर n है, जिसे मैं क्यू कहता हूं, जिसमें आप रुचि रखते हैं।
  • प्रत्येक अनुसंधान समस्या को निम्नलिखित विशेषताओं द्वारा परिभाषित किया गया है:
    • समय निवेश , या मुझे , इस समस्या को हल करने में सक्षम होने या न होने पर दृश्यता प्राप्त करने के लिए आवश्यक है
    • समस्या को हल करने में सफलता , या एस की संभावना ; एक बार जब आप "सच्चाई के क्षण" तक पहुंच जाते हैं और पर्याप्त समय लगाते हैं, तो प्रकृति बेतरतीब ढंग से तय करेगी कि क्या आप समस्या को हल करने में सक्षम होने जा रहे हैं या नहीं
    • अपने करियर के लिए लाभ , या यू (उपयोगिता के अनुसार), बशर्ते सफलता प्राप्त हो
  • इनमें से प्रत्येक शोधकर्ता के पास निम्न मात्राओं के विभिन्न स्तर हैं:
    • अनुसंधान में निवेश के लिए उपलब्ध समय, टी
    • अनुसंधान में प्रतिभा, आर
    • पारस्परिक कौशल और अन्य कैरियर-सहायक गुण, l (जैसे भी हो), जो यह निर्धारित करेगा कि शोधकर्ता अपने कैरियर की उन्नति के लिए अपने अनुसंधान की सफलताओं को कितना भुनाने में सक्षम होगा।

अब, किसी भी समस्या पर कोई सहयोग नहीं करना संभव है, विचार करें कि मैं "गतिशील पुनरावृत्त खेल" के रूप में क्या संदर्भित करने जा रहा हूं। यह एक ऐसा खेल है जिसे बार-बार खेला जाता है, लेकिन जब भी इसे खेला जाता है तो हर बार थोड़ा बदल जाता है।

चलो एम खेल में चालों की संख्या, या बदल जाता है। खेल की प्रारंभिक अभिव्यक्ति को एक सूची के रूप में दर्शाया जा सकता है जिसमें प्रत्येक अभिनेता (शोधकर्ता) और प्रत्येक समस्या है जो वे काम कर सकते हैं, प्रत्येक अभिनेता से जुड़े सभी मूल्यों और प्रत्येक समस्या के अलावा जो मैंने ऊपर सूचीबद्ध की थी। (मैं मान रहा हूँ, निश्चित रूप से, कि हर शोधकर्ता वर्तमान में सभी समस्याओं के बारे में जानता है, और अन्य सभी शोधकर्ताओं के बारे में जानता है, जिससे यह सही जानकारी का खेल बन जाता है।)

खेल के प्रत्येक पुनरावृत्ति के दौरान, एक दिया गया अभिनेता काम करने के लिए एक शोध प्रश्न चुनता है। प्रत्येक अभिनेता को किसी भी समय प्रश्न स्विच करने की अनुमति दी जाती है, और यदि कोई समस्या हल हो जाती है, तो करियर यू के लिए लाभ अन्य सभी खिलाड़ियों के लिए 0 पर गिरा दिया जाता है। यदि कोई खिलाड़ी पर्याप्त समय अर्जित करता है और समस्या को हल करने में विफल रहता है, तो उस विशेष खिलाड़ी को उस समस्या को फिर से हल करने की कोशिश करने से रोक दिया जाता है ... हालांकि किसी अन्य खिलाड़ी को समस्या पर काम करना जारी रखने की अनुमति है, और कोई अन्य अभिनेता हल करने में सक्षम हो सकता है यह सफलतापूर्वक है। खेल सभी एम बदल जाने के बाद समाप्त होता है ।

प्रत्येक मोड़ जो एक शोधकर्ता ने एक समस्या का चयन किया है, उस खिलाड़ी को "सच्चाई के क्षण" तक पहुंचने के करीब लाने का कारण होगा, और संभवतः समस्या को हल करना, प्रकृति अनुमति। एक समस्या, एक बार हल हो जाने पर, एल के आधार पर शोधकर्ता के करियर में एक निश्चित लाभ जुड़ जाता है । अनुसंधान प्रतिभा सफलता की संभावना को बढ़ाती है, जबकि खाली समय किसी दिए गए मोड़ में प्रगति करने की क्षमता को बढ़ाता है।

मुझे संदेह है कि इसे हल करने के लिए कोई बहुपद समय एल्गोरिथ्म है; मुझे कोई कारण नहीं है कि शोधकर्ताओं को शुद्ध-रणनीति नैश इक्विलिब्रिया खेलने के लिए प्रतिबंधित किया जाना चाहिए, इसलिए समस्या मिश्रित-रणनीति नैश संतुलन शामिल होगी और इस तरह सबसे खराब पीपीएडी-पूर्ण होगा, यदि आप "समस्या को हल करने" पर विचार करते हैं, तो "नैश ढूंढना" समस्या के लिए संतुलन। " (कोई कल्पना कर सकता है कि यदि आप आस-पास के सबसे सक्रिय शोधकर्ता हैं, तो आप आगे बढ़ सकते हैं और अपने पसंदीदा नैश संतुलन की गणना कर सकते हैं और फिर इसे अन्य सभी खिलाड़ियों को संकेत दे सकते हैं ... इस प्रकार आपको कुछ विश्वास दिलाते हैं कि कोई भी रणनीति से दूर नहीं होगा। प्रोफ़ाइल आपने संकेत दिया है।)

किसी भी दर पर, यह मेरे द्वारा पोस्ट किया गया सबसे अधिक सम्मिलित उत्तर है। मुझे उम्मीद है कि यह कम से कम कुछ मूल्य का है। कृपया मुझे बताएं कि किसी के पास कोई प्रतिक्रिया है या इसे सुधारने के लिए सिफारिशें हैं या नहीं।


1
फिलिप, उत्तर के लिए धन्यवाद! यह समस्या पर एक महान परिप्रेक्ष्य है; मुझे आश्चर्य है: क्या आप समस्या में "आंशिक जानकारी" की धारणा जोड़ने के लिए किसी भी तरह से सोच सकते हैं ताकि यह अपनी पीपीएडी-पूर्णता की स्थिति बनाए रखे? कुछ इस तथ्य को मॉडल करने के लिए कि इस खेल में एक खिलाड़ी के रूप में, मुझे जरूरी नहीं पता है कि मेरे सभी विरोधी क्या कर रहे हैं (यानी मुझे इस बात का सही ज्ञान नहीं है कि वे किन सवालों पर विचार कर रहे हैं और वे किस ताकत पर विश्वास करते हैं प्रत्येक प्रश्न का उत्तर)? क्या इसे जोड़ने से नैश इक्विलिब्रियम की गणना की जटिलता प्रभावित होती है? (मुझे नहीं पता!)
डैनियल एपोन

1
@ डैनियल अपॉन: टिप्पणी के लिए धन्यवाद! मुझे नहीं लगता कि स्थितियों में फेरबदल करना मुश्किल होगा, इसलिए आप आसानी से नहीं जानते कि आपके विरोधी क्या कर रहे हैं, या उनकी विशेषताएं क्या हैं। केवल चेतावनी है, मुझे लगता है कि जब आप अपूर्ण-सूचना के खेल से निपट रहे होते हैं तो नैश संतुलन के अस्तित्व की गारंटी खत्म हो जाती है। मुझे इस बारे में बहुत जानकारी नहीं है कि "स्टैकेलबर्ग गेम्स" के रूप में क्या जाना जाता है, लेकिन मुझे लगता है कि वे आपके प्रस्तावित बदलाव के लिए प्रासंगिक हो सकते हैं। मैं वास्तव में आश्चर्यचकित हूं कि अपूर्ण सूचना गेम में सबसे अच्छा समाधान अवधारणा क्या है ... मैं इसे कुछ विचार दूंगा।
फिलिप व्हाइट

मैं इस पर थोड़ा और पढ़ता हूं ... मुझे लगता है कि बेयसियन खेल यहां प्रासंगिक हो सकते हैं, क्योंकि उनका उपयोग अपूर्ण जानकारी वाले खेलों से निपटने के लिए किया जाता है। यहाँ विकिपीडिया पृष्ठ का एक लिंक दिया गया है जिस पर मैंने नज़र डाली: en.wikipedia.org/wiki/Bayesian_game
फिलिप व्हाइट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.