ब्लैकवेल का दांव


12

मैंने Futwell कोठरी पर ब्लैकवेल के दांव विरोधाभास के बारे में पढ़ा है । यहाँ सारांश है: आपको दो लिफाफे, और प्रस्तुत किए । लिफाफे में पैसे की एक यादृच्छिक राशि होती है, लेकिन आप पैसे के बारे में वितरण के बारे में कुछ भी नहीं जानते हैं। आप एक को खोलें, चेक करें कि वहाँ कितना पैसा है ( ), और चुनना है: लिफाफा यावाई एक्स एक्स वाईExEyxExEy ?

व्यर्थता कोठरी लियोनार्ड वैपनर नामक एक गणितज्ञ को संदर्भित करती है: "अप्रत्याशित रूप से, ऐसा कुछ है जो आप कर सकते हैं, दूसरे लिफ़ाफ़े को खोलने की कमी, अपने आप को इसे सही होने के अवसर से भी बेहतर बनाने के लिए।"

यह विचार, जो मुझे गलत लगता है, इस प्रकार है: एक यादृच्छिक संख्या । यदि , । यदि , चुनें ।d < x E x d > x E ydd<xExd>xEy

वैपनर: “यदि d x और y के बीच आता है तो आपकी भविष्यवाणी (जैसा कि d द्वारा संकेत दिया गया है) सही होने की गारंटी है। मान लें कि यह प्रायिकता p के साथ होता है। यदि d, x और y दोनों से कम है, तो आपकी भविष्यवाणी केवल उसी स्थिति में सही होगी, जब आपका चुना गया नंबर x दोनों में से बड़ा हो। इसमें 50 प्रतिशत संभावना है। इसी तरह, यदि d दोनों संख्याओं से अधिक है, तो आपकी भविष्यवाणी केवल तभी सही होगी जब आपकी चुनी हुई संख्या दोनों में से छोटी हो। यह 50 प्रतिशत संभावना के साथ होता है। ”

यदि में होने वाली संभावना शून्य से अधिक है, तो इस विधि की औसत सफलता । इसका मतलब यह होगा कि एक असंबंधित यादृच्छिक चर देखने से हमें अतिरिक्त जानकारी मिलती है।[ x , y ] d[x,y]12+p2

मुझे लगता है कि यह सब गलत है, और यह समस्या एक यादृच्छिक-संख्या-संख्या चुनने में निहित है। इसका क्या मतलब है? जैसे, कोई पूर्णांक? उस मामले में, संभावना कि के बीच झूठ और शून्य है, क्योंकि दोनों औरd x y x ypdxyxy परिमित कर रहे हैं।

यदि हम कहते हैं कि अधिकतम राशि की सीमा है, तो कहें , या कम से कम हम से d चुनते हैं , तो नुस्खा को चुनने की तुच्छ सलाह पर यदि और चुनने यदि ।1 ... M E y x < M / 2 E x x > M / 2M1...MEyx<M/2Exx>M/2

क्या मुझे यहाँ कुछ याद आता है?

संपादित करें

ठीक है, अब मैं यह देखना शुरू करता हूं कि स्पष्ट विरोधाभास कहां से आता है। मुझे यह असंभव लग रहा था कि एक असंबंधित यादृच्छिक चर अतिरिक्त जानकारी प्रदान कर सकता है।

हालाँकि, ध्यान दें कि हमें सचेत रूप से d का वितरण चुनने की आवश्यकता है । उदाहरण के लिए, एक समान वितरण के लिए सीमाओं का चयन करें, या पोर्शियन डिस्ट्रीब्यूशन के आदि के लिए, स्पष्ट रूप से, अगर हम मूंगफली के लिए खेल रहे हैं, और हमने d के वितरण को पर समान होने के लिए चुना। डॉलर, । यह आखिरी संभावना लिफाफे में क्या हो सकता है के हमारे फैसले पर सबसे पहले और सबसे महत्वपूर्ण निर्भर करेगा ।[ 10 9 , 2 10 9 ] पी ( ( एक्स , वाई ) ) = 0λ[109,2109]P(d(x,y))=0

दूसरे शब्दों में, यदि तकनीक काम करती है, तो यह धारणा कि हम नहीं जानते कि लिफाफे में पैसे का वितरण क्या है (लिफाफे के लिए राशि का चुनाव कैसे किया गया) का उल्लंघन किया जाता है। हालांकि, अगर हम सही मायने में नहीं जानते हैं कि लिफाफे में क्या है, तो सबसे खराब स्थिति में, हम इसे लागू करने से कुछ भी ढीला नहीं करते हैं।

EDIT 2

एक और विचार। यह देखते हुए , हमें चुनने दें ड्राइंग के लिए , एक सतत गैर नकारात्मक वितरण ऐसी है कि । हमें ऐसा करने की अनुमति है, क्या मैं सही हूं? हम निर्देश के अनुसार आगे बढ़ते हैं - यदि , हम लिफाफा रखते हैं, यदि , हम लिफाफा बदलते हैं। तर्क नहीं बदलता है, इस बात पर निर्भर करता है कि हम वितरण का चयन कैसे करते हैं, यह हो सकता है किडी पी ( < x ) = पी ( > x ) < एक्स > एक्स पी ( [ एक्स , वाई ] ) > 0xdP(d<x)=P(d>x)d<xd>xपी([एक्स,y])>0 (या क्या मैं गलत हूं?) हो सकता है।

हालांकि, यह देखते हुए कि हमने वितरण कैसे चुना, अब हम जो करते हैं वह एक सिक्के के टॉस के बराबर है। हम एक सिक्का टॉस करते हैं, और अगर यह सिर है, तो हम लिफाफे बदलते हैं, अगर यह पूंछ है, तो हम उस लिफाफे से चिपक जाते हैं जिसे हम पकड़ते हैं। मैं गलत कहाँ हूँ?

EDIT 3 :

ठीक है, मैं इसे अभी प्राप्त करता हूं। यदि हम पर की प्रायिकता फ़ंक्शन को आधार बनाते हैं (उदाहरण के लिए, हम रेंज में एक समान वितरण से नमूना लेते हैं , तो प्रायिकता स्वतंत्र नहीं है ।एक्स(1,2एक्स)पी((एक्स,y))P(correct decision|d(x,y))

इसलिए, यदि (प्रायिकता ) के साथ, अनुमान हमेशा सही होता है, पहले की तरह। यदि कम संख्या, तथापि, और है , की तुलना में एक उच्च मौका है की तुलना में कम होने के लिए की तुलना में अधिक होने से , तो हम कोई गलत निर्णय के प्रति पक्षपाती रहे हैं। जब दो संख्याओं से अधिक हो तो समान तर्क लागू होता है।d(x,y)pxd(x,y)dxxx

इसका मतलब है कि हम ड्राइंग की प्रक्रिया चुनना है कि की स्वतंत्र रूप से । दूसरे शब्दों में, हमें वितरण के मापदंडों के बारे में एक अनुमान लगाने की आवश्यकता है जिसमें से और खींचे गए हैं; सबसे बुरा यह है कि हम अभी भी बेतरतीब ढंग से अनुमान लगाते हैं, लेकिन सबसे अच्छा क्या होता है कि हमारा अनुमान सही था - और फिर हमारे पास एक फायदा है। यह अनुमान लगाने से बेहतर कैसे होना चाहिए "एक्स और वाई विल, मुझे लगता है, कम से कम 1 $ हो , लेकिन अधिकतम 10 $ , इसलिए यदि , हम इसे रखते हैं, और यदि नहीं, तो हम इसे एक्सचेंज करते हैं" मैं अभी तक हूं देख।dxxyएक्स>5

मैं स्पेन्सर की पुस्तक में समस्या के पॉप-विज्ञान निरूपण ( अनपेक्षित अपेक्षाएँ: द क्यूरियोसिटीज़ ऑफ़ ए मैथमेटिकल क्रिस्टल बॉल ) से गुमराह हुआ था , जो बताता है कि

"किसी भी तरह से, एक यादृच्छिक पॉजिटिव पूर्णांक का चयन करें" (वैपनर एक ज्यामितीय वितरण का सुझाव देता है - सिक्कों को उछालना जब तक कि पहले सिर न आ जाए, प्रक्रिया को दोहराते हुए अगर ) "यदि अधिक लगता है और यदि अनुमान कम (...) आप सही ढंग से 50 प्रतिशत से अधिक समय का अनुमान लगाएंगे, क्योंकि अंक सही समय के 50 प्रतिशत से अधिक है! "=एक्स>एक्स<एक्स


1
बहुत निकट से संबंधित: stats.stackexchange.com/questions/95694
whuber

2
यह इस अर्थ में दो लिफाफे समस्या से काफी अलग है: (1) दो-लिफाफे समस्या में स्विच करने के लिए दिए गए तर्क में गिरावट है, तर्क में दोष को बायेसियन से पहले जोड़कर देखा जा सकता है (2) तर्क ब्लैकवेल के दांव के लिए वैपनर द्वारा दिया गया सही है।
मैथ्यू गुन

यदि लिफाफे में धन की मात्रा एस के एक सेट के मनमाने तत्व हैं, तो काम करने के लिए वैपनेर की रणनीति के लिए एक पर्याप्त और आवश्यक शर्त उस नंबर की सीडीएफ के लिए है जो आप एस पर सख्ती से बढ़ा रहे हैं
मोनिका

ठीक है, मुझे अभी भी कुछ याद आ रहा है - कृपया मेरा EDIT 2 देखें, लेकिन यह मुझे ऐसा लगता है जैसे हम सिर्फ एक सिक्का उछाल सकते हैं और इसे अभी भी तर्क के अनुसार काम करना चाहिए। मैं गलत कहाँ हूँ?
जनवरी

जवाबों:


8

यह अधिक व्यापक रूप से दो-लिफाफा समस्या के रूप में जाना जाता है । आमतौर पर राशियों को और 2 A के रूप में दिया जाता है, लेकिन यह जरूरी नहीं है कि ऐसा ही हो।2

कुछ बिंदु:

  1. आप समान रूप से एक यादृच्छिक पूर्णांक का चयन नहीं कर सकते हैं , लेकिन उद्धृत भाग को समान होने की आवश्यकता नहीं लगती है। एक वितरण चुनें - इससे कोई फर्क नहीं पड़ता कि यह तर्क के लिए क्या है - जब तक कि यह किसी भी परिमित मूल्य से अधिक होने की कुछ संभावना है।

  2. यह उद्धृत निर्णय नियम के साथ पूर्णांक चुनने के लिए समझ में नहीं आता है , क्योंकि धन असतत है जिसका अर्थ है कि एक गैर-बीमित राशि d = x है और उस मामले के लिए कुछ भी सूचीबद्ध नहीं है। (या वैकल्पिक रूप से, नियम को संशोधित करने के लिए यह निर्दिष्ट करने के लिए कि जब वे समान हों तो क्या करें) =एक्स

  3. इसे छोड़कर, आप कुछ गैर-नकारात्मक निरंतर वितरण से चुन सकते हैं - फिर हमें समानता के बारे में चिंता करने की ज़रूरत नहीं है।

* (न तो आप एक समान रूप से यादृच्छिक गैर-नकारात्मक पूर्णांक चुन सकते हैं और न ही एक समान रूप से यादृच्छिक सकारात्मक पूर्णांक)


यदि हम कहते हैं कि धन की अधिकतम राशि की सीमा है, तो कहें , या कम से कम हम 1 ... M से d चुनते हैं , तो नुस्खा y चुनने की तुच्छ सलाह पर उबलता है यदि x < M / 2 और यदि x > M / 2 है तो E x को चुनना1 ...yx<M/2Exx>M/2

अगर यह पता चला है कि जिस यादृच्छिक वितरण से को एम / 2 चुना जाता है, उसे यह काम करना चाहिए (आपको 50-50 से बेहतर देता है); यदि वितरण एक आधे में अटक जाता है तो यह नहीं होगा।xM/2

हालांकि, इस गेम के संस्करणों को मैं पहली बार प्रस्तुत किया गया था कि लिफाफा किसी ऐसे व्यक्ति द्वारा प्रस्तुत किया जाता है जो (संभवतः) खेल से अपनी आय को कम से कम करना चाहता है। अन्य लिफाफे पर स्विच करने का निर्णय लेने के लिए वितरण का उपयोग करने की रणनीति अभी भी उस उदाहरण में काम करेगी।


ठीक है, अंक (1-3) लिया गया। तो, मैं इस तरह के एक यादृच्छिक, गैर नकारात्मक, के निरंतर वितरण चुनने के लिए अनुमति कि पी ( < x ) = पी ( > एक्स ) , सही है? लेकिन तब निर्णय अनिवार्य रूप से एक सिक्का टॉस पर आधारित होता है ... क्या मैं गलत हूं? dP(d<x)=P(d>x)
जनवरी

आपको की बिल्कुल भी आवश्यकता नहीं है। आपको केवल दो राशियों के बीच में कुछ गैर-शून्य संभावना की आवश्यकता है। P(d<x)=P(d>x)
Glen_b -Reinstate Monica

हां, लेकिन मुझे मेरी इच्छा के अनुसार, d के लिए घनत्व फ़ंक्शन को परिभाषित करने की अनुमति है ? मैं एक बेतुके निष्कर्ष के लिए तर्क का नेतृत्व करने के लिए ऐसा करता हूं। d
जनवरी

अपनी रणनीति को x का एक कार्य बनाकर आप अपने आप को सही विकल्प बनाने का लाभ नहीं दे रहे हैं जब d, x और y के बीच है - आप गेम जीतने के अपने तरीके को परिभाषित कर रहे हैं। यदि आप जो लिंक देते हैं वह दावा करता है कि ऐसी रणनीति काम करेगी तो वे गलत होंगे
Glen_b -Reinstate Monica

क्या, वैपनर के तर्क में, मुझे x के एक फ़ंक्शन के रूप में को प्राप्त करने के लिए उपयोग की जाने वाली प्रायिकता फ़ंक्शन को परिभाषित करने के लिए मना किया है ? जब तक P ( d ( x , y ) ) > 0 है , तब तक उसका तर्क अभी भी काम करना चाहिए, क्या मैं गलत हूं? अगर मैं एक सतत, गैर नकारात्मक वितरण भी शामिल का उपयोग एक्स पर (जैसे समान वितरण ( 1 , 2 एक्स ) , तो मैं गारंटी है कि यह मामला है। और मैं अभी भी सही फैसला लेने के लिए अगर ( एक्स , वाई ) का हैdxP(d(x,y))>0x(1,2x)d(x,y)
जनवरी

7

स्पेन्सर का तर्क सही है!

कुछ टिप्पणियां:

  • वर्णित कट-ऑफ रणनीति के बाद जहां हम लिफाफे स्विच करते हैं यदि पूर्व-पूर्व अपेक्षा में सबसे खराब बेकार है। डी के एक अच्छे विकल्प के साथ , यह काफी उपयोगी हो सकता है।x<dd
  • यदि आप एक बायेसियन को जोड़ते हैं (यानी आप लिफाफे में पैसे के प्रारंभिक वितरण के बारे में विश्वास जोड़ते हैं), तो आप अपने पूर्व विश्वासों को देखते हुए के इष्टतम मूल्य के लिए हल कर सकते हैं।d
  • कुछ स्थितियों में (जैसे। जहाँ आप जितना अधिक निरीक्षण करते हैं, उतना ही अधिक संभावना है कि आपको बड़ा लिफाफा मिला है), एक कट-ऑफ रणनीति भी इष्टतम है।
  • अधिक सामान्य बायेसियन सेटिंग में, आप कई पुजारियों के लिए एक सरल कटऑफ रणनीति से बेहतर कर सकते हैं।

एक संबंधित लेकिन अलग समस्या:

जैसा कि कई @Glen_b और @whuber ने उल्लेख किया है, दो संबंधित लिफाफे की समस्या के रूप में जानी जाने वाली एक संबंधित पहेली है जहां एक प्रभावी तर्क हमेशा लिफाफे स्विच करने के लिए दिया जाता है और तर्क में दोष को बायेसियन दृष्टिकोण लेते हुए और पूर्व से अधिक विश्वासों को जोड़कर देखा जा सकता है। दो लिफाफे की सामग्री।

कुछ अर्थों में, यहाँ वर्णित पहेली बल्कि अलग है। स्पेन्सर का तर्क सही है!


1
ठीक है, अब मैं देखता हूं कि विरोधाभास कहां से आता है। या, विशिष्ट होने के लिए, जहां अतिरिक्त जानकारी सिस्टम में बहती है। जानबूझकर d के वितरण का चयन करके , हम अपने प्राथमिक ज्ञान का उपयोग करते हैं कि, कम या ज्यादा, दोनों लिफाफे में धन की मात्रा कितनी होनी चाहिए। सबसे खराब स्थिति, हमारा ज्ञान बेकार है, लेकिन यह विधि गारंटी देती है कि इसका उपयोग करने पर हम नुकसान में नहीं होंगे।
जनवरी

कुछ विचार के बाद, मुझे अभी भी यह नहीं मिला - EDIT 2 देखें
जनवरी

परिदृश्य (ए) कल्पना कीजिए कि छोटे लिफाफे में और बड़े लिफाफे में 20 हैं । चलो d = 15. P ( x < d ) = P ( x > d ) चुनें । निर्णय नियम आपको सही विकल्प के लिए 100% समय तक ले जाएगा! 1020dP(x<d)=P(x>d)
मैथ्यू गन

अब कुछ परिदृश्य (बी) की जांच करते हैं। कल्पना कीजिए कि छोटे लिफाफे में 1 से 9 तक की विषम संख्या होती है (जैसे 1 या 3 या 5 या 7 या 9) और बड़े लिफाफे में 1 डॉलर अधिक होता है। चुनें और फिर पी ( एक्स < ) = पी ( एक्स > ) । यहाँ हालांकि, आपका रेपिक अगर < 5.5 निर्णय नियम के रूप में सहायक नहीं है! यह सही निर्णय की ओर जाता है यदि x = 1 , 3 , 5 , 6 , 8 , या 10 और गलत निर्णय यदि xd=5.5P(x<d)=P(x>d)<5.5x=1,3,5,6,8,10 । याद रखें कि संभावित जोड़े हैं (1,2), (3, 4), (5, 6), (7, 8) (9, 10) ििि BAYESIAN बात यह है कि यदि आप देखें पैसे की अजीब राशि। x=2,4,7,9
मैथ्यू गुन

हम और y के वितरण को नहीं जानते हैं , इसलिए हम इसे इस तरह से नहीं चुन सकते कि आप इसे प्रस्तावित करें। एक बार जब हमने लिफाफा खोला, हम एक्स जानते हैं , लेकिन हमें यह पता नहीं है कि यह पूर्णांक 1 से 9 तक यादृच्छिक रूप से चुना गया था, और इस प्रकार हम डी को 5.5 नहीं चुन सकते हैं । जैसा कि ऊपर @Glen_b द्वारा उल्लेख किया गया है, को एक गैर-नकारात्मक, निरंतर वितरण से चुना जाना चाहिए। xyxdd
जनवरी

0

मैं इससे सहमत था और एक्सेल में इसके साथ खेलने का व्यावहारिक दृष्टिकोण लिया।

मैंने x, y और d के लिए तीन यादृच्छिक संख्या 1-100 की श्रेणी में उत्पन्न की। मैंने तब d और x और x और y के बीच तुलना की और परिणाम को देखा, सही या गलत।

मैंने ऐसा 500 बार किया और दोहराया कि कई बार और नियमित रूप से 500 में से 330 का सही उत्तर मिला, जैसा कि भविष्यवाणी की गई थी।

मैंने तब d की सीमा 1-10000 तक बढ़ा दी और सही उत्तर 500 रन के लिए लगभग 260 पर आ गया।

तो हाँ, d का चयन x और y के अपेक्षित मूल्यों पर निर्भर है।

बीओबी


0

मुझे लगता है कि समीकरण p + (1-p) / 2 के वैपर विस्तार के साथ स्पष्ट विरोधाभास यह है कि यह मानता है कि (1-p) / 2> 0। D की कई श्रेणियों के लिए यह मान 0 है।

उदाहरण के लिए: खुले लिफाफे में मूल्य पर केंद्रित एक सममित वितरण से चयनित कोई भी डी, गलत 1/2 और सही 1/2 की संभावना देता है।

किसी भी विषम रूप से चुने गए वितरण को गलत तरीके से पसंद करने का पूर्वाग्रह लगता है 1/2 समय।

तो क्या डी के लिए एक सीमा और वितरण चुनने का कोई तरीका है जो यह समीकरण रखता है?

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.