चलो नियमित मोंटी हॉल समस्या के साथ शुरू करते हैं। तीन दरवाजे, जिनमें से एक कार के पीछे है। अन्य दो उनके पीछे बकरियां हैं। आप दरवाजा नंबर 1 चुनते हैं और मोंटी दरवाजा नंबर 2 खोलता है ताकि आपको पता चल सके कि उसके पीछे एक बकरी है। क्या आपको अपना अनुमान दरवाजा संख्या 3 पर स्विच करना चाहिए? (ध्यान दें कि हम प्रत्येक दरवाजे को संदर्भित करने के लिए जिन नंबरों का उपयोग करते हैं, वे यहां कोई मायने नहीं रखते। हम कोई भी आदेश चुन सकते हैं और समस्या समान है, इसलिए चीजों को सरल बनाने के लिए हम इस नंबरिंग का उपयोग कर सकते हैं।)
पाठ्यक्रम का उत्तर हां है, जैसा कि आप पहले से ही जानते हैं, लेकिन आइए गणनाओं के माध्यम से देखें कि वे बाद में कैसे बदलते हैं। बता दें कि C कार के साथ दरवाजे का सूचकांक है और M उस घटना को दर्शाता है जो मोंटी ने खुलासा किया कि दरवाजे 2 में एक बकरी है। हमें p(C=3|M) गणना करने की आवश्यकता है । यदि यह तुलना में बड़ा है 1/2 , हम उस दरवाजे पर हमारे अनुमान स्विच करने के लिए (के बाद से हम केवल दो शेष विकल्प हैं) की जरूरत है। यह संभाव्यता दी गई है:
p(C=3|M)=p(M|C=3)p(M|C=1)+p(M|C=2)+p(M|C=3)
(यह सिर्फCपूर्व एक फ्लैट के साथ Bayes का नियम लागू कर रहाहै।)p(M|C=3)बराबर 1: अगर कार दरवाजा नंबर 3 के पीछे है, तो मोंटी के पास दरवाजा नंबर 2 खोलने के अलावा कोई चारा नहीं था। p(M|C=1)बराबर1/2 : कार के दरवाजे 1 के पीछे है, तो मोंटी उद्घाटन के एक विकल्प या तो शेष दरवाजे में से एक, 2 या 3 थाp(M|C=2) 0 के बराबर होती है, क्योंकि मोंटी कभी नहीं दरवाजा वह जानता है कि है खोलता है गाड़ी। इन नंबरों को भरने से हमें मिलता है:
p(C=3|M)=10.5+0+1=23
कौन सा परिणाम है जिससे हम परिचित हैं।
अब आइए इस मामले पर विचार करें कि मोंटी को इस बात का सही ज्ञान नहीं है कि किस दरवाजे पर कार है। इसलिए, जब वह अपना दरवाजा चुनता है (जिसे हम दरवाजा नंबर 2 के रूप में संदर्भित करेंगे), तो वह गलती से कार के साथ एक का चयन कर सकता है, क्योंकि उसे लगता है कि यह एक बकरी है। चलो C′ दरवाजा मोंटी कि हो सोचता है कि कार है, और जाने p(C′|C) संभावना है कि वह कार सोचता है, इसकी वास्तविक स्थान पर सशर्त एक निश्चित जगह में है हो सकता है। हम मान लेंगे कि यह एक एकल पैरामीटर q द्वारा वर्णित है जो उसकी सटीकता निर्धारित करता है, जैसे कि: p(C′=x|C=x)=q=1−p(C′≠x|C=x) । यदिq 1 के बराबर है, तो मोंटी हमेशा सही होता है। यदिq 0 है, तो मोंटी हमेशा गलत होता है (जो अभी भी जानकारीपूर्ण है)। यदिq है1/3 , मोंटी की जानकारी यादृच्छिक अनुमान लगाने के अलावा कोई बेहतर है।
इस का मतलब है अब हम है:
p(M|C=3)=∑xp(M|C′=x)p(C′=x|C=3)
=p(M|C′=1)p(C′=1|C=3)+p(M|C′=2)p(C′=2|C=3)+p(M|C′=3)p(C′=3|C=3)
=12×12(1−q)+0×12(1−q)+1×q
=14−q4+q=34q+14
यही है, अगर कार सही मायने में दरवाजे 3 के पीछे थी, तो तीन संभावनाएं थीं जो बाहर खेल सकती थीं: (1) मोंटी ने सोचा कि यह 1 से पीछे है, (2) मोंटी ने सोचा 2 या (3) मोंटी ने सोचा 3. आखिरी विकल्प होता है प्रायिकता q (कितनी बार वह इसे सही करता है) के साथ, अन्य दो इस संभावना को विभाजित करते हैं कि वह उनके बीच गलत (1−q) हो जाता है । फिर, प्रत्येक परिदृश्य को देखते हुए, क्या संभावना है कि उसने दरवाजा नंबर 2 को इंगित करने के लिए चुना होगा, जैसा उसने किया था? अगर उसे लगा कि कार 1 से पीछे है, तो संभावना 2 में 1 थी, क्योंकि वह 2 या 3 को चुन सकता था। अगर उसे लगा कि यह 2 से पीछे है, तो उसने कभी भी 2 पर नहीं चुना होगा। अगर उसे लगा कि यह 3 से पीछे है , वह हमेशा 2 चुनता था।
हम इसी तरह शेष संभावनाओं बाहर काम कर सकते हैं:
p(M|C=1)=∑xp(M|C′=x)p(C′=x|C=1)
=12×q+1×12(1−q)
=q2+12−q2=12
p(M|C=2)=∑xp(M|C′=x)p(C′=x|C=2)
=12×12(1−q)+1×12(1−q)
=34−34q
यह सब भरने में, हमें मिलता है:
p(C=3|M)=34q+1412+34−34q+34q+14
=0.75q+0.251.5
एक पवित्रता की जाँच के रूप में, जबq=1, हम देख सकते हैं कि हमें1का मूल उत्तर वापस मिल गया है11.5=23 ।
तो, हमें कब स्विच करना चाहिए? मैं सरलता के लिए मानूंगा कि हमें दरवाजे पर जाने की अनुमति नहीं है मोंटी ने इशारा किया। और वास्तव में, जब तक मोंटी कम से कम कुछ हद तक सही होने की संभावना है (यादृच्छिक अनुमान की तुलना में अधिक), वह जिस दरवाजे की ओर इशारा करता है वह हमेशा दूसरों की तुलना में कार होने की संभावना कम होगी, इसलिए यह एक व्यवहार्य विकल्प नहीं है हमारे लिए वैसे भी। इसलिए हमें केवल दरवाजों 1 और 3 की संभावनाओं पर विचार करना होगा। जबकि यह कार 2 दरवाजे के पीछे होना असंभव था, इस विकल्प में अब गैर-शून्य संभावना है, और इसलिए अब ऐसा नहीं है कि हमें स्विच करना चाहिए जब p(C=3|M)>0.5 , बल्कि हम स्विच कर लेना चाहिए जब p(C=3|M)>p(C=1|M) (जो एक ही चीज़ हुआ करता था)। यह संभाव्यता p ( C = 1 | M ) = 0.5 द्वारा दी गई हैp(C=1|M)=0.51.5=13 , मूल मोंटी हॉल समस्या के रूप में ही। (यह समझ में आता है क्योंकि मोंटी कभी भी दरवाजे 1 की ओर इशारा नहीं कर सकता, इसके बावजूद कि इसके पीछे क्या है, और इसलिए वह उस दरवाजे के बारे में जानकारी नहीं दे सकता। बल्कि, जब उसकी सटीकता 100% से कम हो जाती है, तो प्रभाव यह है कि कुछ संभावना "लीक" की ओर होती है। 2 वास्तव में कार है।) इसलिए, हमेंqको खोजने की आवश्यकता हैजैसे किp(C=3|M)>13 :
0.75q+0.251.5>13
0.75q+0.25>0.5
0.75q>0.25
q>13
इसलिए मूल रूप से, यह पता लगाने का एक बहुत लंबा तरीका था कि, जब तक कार के असली स्थान के बारे में मोंटी का ज्ञान यादृच्छिक अनुमान से बेहतर है, आपको दरवाजे स्विच करना चाहिए (जो वास्तव में स्पष्ट है, जब आप सोचते हैं यह)। हम यह भी गणना कर सकते हैं कितना अधिक संभावना है कि हम जीतने के लिए जब हम स्विच मोंटी की सटीकता के एक समारोह के रूप में, के रूप में यह द्वारा दिया जाता है कर रहे हैं,:
p(C=3|M)p(C=1|M)
=0.75q+0.251.513=1.5q+0.5
(जो, जबq=1, 2 का उत्तर देता है, इस तथ्य से मेल खाता है कि हम मूल मोंटी हॉल समस्या में दरवाजे स्विच करके जीतने की हमारी संभावनाओं को दोगुना करते हैं।)
संपादित करें: लोग उस परिदृश्य के बारे में पूछ रहे थे जहां हमें उस दरवाजे पर स्विच करने की अनुमति दी जाती है जिसे मोंटी इंगित करता है, जो q < 1 होने पर लाभप्रद हो जाता हैq<13 , यानी जब मोंटी एक (कुछ हद तक) विश्वसनीय "झूठा" है। सबसे चरम परिदृश्य में, जबq=0, इसका मतलब यह है कि मोंटी को लगता है कि वास्तव में कार में बकरी है। हालांकि, ध्यान दें कि शेष दो दरवाजे अभी भी एक कार या एक बकरी हो सकते हैं।
दरवाजा 2 पर स्विच करने का लाभ निम्न द्वारा दिया गया है:
p(C=2|M)p(C=1|M)=0.75−0.75q1.513=1.5−1.5q
कौन सा 1 (और इस प्रकार के लायक है कि दरवाजे पर स्विचिंग) अगर तुलना में केवल बड़ा है1.5q<0.5, यानी अगरq<13 , जिसे हमने पहले ही स्थापित किया था, टिपिंग पॉइंट था। दिलचस्प बात यह है दरवाजा 2, का उपयोग करने जा के लिए अधिकतम संभव लाभ जबq=0,, केवल 1.5 है मूल मोंटी हॉल समस्या में अपनी जीत बाधाओं का दोहरीकरण की तुलना में (जबq=1)।
सामान्य समाधान इन दो स्विचिंग रणनीतियों को मिलाकर दिया जाता है: जब q>13 , आप हमेशा दरवाजे 3 पर जाते हैं; अन्यथा, दरवाजा 2 पर स्विच करें।