कृपया विरोधाभास की व्याख्या करें


75

कुछ साल पहले मैंने एक रेडिएशन डिटेक्टर डिजाइन किया था, जो उन्हें गिनने के बजाय घटनाओं के बीच के अंतराल को मापकर काम करता है। मेरी धारणा थी, कि जब गैर-सन्निहित नमूनों को मापा जाता है, तो औसतन मैं वास्तविक अंतराल के आधे हिस्से को मापूंगा। हालाँकि जब मैंने एक अंशांकित स्रोत के साथ सर्किट का परीक्षण किया, तो रीडिंग दो बहुत अधिक का एक कारक था जिसका मतलब था कि मैं पूर्ण अंतराल को माप रहा था।

संभाव्यता और आंकड़ों पर एक पुरानी पुस्तक में मुझे "द वेटिंग पैराडॉक्स" नामक एक चीज़ के बारे में एक अनुभाग मिला। इसने एक उदाहरण प्रस्तुत किया जिसमें प्रत्येक 15 मिनट पर एक बस स्टॉप पर बस आती है और एक यात्री यादृच्छिक पर आता है, यह कहा गया कि यात्री औसतन पूरे 15 मिनट प्रतीक्षा करेगा। मैं उदाहरण के साथ प्रस्तुत किए गए गणित को कभी समझ नहीं पाया हूं और स्पष्टीकरण की तलाश जारी रख रहा हूं। अगर कोई समझा सकता है कि ऐसा क्यों है कि यात्री पूर्ण अंतराल की प्रतीक्षा करता है तो मैं बेहतर सोऊंगा।


1
शीर्षक क्या है और पुस्तक का लेखक कौन है? क्या आप यहाँ शब्द के लिए उदाहरण शब्द की नकल कर सकते हैं?
जोएल रेयेस नोशे

यह मेरी विशेषता नहीं है, लेकिन क्या ओपी द्वारा उल्लेखित विरोधाभास के समान विरोधाभास है ?
जोएल रेयेस नोचे

1
संबंधित पोस्ट: math.stackexchange.com/questions/222674/…
ddiez

1
ऐसा लगता है कि ऊपर मेरे अनुमान का कुछ समर्थन है। इस उत्तर के लिए एक टिप्पणी में निरीक्षण विरोधाभास का उल्लेख है।
जोएल रेयेस नोचे

2
मुझे लगता है कि सादृश्य के रूप में एक बस का उपयोग करना भ्रामक है, क्योंकि बूस शेड्यूल का पालन करते हैं। इसके बजाय सोचें कि एक खाली टैक्सी को आने में कितना समय लगेगा जब हर 15 मिनट में औसतन एक आती है।
हार्वे मोटुलस्की 21

जवाबों:


48

जैसा कि ग्लेन_ब ने बताया, यदि बसें बिना किसी अनिश्चितता के हर मिनट में आती हैं , तो हम जानते हैं कि अधिकतम संभव प्रतीक्षा समय 15 मिनट है। यदि हमारे हिस्से से हम "यादृच्छिक पर" आते हैं, तो हमें लगता है कि "औसतन" हम अधिकतम संभव प्रतीक्षा समय का आधा इंतजार करेंगे । और अधिकतम संभव प्रतीक्षा समय यहां दो लगातार आगमन के बीच अधिकतम संभव लंबाई के बराबर है। हमारे प्रतीक्षा समय को निरूपित करें W और लगातार दो बसों के बीच अधिकतम लंबाई R , और हम तर्क देते हैं1515WR

(1)E(W)=12R=152=7.5

और हम सही हैं।

लेकिन अचानक निश्चितता हमसे छीन ली जाती है और हमें बताया जाता है कि मिनट अब दो बसों के बीच की औसत लंबाई है। और हम "सहज सोच जाल" में गिर जाते हैं और सोचते हैं: "हमें केवल आर को उसके अपेक्षित मूल्य के साथ बदलने की आवश्यकता है ", और हम तर्क देते हैं15R

(2)E(W)=12E(R)=152=7.5WRONG

एक पहला संकेत है कि हम गलत कर रहे हैं, वह यह है कि है नहीं "किसी भी लगातार दो बस-आगमन के बीच की लंबाई", यह "है अधिकतम लंबाई आदि"। तो किसी भी मामले में, हम उस राशि ( आर ) 15RE(R)15

हम समीकरण में कैसे पहुंचे ? हमने सोचा: "प्रतीक्षा समय 0 से 15 अधिकतम तक हो सकता है । मैं किसी भी उदाहरण पर समान संभावना के साथ पहुंचता हूं, इसलिए मैं यादृच्छिक रूप से" समान रूप से "चुनता हूं और समान संभाव्यता के साथ सभी संभावित प्रतीक्षा समय हैं। इसलिए लगातार दो बसों के बीच की अधिकतम लंबाई मेरी है।" औसत प्रतीक्षा समय ”। और हम सही हैं।(1)015

लेकिन गलती से मूल्य को समीकरण ( 2 ) में डालकर , यह अब हमारे व्यवहार को नहीं दर्शाता है। ( आर ) के स्थान पर 15 के साथ , समीकरण ( 2 ) कहता है "मैं यादृच्छिक रूप से चुनता हूं और समान संभावना के साथ सभी संभावित प्रतीक्षा समय जो दो लगातार बस-आगमनों के बीच औसत लंबाई के बराबर या बराबर हैं " -और यहां वह जगह है जहां हमारा सहज ज्ञान युक्त है गलती निहित है, क्योंकि, हमारा व्यवहार नहीं बदला है - इसलिए, बेतरतीब ढंग से समान रूप से पहुंचने से, हम वास्तव में अभी भी "बेतरतीब ढंग से और समान संभावना के साथ चुनते हैं" सभी संभावित प्रतीक्षा समय - लेकिन "सभी संभावित प्रतीक्षा समय" द्वारा कब्जा नहीं किया जाता है15(2)15(आर)(2) - हम लगातार दो बस-आगमनों के बीच लंबाई के वितरण की सही पूंछ भूल गए हैं। 15

तो शायद, हमें किसी भी लगातार दो बसों के बीच अधिकतम लंबाई के अपेक्षित मूल्य की गणना करनी चाहिए, क्या यह सही समाधान है?

हां यह हो सकता है, लेकिन : विशिष्ट "विरोधाभास" एक विशिष्ट स्टोचस्टिक धारणा के साथ हाथ से हाथ जाता है: बस-आगमन बेंचमार्क पॉइसन प्रक्रिया द्वारा मॉडलिंग की जाती है, जिसका अर्थ है कि परिणाम के रूप में हम जानते हैं कि समय-लंबाई किसी भी दो लगातार बस-आगमन एक घातांक वितरण का अनुसरण करते हैं। निरूपित कि लंबाई, और हम उस राशि

()=λ-λ,λ=1/15,()=15

यह निश्चित रूप से अनुमानित है, क्योंकि घातीय वितरण को सही से समर्थन नहीं मिला है, जिसका अर्थ है कि सख्ती से "सभी संभव प्रतीक्षा समय" शामिल हैं, इस मॉडलिंग धारणा के तहत, बड़े और बड़े परिमाण तक और "अनन्तता सहित" शामिल हैं, लेकिन लुप्त होने की संभावना के साथ ।

लेकिन रुकिए, एक्सपोनेंशियल मेमोरीलेस है : कोई भी बात नहीं है कि हम किस समय पर पहुंचेंगे, हम एक ही यादृच्छिक चर का सामना करते हैं , चाहे जो भी पहले चला गया हो।

इस रूढ़िवादी / वितरण संबंधी धारणा को देखते हुए , किसी भी समय "दो लगातार बस-आगमनों के बीच अंतराल" का हिस्सा होता है, जिसकी लंबाई समान मूल्य (अधिकतम मूल्य नहीं) के साथ समान संभावना वितरण द्वारा वर्णित है : "मैं यहां हूं, मैं हूं दो बस-आवक के बीच एक अंतराल से घिरा हुआ है। इसकी कुछ लंबाई अतीत में है और कुछ भविष्य में है, लेकिन मेरे पास यह जानने का कोई तरीका नहीं है कि कितना और कितना है, इसलिए सबसे अच्छा मैं यह पूछ सकता हूं कि इसकी अपेक्षित लंबाई क्या है - मेरा औसत प्रतीक्षा समय क्या होगा? ” - और जवाब हमेशा " 15 " है, अफसोस। 1515


+1 बहुत अच्छा। हो सकता है पढ़ना चाहिए λ ( ) ? ()λ()
अमीबा

धन्यवाद। अंकन के लिए, दोनों का उपयोग विभिन्न चीजों को इंगित करने के लिए किया जाता है। मैंने जो लिखा है, वह तनाव की तर्ज पर है जिसका यादृच्छिक परिवर्तनीय घनत्व है, क्योंकि विभिन्न परिवर्तनों में हम जैसी किसी चीज के साथ समाप्त हो सकते हैं । आप जो सुझाव देते हैं, वह घनत्व के पैराट्राइज्ड पहलू पर जोर देता है। एक्स(y)
एलेकोस पापाडोपोलोस

80

यदि बस "प्रत्येक 15 मिनट" (यानी एक शेड्यूल पर) आती है तो (बेतरतीब ढंग से आने वाले) यात्री का औसत इंतजार वास्तव में केवल 7.5 मिनट है, क्योंकि यह समान रूप से उस 15 मिनट के अंतराल में वितरित किया जाएगा।

-

यदि, दूसरी ओर, बस 4 प्रति घंटे की औसत दर (यानी एक पॉइसन प्रक्रिया के अनुसार) में बेतरतीब ढंग से आती है , तो औसत प्रतीक्षा बहुत लंबी है; वास्तव में आप इसे स्मृति संपत्ति की कमी के माध्यम से बाहर काम कर सकते हैं। शुरुआत के रूप में यात्री के आगमन को ले लो, और अगली घटना का समय औसत 15 मिनट के साथ घातांक है।

मुझे एक असतत समय सादृश्य लेने दें। कल्पना करें कि मैं 15 चेहरों के साथ एक डाई को रोल कर रहा हूं, जिनमें से एक को "बी" (बस के लिए) लेबल दिया गया है और 14 को "एक्स" बस की कुल अनुपस्थिति के लिए उस मिनट (निष्पक्ष 30 पक्षीय पासा) मौजूद है, इसलिए मैं 2 लेबल लगा सकता हूं 30-पक्षीय डाई "बी" के चेहरे)। इसलिए प्रति मिनट एक बार मैं रोल करता हूं और देखता हूं कि क्या बस आती है। मरने की कोई स्मृति नहीं है; यह नहीं जानता कि पिछले "बी" के बाद से कितने रोल हैं। अब कल्पना कीजिए कि कुछ असंबद्ध घटना घटती है - एक कुत्ता भौंकता है, एक यात्री आता है, मुझे गड़गड़ाहट की आवाज़ सुनाई देती है। अब से, मैं अगले "बी" तक कितने समय तक प्रतीक्षा (कितने रोल) करूं?

स्मृति की कमी के कारण, औसतन, मैं अगले "बी" के लिए उसी समय की प्रतीक्षा करता हूं जब दो लगातार "बी" के बीच का समय होता है।

[अगली कल्पना करें कि मेरे पास एक 60-पक्षीय मृत्यु है मैं हर पंद्रह सेकंड (फिर से, एक "बी" चेहरे) के साथ रोल करता हूं; अब कल्पना कीजिए कि मैं एक 1000-पक्षीय मर गया था, मैंने प्रत्येक 0.9 सेकंड (एक "बी" चेहरे के साथ, या अधिक यथार्थवादी रूप से, तीन 10-पक्षीय पासा प्रत्येक को लुढ़काया और मैं परिणाम को "बी" कहता हूं यदि सभी 3 "10" पर आते हैं। उसी समय) ... और इसी तरह। सीमा में, हमें निरंतर समय पोइसन प्रक्रिया मिलती है।]

टीटी

बसों के एक अनुभवी पकड़ने वाले के रूप में, वास्तविकता में 'बसें एक समय पर पहुंचें' और 'बसें यादृच्छिक पर पहुंचती हैं' के बीच कहीं झूठ लगती हैं। और कभी-कभी (खराब ट्रैफ़िक में), आप एक घंटे इंतजार करते हैं फिर 3 एक ही बार में पहुंचते हैं (Zach नीचे दिए गए टिप्पणियों में उसके कारण की पहचान करता है)।


6
मुझे लगता है कि विशेष रूप से एक अतिरिक्त प्रक्रिया होती है, जहां एक देर से बस बाद में यात्रियों के लिए क्राम बन जाती है, और इसके पीछे की खाली बस अंततः पकड़ लेती है (लेकिन खाली रहती है)। = D
Zach

4
@Zach वास्तव में, यही कारण है कि वे लंबे समय तक रन बनाते हैं, खासकर भारी यातायात में। जहां मैं रहता हूं, जब बस इतनी देर से चलती है तो अगले एक के लिए समय होता है, वे कभी-कभी एक अतिरिक्त बस डालते हैं जो मार्ग पर समय से लगभग आगे है (यानी यह उन यात्रियों के साथ ड्राइव करेगा जहां बस बहुत पीछे नहीं होगी अनुसूची, अक्सर एक तेज मार्ग के माध्यम से वहां पहुंच रही है) और उन यात्रियों को चुनना शुरू कर देता है जिनके लिए अब बस थोड़ी ही देर है। इस बीच, बहुत देर से बस अब शेड्यूल में अगली बस प्रभावी रूप से बन जाती है , एक बार जब यह दूसरी बस में आ जाती है, तो
ग्लेन_ब

@Glen_b यह एक बहुत अच्छा विचार है, हाह!
Zach

यह एक उपयोगी एंटी-क्लंपिंग रणनीति है (कम से कम, यह सबसे खराब मामलों को कम करता है); मैं इसे नहीं लाया होगा, सिवाय इसके कि यह निर्भरता के मुद्दों से संबंधित है जिससे अधिक सटीक बस-प्रतीक्षा-समय के मॉडल से निपटने की आवश्यकता हो सकती है।
Glen_b

10

बसों पर अधिक ... चर्चा में इतनी देर में बट करने के लिए क्षमा करें, लेकिन मैं हाल ही में पॉइसन प्रक्रियाओं को देख रहा हूं ... इसलिए इससे पहले कि यह मेरे दिमाग से बाहर निकल जाए, यहां निरीक्षण विरोधाभास का एक चित्रात्मक प्रतिनिधित्व है :

λθ=1/λ=15

यदि हम एक प्रेषण केंद्र में थे, और सभी बसों को एक स्क्रीन पर देख सकते हैं, तो यह सच होगा कि बेतरतीब ढंग से कई बसें उठा रही हैं, और पीछे चलने वाली बस की दूरी औसतन, औसत अंतर-आगमन समय का उत्पादन करेगी:

यहाँ छवि विवरण दर्ज करें

लेकिन, अगर हम इसके बजाय बस स्टेशन पर दिखाते हैं (बस का चयन करने के बजाय), हम एक यादृच्छिक क्रॉस-सेक्शन कर रहे हैं, कहते हैं, बस सुबह के समय के साथ एक ठेठ सुबह में। जिस समय हम बस स्टेशन पर दिखाने का निर्णय लेते हैं, समय के "तीर" के साथ समान रूप से वितरित किया जा सकता है। हालांकि, चूंकि बसों के बीच लंबे समय तक अंतराल रहता है, इसलिए वे अधिक दूर तक फैलती हैं, हम इन "स्ट्रैगलर्स" को ओवरसैंपलिंग समाप्त करने की अधिक संभावना रखते हैं:

यहाँ छवि विवरण दर्ज करें

... और इसलिए, हमारी प्रतीक्षा समय लॉग बुक अंतर-आगमन समय को प्रतिबिंबित नहीं करेगी। यह निरीक्षण विरोधाभास है।

15'θ=15

[समय प्रतीक्षा (भविष्य) + अंतिम बस प्रस्थान का समय (अतीत)]=30


यहाँ छवि विवरण दर्ज करें


फिर भी अस्पष्ट है? - इसे लेगोस के साथ आज़माएं ।


बहुत बढ़िया चित्र।
Glen_b

2

एक सरल व्याख्या है, जो विभिन्न उत्तरों को हल करती है, जो कि एक पोइसन प्रक्रिया के अनुसार आने वाले प्रतीक्षा समय के अंतरगत समय (इस मामले में 15 मिनट) के साथ आने वाली बसों के लिए अपेक्षित प्रतीक्षा समय की गणना से प्राप्त होता है, जिनके अंतरंग समय इसलिए 15 मिनट के औसत के साथ iid घातीय हैं ।

विधि 1 ) क्योंकि पॉइसन प्रक्रिया (घातांक) मेमोरी रहित है, अपेक्षित प्रतीक्षा समय 15 मिनट है।

विधि 2 ) आप जिस अवधि में पहुंचते हैं, उस दौरान आप किसी भी समय पहुंचने की उतनी ही संभावना रखते हैं। इसलिए अपेक्षित प्रतीक्षा समय इस अंतर अवधि की अपेक्षित लंबाई का 1/2 है। यह सही है, और विधि (1) के साथ संघर्ष नहीं करता है।

कैसे (1) और (2) दोनों सही हो सकते हैं? इसका उत्तर यह है कि जिस समय पर आप आते हैं, उस समय के लिए अंतर अवधि की अपेक्षित अवधि 15 मिनट नहीं है। यह वास्तव में 30 मिनट है; और ३० मिनट का १/२ १५ मिनट का होता है, इसलिए (१) और (२) सहमत होते हैं।

जिस समय आप 15 मिनट के बराबर नहीं पहुंचते हैं, उस समय के लिए अंतरंग अवधि क्यों होती है? ऐसा इसलिए है क्योंकि पहले आगमन के समय को "फिक्सिंग" करके, यह जिस अंतरंग अवधि में होता है वह औसत से अधिक लंबी अंतर अवधि होने की संभावना है। एक्सपोनेंशियल इंटररिशियल पीरियड के मामले में, गणित बाहरी काम करता है इसलिए इंटररिशियल पीरियड जिसमें आप आते हैं, पॉसन प्रोसेस के लिए माध्य इंटररिशियल समय के साथ डबल एक्सपोनेंशियल है।

यह स्पष्ट नहीं है कि आप जिस समय पर पहुंचते हैं, उस समय के बीच के अंतरिम समय के लिए सटीक वितरण दोगुना मतलब के साथ एक घातांक होगा, लेकिन यह स्पष्ट है, स्पष्टीकरण के बाद, इसे क्यों बढ़ाया जाता है। उदाहरण को समझने में आसान के रूप में, मान लें कि इंटररिशियल समय संभावना के साथ 10 मिनट 1/2 या 20 मिनट संभावना 1/2 के साथ है। इस मामले में, 20 मिनट लंबी अंतरंग अवधि समान रूप से 10 मिनट लंबी अंतरजातीय अवधि होने की संभावना है, लेकिन जब वे होते हैं, तो वे दो बार लंबे समय तक रहते हैं। तो, दिन के दौरान समय के 2/3 अंक उस समय पर होंगे, जब अंतर अवधि 20 मिनट हो। एक और तरीका रखो, अगर हम पहली बार एक समय लेते हैं और फिर जानना चाहते हैं कि उस समय के साथ अंतरंग समय क्या है, तो "दिन" की शुरुआत में क्षणिक प्रभावों की अनदेखी करना ) उस अंतर्जातीय समय की अपेक्षित लंबाई १६ १/३ है। लेकिन अगर हम पहली बार इंटरफेरिंग टाइम चुनते हैं और जानना चाहते हैं कि इसकी अपेक्षित लंबाई क्या है, तो यह 15 मिनट है।

नवीकरण विरोधाभास के अन्य रूप हैं, लंबाई-पक्षपाती नमूनाकरण, आदि, बहुत अधिक एक ही चीज की राशि।

उदाहरण 1) आपके पास प्रकाश बल्बों का एक गुच्छा है, यादृच्छिक जीवनकाल के साथ, लेकिन औसतन 1000 घंटे। जब एक प्रकाश बल्ब विफल हो जाता है, तो इसे तुरंत दूसरे प्रकाश बल्ब से बदल दिया जाता है। यदि आप प्रकाश बल्ब वाले कमरे में जाने के लिए समय लेते हैं, तो प्रकाश बल्ब संचालन में है और फिर 1000 घंटे से अधिक लंबे जीवनकाल के लिए हवा देगा।

उदाहरण 2) यदि हम किसी निश्चित समय में किसी निर्माण स्थल पर जाते हैं, तो उस समय तक काम करने वाला निर्माणकर्ता जो उस समय वहां काम कर रहा है, इमारत से गिर जाता है (जब से उन्होंने पहली बार काम करना शुरू किया है) तब तक काम करने वाले समय से अधिक हो जाता है। काम शुरू करने वाले सभी श्रमिकों में से गिर जाता है (जब उन्होंने पहली बार काम करना शुरू किया था)। क्यों, क्योंकि गिरने के समय तक कम औसत समय वाले कर्मचारी पहले से ही गिरने (और लगातार काम नहीं करने) की तुलना में औसत से अधिक होने की संभावना रखते हैं, ताकि जो कर्मचारी काम कर रहे हैं उनके गिरने तक औसत समय से अधिक समय हो।

उदाहरण 3) किसी शहर में रैंडम नंबर पर कुछ मामूली लोगों को चुनें और अगर वे शहर की मेजर लीग बेसबॉल टीम के घरेलू खेलों (सभी बिकने वाले बाहरी) में शामिल नहीं हुए हैं, तो पता करें कि वे कितने लोगों के खेल में शामिल हुए थे। तब (कुछ थोड़े आदर्श के तहत लेकिन बहुत अधिक अनुचित धारणाएं नहीं), उन खेलों के लिए औसत उपस्थिति सभी टीम के घरेलू खेलों के लिए औसत उपस्थिति से अधिक होगी। क्यों? क्योंकि कम उपस्थिति वाले खेलों की तुलना में अधिक उपस्थिति वाले खेलों में अधिक लोग शामिल होते हैं, इसलिए आप उन लोगों को चुनने की अधिक संभावना रखते हैं, जिन्होंने कम उपस्थिति वाले खेलों की तुलना में उच्च उपस्थिति वाले खेलों में भाग लिया हो।


0

सवाल यह था कि "एक बस हर 15 मिनट पर बस स्टॉप पर आती है और एक यात्री बेतरतीब ढंग से आता है।" यदि बस हर 15 मिनट में आती है, तो इसकी यादृच्छिकता नहीं है; यह हर 15 मिनट में आता है इसलिए सही उत्तर 7.5 मिनट है। या तो स्रोत को गलत तरीके से उद्धृत किया गया था या स्रोत के लेखक को मैला था।

दूसरी ओर, विकिरण डिटेक्टर एक अलग समस्या की तरह लगता है क्योंकि विकिरण की घटनाएं कुछ वितरण के अनुसार यादृच्छिक रूप से आती हैं, संभवतः औसत प्रतीक्षा समय के साथ पॉइसन जैसा कुछ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.