विमान दुर्घटनाओं का एक समूह कितना अजीब है?


15

मूल प्रश्न (ation/२५/१४): क्या समाचार माध्यमों के इस उद्धरण से समझ में आता है, या हाल ही में हुए विमान दुर्घटनाओं के मद्देनजर देखने का एक बेहतर सांख्यिकीय तरीका है?

हालांकि, बार्नेट पोइसन वितरण के सिद्धांत पर भी ध्यान आकर्षित करते हैं, जिसका अर्थ है कि क्रैश के बीच छोटे अंतराल वास्तव में लंबे लोगों की तुलना में अधिक संभावित हैं।

"मान लीजिए कि प्रति वर्ष औसतन एक घातक दुर्घटना होती है, जिसका अर्थ है कि किसी भी दिन दुर्घटना होने की संभावना 365 में एक है।" "यदि 1 अगस्त को कोई दुर्घटना होती है, तो अगली दुर्घटना 2 अगस्त को एक दिन बाद होती है, जो 1/365 है। लेकिन अगली दुर्घटना 3 अगस्त को होने की संभावना है (364/365) x (1/365) , क्योंकि अगली दुर्घटना 3 अगस्त को ही होती है अगर 2 अगस्त को कोई दुर्घटना न हो। "

"यह प्रतिवादपूर्ण लगता है, लेकिन निष्कर्ष संभावना के नियमों से लगातार चलता है," बार्नेट कहते हैं।

स्रोत: http://www.bbc.com/news/magazine-28481060

स्पष्टता (intuitive/२27/१४): क्या काउंटर सहज (मेरे लिए) कह रहा है कि दुर्लभ घटनाएं समय के करीब होती हैं। सहज रूप से, मुझे लगता है कि दुर्लभ घटनाएं समय के करीब नहीं होंगी। क्या कोई मुझे पॉइज़न वितरण की मान्यताओं के तहत घटनाओं के बीच के समय के सैद्धांतिक या आनुभविक वितरण की ओर संकेत कर सकता है? (यह है, एक हिस्टोग्राम जहां y- अक्ष आवृत्ति या प्रायिकता है और x- अक्ष 2 लगातार घटनाओं के बीच का दिन, सप्ताह, महीने, या वर्ष या इस तरह के समूह में होता है।) धन्यवाद।

स्पष्टता (7/28/14): शीर्षक का तात्पर्य यह है कि व्यापक रूप से फैली दुर्घटनाओं की तुलना में दुर्घटनाओं के समूह होने की अधिक संभावना है। चलो परिचालन करते हैं। मान लीजिए कि एक क्लस्टर 3 हवाई जहाज दुर्घटनाएं हैं, और समय की एक छोटी अवधि 3 महीने है और लंबी अवधि 3 साल है। यह सोचना अतार्किक लगता है कि इस बात की अधिक संभावना है कि 3 दुर्घटनाएं 3 महीने की अवधि में 3 साल की अवधि के भीतर होंगी। यहां तक ​​कि अगर हम पहले दुर्घटना को एक दिए गए रूप में लेते हैं, तो यह सोचना भी अतार्किक है कि अगले 3 महीनों के भीतर 2 और दुर्घटनाएं हो जाएंगी। अगर यह सच है, तो समाचार मीडिया की हेडलाइन भ्रामक और गलत है। क्या मैं कुछ भूल रहा हूँ?


1
पुन स्पष्टीकरण: आप इसे उपयोगी बीच अंतर करने में मिल सकती है संभावना , प्रति इकाई समय संभावना है, और उम्मीद । हालांकि दुर्लभ घटनाओं का वर्णन करने वाली प्रक्रियाएं - व्यावहारिक रूप से "दुर्लभ" के बहुत अर्थ से - घटनाओं के बीच एक लंबे समय से अपेक्षित समय होता है, जो कि प्रति यूनिट समय में सबसे बड़ी होने की संभावना के साथ असंगत नहीं है । फिर भी, थोड़े समय के भीतर होने वाली घटना की संभावना बहुत कम होगी।
whuber

2
इसके अलावा, मैंने अभी इस विकिपीडिया लेख पर ध्यान दिया है - आप इसे पसंद कर सकते हैं। ओह, और मैं अभी भी इस पीडीएफ में आया था , यह भी - इसमें विशेष रूप से हवाई जहाज दुर्घटनाओं की "क्लस्टरिंग" का उल्लेख है (और अब तक मेरे पास इस मुद्दे को बहुत बेहतर बताता है ...)।
स्टीव एस।

1
@ गेलन_ बी: अखबार के लेख में दोष (लेख के शीर्षक में निहित है, जो कि मेरी पोस्टिंग का शीर्षक है) यह है कि लेख से पता चलता है कि किसी दुर्घटना की दी गई संख्या (अर्थात, क्लस्टर) की अधिक संभावना है। समय की एक लंबी अवधि की तुलना में समय की एक छोटी अवधि। यह सिर्फ गलत है।
जोएल डब्ल्यू।

1
@JoelW: यदि कुछ भी हो, तो वह पत्रकार होगा जो खराब हो गया है ... वैसे भी, क्या सब कुछ साफ हो गया है या क्या आपके पास अभी भी कोई आरक्षण बचा है?
स्टीव एस।

1
मेरा अनुमान है कि यह पत्रकार को गुमराह करने वाला सांख्यिकीविद् था। मुझे संदेह है कि पत्रकार को अपने दम पर यह गलत लगा (क्योंकि यह इतना सहज है)।
जोएल डब्ल्यू।

जवाबों:


3

सारांश: उद्धृत बीबीसी पैराग्राफ में पहला वाक्य फूहड़ और भ्रामक है।

हालांकि पिछले उत्तरों और टिप्पणियों ने पहले से ही एक उत्कृष्ट चर्चा प्रदान की है, मुझे लगता है कि मुख्य प्रश्न का संतोषजनक जवाब नहीं दिया गया है।

इसलिए हमें लगता है कि किसी भी दिन एक विमान दुर्घटना की सम्भावना है चलो और कहा कि दुर्घटनाओं-दूसरे से अलग कर रहे हैं। आइए हम यह मान लें कि 1 जनवरी को एक विमान दुर्घटनाग्रस्त हो गया था। अगला विमान दुर्घटना कब होगा?p=1/365

ठीक है, हम एक सरल अनुकरण करते हैं: अगले तीन वर्षों के लिए प्रत्येक दिन के लिए मैं यादृच्छिक रूप से यह तय करूंगा कि क्या एक और विमान प्रायिकता साथ दुर्घटनाग्रस्त हो गया और अगले दुर्घटना के दिन को ध्यान दें; मैं इस प्रक्रिया को 100 दोहराऊंगाp बार। यहाँ परिणामी हिस्टोग्राम है:100000

प्लेन क्रश का वितरण, एक मॉडल

वास्तव में, संभाव्यता वितरण केवल द्वारा दिया जाता है , जहाँ t दिनों की संख्या है। मैंने इस सैद्धांतिक वितरण को एक लाल रेखा के रूप में प्लॉट किया, और आप देख सकते हैं कि यह मोंटे कार्लो हिस्टोग्राम के लिए अच्छी तरह से फिट बैठता है। टिप्पणी: यदि समय छोटे और छोटे डिब्बे में विवेकाधीन था, तो यह वितरण एक घातीय में परिवर्तित हो जाएगा; लेकिन यह वास्तव में इस चर्चा के लिए मायने नहीं रखता है।Pr(t)=(1p)tpt

जैसा कि कई लोग पहले ही यहां टिप्पणी कर चुके हैं, यह घटता घटता है। इसका मतलब यह है कि अगले दिन, 2 जनवरी को अगले विमान के दुर्घटनाग्रस्त होने की संभावना, इस संभावना से अधिक है कि अगला विमान किसी अन्य दिन दुर्घटनाग्रस्त हो जाएगा, उदाहरण के लिए अगले साल 2 जनवरी को (अंतर लगभग तीन गुना है: और 0.10 % )।0.27%0.10%

हालांकि , यदि आप पूछते हैं कि अगले तीन दिनों में अगला विमान दुर्घटनाग्रस्त होने की संभावना क्या है, तो उत्तर , लेकिन यदि आप पूछते हैं कि क्या संभावना है कि यह तीन दिनों के बाद दुर्घटनाग्रस्त हो जाएगा, लेकिन अगले तीन वर्षों में, तब जवाब 94 % है । तो, जाहिर है, यह अधिक संभावना है कि यह अगले तीन वर्षों में (अगले तीन दिनों के बाद) दुर्घटनाग्रस्त हो जाएगा। भ्रम की स्थिति इसलिए पैदा होती है क्योंकि जब आप "क्लस्टर किए गए ईवेंट" कहते हैं, तो आप वितरण के एक बहुत छोटे प्रारंभिक भाग को संदर्भित करते हैं, लेकिन जब आप "व्यापक रूप से फैलने वाली" घटनाओं को कहते हैं तो आप इसका एक बड़ा हिस्सा देखते हैं।0.8%94% यही कारण है कि एक नीरसता से कम संभावना वाले वितरण के साथ भी यह निश्चित रूप से संभव है कि "क्लस्टर" (उदाहरण के लिए तीन दिनों में दो विमान दुर्घटनाएं) बहुत संभावना नहीं हैं।

यहाँ वास्तव में इस बिंदु को प्राप्त करने के लिए एक और हिस्टोग्राम है। यह कई गैर-प्रतिच्छेदन समय अवधि में पिछले हिस्टोग्राम का योग है:

प्लेन का हिस्टोग्राम क्रश फ्रीक्वेंसी करता है


क्या आप कह रहे हैं कि MIT के प्रोफेसर गलत हैं?
स्टीव एस

1
नहीं, बीबीसी के लेख में बार्नेट का उद्धरण पूरी तरह से सही है। लेकिन बीबीसी रिपोर्टर द्वारा इसकी व्याख्या सबसे अच्छी है: "बार्नेट भी पॉइसन वितरण के सिद्धांत पर ध्यान आकर्षित करते हैं, जिसका अर्थ है कि क्रैश के बीच छोटे अंतराल वास्तव में लंबे लोगों की तुलना में अधिक संभावित हैं" । इस वाक्य की सबसे स्वाभाविक व्याख्या गलत है (और मुझे लगता है कि बार्नेट का यह अर्थ नहीं था कि)। शायद मुझे अपने उत्तर में इस बारे में अधिक स्पष्ट होना चाहिए। क्या मेरे उत्तर का कोई महत्वपूर्ण हिस्सा है जिससे आप असहमत हैं? आशा है कि नहीं, मैं पूरी तरह से आपके साथ सहमत हूँ।
अमीबा ने कहा कि मोनिका

13

रिपोर्टर क्या कह रहा है कि एक विमान दुर्घटना की यादृच्छिक घटना को एक पॉइसन प्रक्रिया के रूप में तैयार किया जा सकता है - एक स्थिति जहां कुछ (छोटे) अंतराल पर होने वाली घटना की संभावना उक्त अंतराल की लंबाई के लिए आनुपातिक है और जहां यह घटना होती है। अन्य सभी में स्वतंत्र

क्या यह वर्णित परिदृश्य के लिए एक उचित मॉडल है?

शायद।

निश्चित रूप से, ये घटनाएँ 100% स्वतंत्र नहीं हो सकती हैं क्योंकि अन्य पायलटों के दुर्घटना के बाद उनके व्यवहार (यदि केवल थोड़ा बहुत) की संभावना होती है। [मुझे नहीं पता - शायद कुछ पायलट सिम्युलेटर प्रशिक्षण के कुछ अतिरिक्त बिट या ऐसा कुछ करते हैं]। फिर भी, स्वतंत्रता की धारणा अभी भी पूरी तरह से उचित है।

विमान दुर्घटनाओं के समूहों के बारे में क्या?

हाँ। एक पॉइसन प्रक्रिया (या कुछ अन्य यादृच्छिक प्रक्रिया) को देखते हुए , आप घटनाओं के कुछ समूहों को देखने की उम्मीद करेंगे

वास्तव में, जैसा कि ऑक्सफोर्ड डिक्शनरी ऑफ स्टैटिस्टिक्स ने पॉइसन प्रोसेस के लिए अपनी प्रविष्टि में वर्णित किया है (जो कि "यादृच्छिकता का गणितीय वर्णन" है):

[R]andomness usually gives rise to apparent clustering, despite the natural
expectation that randomness would lead to regularity.

उदाहरण के लिए, आर कोड के इस सरल बिट को देखें :

set.seed(123)
x <- runif(500)
y <- runif(500)

plot(x, y, pch=20, col='blue', main="A Random Distribution of Points")

जो पैदा करता है:
क्लंपिंग नोटिस?

भले ही हम जानते हैं कि यह यादृच्छिक बिंदुओं का एक कथानक है, यह इस तरह दिखता है कि इसमें कुछ गैर- आयामी बिट्स हैं - विशेष रूप से, ग्राफ़ के कुछ हिस्सों में बिंदुओं के समूह होते हैं जबकि अन्य भाग खुले होते हैं। यह उसी तरह का व्यवहार है जिसे लेख वर्णन करने की कोशिश कर रहा है (केवल समय श्रृंखला डेटा और स्थानिक डेटा नहीं )।


अपडेट करें:

@JoelW .: तो, उदाहरण के लिए, मान लें कि कल (या उस दिन के लिए किसी भी दिन) दुर्घटनाग्रस्त होने वाले विमान की संभावना " पी " है (और, मान लीजिए कि " पी " एक सौ में 1 जैसा कुछ है)।

अगला विमान दुर्घटना कल होने की संभावना अधिक होने के कारण इसके ठीक एक वर्ष (यानी 26 जुलाई, 2015 को ) होने की अधिक संभावना है, क्योंकि अगले दुर्घटना के ठीक एक वर्ष में होने की संभावना बराबर है:

= Prob(crash tomorrow) * Prob(365 days with *no* crashes)

सही बात?

अंततः, मुझे लगता है कि इन बातों का कारण काउंटर-इन्टुएटिव है क्योंकि आमतौर पर जब हम किसी वाक्यांश के बारे में सोचते हैं जैसे "The odds of a plane crash in one month compared with the odds of one happening tomorrow":। हम स्वाभाविक रूप से तुरंत 24 महीने की अवधि पर विचार नहीं करते हैं जो ठीक एक महीने में शुरू होता है। इसके बजाय, हम (या कम से कम मैं करते हैं) इसके बारे में अधिक, अच्छी तरह से, लचीले ढंग से सोचने की प्रवृत्ति रखते हैं । तो और अधिक पसंद है a month ± a week:। यह और तथ्य यह है कि हम भूल जाते हैं एक अंतर में दुर्घटना की संभावना को ध्यान में नहीं रखते हैं ... (लेकिन फिर से, शायद यह सिर्फ मेरे लिए है ...)।

ओह!


अतिरिक्त संसाधन:

  • क्लस्टरिंग इल्यूजन पर विकिपीडिया का लेख
  • एक पीडीएफ जो विशेष रूप से विमान दुर्घटनाओं (पृष्ठ 8 पर) की "क्लस्टरिंग" का उल्लेख करता है और एक पॉइसन प्रक्रिया के गणित का संक्षेप में वर्णन करता है

1
@ जॉयल डब्ल्यू .: वास्तव में, मुझे इस उत्तर में और जोड़ना चाहिए - मुझे कुछ मिनट संपादित करने के लिए दें ...
स्टीव एस

7
यात्रा में देरी के लिए तर्क वही है जो पुराने मजाक में दिखाई दे रहा है कि कैसे टीएसए ने एक हवाई जहाज में बम के साथ एक सांख्यिकीविद् पाया। जब खुद को समझाने के लिए कहा गया, तो सांख्यिकीविद् ने कहा "ठीक है, एक व्यक्ति के पास बम होने की संभावनाएं अभी तक आराम के लिए बहुत छोटी नहीं हैं, लेकिन एक बम रखने वाले दो लोगों के अंतर असीम हैं। इसलिए जब मैं एक बम लाता हूं , तो वहां लगभग कोई मौका नहीं दो बम होंगे और हम पूरी तरह से सुरक्षित रहेंगे। ”
व्हीबर

1
आपका मजाक मजाक में, @whuber पर है, लेकिन लगता है कि "क्रैश के बीच कम अंतराल वास्तव में लंबे लोगों की तुलना में अधिक संभावित हैं" और कह रही है कि एक दुर्घटना कल की संभावना से स्वतंत्र है के बीच किसी तरह का तार्किक डिस्कनेक्ट हो रहा है आज हुई। मुझे लगता है कि संभावना जवाबी सहज हो सकती है।
जोएल डब्ल्यू।

1
काउंटर सहज (मेरे लिए) क्या कह रहा है कि दुर्लभ घटनाएं समय के करीब होती हैं। सहज रूप से, मुझे लगता है कि दुर्लभ घटनाएं समय के करीब नहीं होंगी। क्या मैं उस सहज दृश्य के साथ एक ही हूँ?
जोएल डब्ल्यू।

1
@Steve S: लिंक के लिए धन्यवाद। समाचार लेख (1/365) में अनुमानित मान के लिए घातांक वितरण कैसा दिखेगा? किसी भी मामले में, शायद घातांक वितरण लेख के शीर्षक को संबोधित नहीं करता है, जिसका तात्पर्य है कि एक छोटी समयावधि के भीतर होने वाली घटनाओं की संभावना की तुलना एक लंबी अवधि के भीतर होने वाली घटनाओं की संख्या की संभावना के साथ। ।
जोएल डब्ल्यू।

4

यदि प्लेन क्रैश की संख्या पोइसन वितरित की जाती है (जैसा कि वह बताते हुए प्रतीत होता है), क्रैश के बीच के समय में एक घातीय वितरण होता है। घातांक वितरण की पीडीएफ समय की घटती हुई एक नीरसता है। इसलिए पहले के क्रैश बाद के क्रैश से अधिक होने की संभावना है।


"क्रैश के बीच छोटे अंतराल वास्तव में लंबे लोगों की तुलना में अधिक संभावित होते हैं" यह कहने से अलग कैसे है कि अगर सिर्फ एक विमान दुर्घटना हुई है तो हमें अपनी आगामी यात्रा (सांख्यिकीय कारणों से) में देरी करनी चाहिए?
जोएल डब्ल्यू।

2
जोएल, यह उद्धरण तब तक निरर्थक है जब तक कि इसका लेखक "लघु" और "लंबे" से अभिप्राय नहीं करता है। प्रति वर्ष एक अपेक्षित दर के साथ एक घटना के अपने उदाहरण में, अगले महीने के दौरान एक पुनरावृत्ति की संभावना अभी भी इस संभावना से कम होगी कि अगली दुर्घटना एक वर्ष से अधिक बाद में होती है। उसका मतलब यह हो सकता है कि प्रति इकाई समय की संभावना निकट अवधि की तुलना में निकट अवधि में अधिक होती है। वास्तविक संभावनाओं की तुलना करने के लिए आपको प्रति यूनिट समय अवधि (तकनीकी रूप से, आपको इसे अवधि में एकीकृत करना होगा) की संभावना को गुणा करना होगा।
whuber

@ व्हाइट: हेडलाइन हवाई जहाज दुर्घटनाओं की एक क्लस्टर की संभावना की बात करता है। स्टैटेक्सचेंज पर अब तक कुछ भी नहीं कहा गया है कि मुझे विश्वास है कि हवाई जहाज दुर्घटनाओं का एक समूह व्यापक रूप से फैलने वाले हवाई जहाज दुर्घटनाओं की तुलना में अधिक सामान्य या संभावित है। इसलिए, यह मुझे प्रतीत होता है कि समाचार मीडिया से उद्धरण सर्वथा भ्रामक है (शायद क्योंकि समय अंतराल की पहचान नहीं की गई है, जैसा आपने लिखा है)। तुम क्या सोचते हो?
जोएल डब्ल्यू।

मुझे नहीं पता कि आप "व्यापक रूप से फैला हुआ हवाई जहाज दुर्घटनाओं" से क्या मतलब है और न ही, इस मामले के लिए, क्या मुझे पूरी तरह से यकीन है कि आप एक "क्लस्टर" होना समझते हैं। मान लीजिए, स्थिति को ठोस बनाने के लिए, दुर्लभ घटनाओं की एक श्रृंखला 0, 10, 11, 12, और 22 में होती है (कुछ प्रारंभिक तिथि से गिनती)। वास्तव में कितने "व्यापक रूप से स्थानिक" घटनाएं हुई हैं? कितने "क्लस्टर" हुए हैं? मैं पहले प्रश्न का उत्तर दस से शून्य तक खोज सकता हूं और दूसरे प्रश्न का उत्तर शून्य या एक हो सकता है।
whuber

1
@ व्हाइट: हेडलाइन का अर्थ है कि व्यापक रूप से फैलने वाली दुर्घटनाओं की तुलना में दुर्घटनाओं का समूह होना अधिक संभावना है। चलो परिचालन करते हैं। मान लें कि एक क्लस्टर 3 हवाई जहाज दुर्घटनाएं हैं, और समय की एक छोटी अवधि 3 महीने है और लंबी अवधि 3 साल है। यह सोचना अतार्किक है कि इस बात की अधिक संभावना है कि 3 दुर्घटनाएं 3 महीने की अवधि में 3 साल की अवधि के भीतर होंगी। यहां तक ​​कि अगर हम पहले दुर्घटना को एक दिए गए रूप में लेते हैं, तो यह सोचना भी अतार्किक है कि अगले 3 महीनों के भीतर 2 और दुर्घटनाएं हो जाएंगी।
जोएल डब्ल्यू।

0

अन्य उत्तरों ने पहले ही निपटा दिया है कि कैसे स्वतंत्र ईवेंट क्लस्टर। (ग्लीक के कैओस को पढ़ना, उन सभी वर्षों पहले, इस विचार से मेरी आँखें खुलीं।)

लेकिन, वास्तव में इस बात के पुख्ता सबूत हैं कि विमान दुर्घटनाएँ स्वतंत्र घटनाएँ नहीं हैं। Cialdini's Influence का इस पर एक बहुत अच्छा अध्याय है ( यहाँ भी उल्लेख किया गया है जिसमें डेटा के कुछ लिंक हैं और मुझे पुस्तक के उस हिस्से का एक अंश मिला )। स्पष्ट रूप से यह अत्यधिक विवादास्पद है: यह मूल रूप से कह रहा है कि एक हवाई दुर्घटना को जितना अधिक प्रचारित किया जाता है, उतना ही अधिक संभावना है कि वह अपने विमान को दुर्घटनाग्रस्त करने के लिए पायलट (जानबूझकर या अनजाने में) को प्रभावित करता है। लेकिन परिकल्पना अंतर्निहित मनोवैज्ञानिक स्पष्टीकरण प्रशंसनीय लगते हैं, और डेटा भी इसका समर्थन करने लगता है।

(सांख्यिकी-आधारित डिबंकिंग अनुसंधान के लिंक टिप्पणियों में स्वागत योग्य होंगे।)


ऐसा नहीं कहते हैं: कहते हैं, "अत्यधिक प्रचारित आत्महत्या की कहानियों के तुरंत बाद, वाणिज्यिक-एयरलाइन दुर्घटनाओं में मरने वालों की संख्या बढ़ जाती है।
Scortchi - को पुनः स्थापित मोनिका

दावे के लिए संदर्भ है, मुझे लगता है, फिलिप्स (1978) "हवाई जहाज दुर्घटना की हत्याएं हत्या और आत्महत्या के बारे में अखबार की कहानियों के बाद बढ़ जाती हैं", विज्ञान , 201 , पीपी 748-750। सार "निजी, व्यावसायिक और कॉर्पोरेट-कार्यकारी हवाई जहाज" को संदर्भित करता है।
Scortchi - को पुनः स्थापित मोनिका

या शायद यह एक: फिलिप्स (1980), "हवाई जहाज दुर्घटनाओं, हत्या, और बड़े पैमाने पर मीडिया: नकल और सुझाव के एक सिद्धांत की ओर", सामाजिक बलों , 58 , 4, जहां "एयरलाइंस" सार में उल्लेख किया गया है।
Scortchi - को पुनः स्थापित मोनिका

2
अल्थाइड (1981), सोशल फोर्सेस , 60 , 2 बताती है कि एक "निश्चित प्रकार की अत्यधिक प्रचारित आत्महत्या की कहानी" को बाद के 'प्लेन क्रैश' की पूरी तरह से स्वतंत्र रूप से परिभाषित नहीं किया जा सकता है - जैसे "प्रसिद्ध रब्बी" की परिभाषा ।
Scortchi - को पुनः स्थापित मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.