बर्थडे सवाल का असली जवाब क्या है?


13

"कम से कम 50% के साथ एक ही जन्मदिन के साथ दो लोगों को खोजने की संभावना बनाने के लिए एक वर्ग कितना बड़ा होना चाहिए?"

मेरे फेसबुक पर 360 दोस्त हैं, और, उम्मीद के मुताबिक, उनके जन्मदिन का वितरण बिल्कुल भी समान नहीं है। मेरे पास एक दिन है उसी जन्मदिन के साथ 9 दोस्त हैं। (9 महीने बाद बड़ी छुट्टियां और वैलेंटाइन्स डे बड़े लगते हैं, lol ..) तो, यह देखते हुए कि कुछ दिन जन्मदिन की अधिक संभावना है, मैं मान रहा हूं कि 23 की संख्या एक ऊपरी है।

क्या इस समस्या का कोई बेहतर अनुमान है?


3
360 व्यक्तियों का एक नमूना वर्ष के 365 दिनों में जन्मदिन के वितरण के लिए एक बड़ा नमूना नहीं बनाता है ... आप निश्चित रूप से इतने छोटे नमूने पर एकरूपता की जांच नहीं कर सकते।
शीआन

एक व्यक्ति को एक जन्मदिन है, बाधाओं है कि एक दूसरा व्यक्ति क्या कर रहे हैं नहीं है एक ही जन्मदिन का हिस्सा? 364/365, क्या हैं कि एक तिहाई व्यक्ति या तो जन्मदिन साझा नहीं करता है ? (364/365) * (363/365)। इस पर तब तक विस्तार करें जब तक आपको संभावना न मिल जाए < 50%। इसका अर्थ यह होगा कि किसी का जन्मदिन समान नहीं है , जिसका अर्थ यह होगा कि जन्मदिन को साझा करने के लिए कम से कम दो के लिए अंतर होगा > 50%
zzzzBov

8
क्या हम मान लेते हैं कि आपके पास यादृच्छिक मित्र हैं?
जेम्स

1
@zzzzBov - आप समझ नहीं पा रहे हैं कि ओपी क्या माँग रहा है। यह वह दृष्टिकोण है जहाँ हम मानते हैं कि प्रत्येक जन्मदिन समान रूप से संभव है, प्रत्येक आपके होने के chance के साथ है। ओपी पूछ रहा है कि अनुमान क्या होगा जब 1 जनवरी को पैदा होने के बारे में कहा जाता है कि 15 फरवरी को पैदा होने की संभावना नहीं है1365
संभावना

जवाबों:


18

सौभाग्य से किसी ने संबंधित प्रश्न की थोड़ी चर्चा (वितरण की वर्दी) के साथ कुछ वास्तविक जन्मदिन डेटा पोस्ट किया है । हम इसका उपयोग कर सकते हैं और यह दर्शाते हैं कि आपके प्रश्न का उत्तर स्पष्ट रूप से 23 है - सैद्धांतिक उत्तर के समान ।

> x <- read.table("bdata.txt", header=T)
> birthday <- data.frame(date=as.factor(x$date), count=x$count)
> summary(birthday) 
      date         count     
 101    :  1   Min.   : 325  
 102    :  1   1st Qu.:1266  
 103    :  1   Median :1310  
 104    :  1   Mean   :1314  
 105    :  1   3rd Qu.:1362  
 106    :  1   Max.   :1559  
 (Other):360                 
> results <- rep(0,50)
> reps <-2000 # big number needed as there is some instability otherwise
> for (i in 1:50)
+ {
+ count <- 0
+ for (j in 1:reps)
+ {
+ samp <- sample(birthday$date, i, replace=T, prob=birthday$count)
+ count <- count + 1*(max(table(samp))>1)
+ }
+ results[i] <- count/reps
+ }
> results
 [1] 0.0000 0.0045 0.0095 0.0220 0.0210 0.0395 0.0570 0.0835 0.0890 0.1165
[11] 0.1480 0.1770 0.1955 0.2265 0.2490 0.2735 0.3105 0.3350 0.3910 0.4165
[21] 0.4690 0.4560 0.5210 0.5310 0.5745 0.5975 0.6240 0.6430 0.6950 0.7015
[31] 0.7285 0.7510 0.7690 0.8025 0.8225 0.8280 0.8525 0.8645 0.8685 0.8830
[41] 0.8965 0.9020 0.9240 0.9435 0.9350 0.9465 0.9545 0.9655 0.9600 0.9665

8
वास्तव में, कोई भी शूर उत्तलता के माध्यम से दिखा सकता है कि जन्मदिन के किसी भी गैर-समान वितरण के लिए, एक मैच की संभावना कम से कम समान है जैसा कि वर्दी मामले में है। यह जे। माइकल स्टील, द कॉची-श्वार्ज़ मास्टर क्लास का व्यायाम 13.7 है : गणित की असमानताओं की कला का एक परिचय , कैम्ब्रिज यूनिवर्सिटी प्रेस, 2004, स्नातकोत्तर। 206
कार्डिनल

2
@ शीआन: वास्तव में। अब, यदि मैं केवल किसी ऐसे व्यक्ति को जानता था जो उच्च-गुणवत्ता वाले, उच्च-पाठक सांख्यिकी पत्रिका के लिए पुस्तक समीक्षा करता था, तो मैं सुझाव दूंगा कि वे इसे सांख्यिकीविदों को उच्च दृश्यता देने के लिए समीक्षा करें ... लेकिन ऐसा व्यक्ति कहां मिलेगा ...
कार्डिनल

3
(उन लोगों के लिए जो मेरी पूर्ववर्ती टिप्पणी के बारे में सोच रहे होंगे, यह इस तथ्य का संदर्भ देता है कि @ शीआन चांस के लिए नव नियुक्त पुस्तक समीक्षक हैं ।)
कार्डिनल

2
@ शीआन, इसे देखें और देखें कि आप क्या सोचते हैं table(replicate(10^5, max(tabulate(sample(1:365,360,rep=TRUE))))):।
whuber

3
आर कॉग्निओसेंटी को छोड़कर, यह शायद स्पष्ट नहीं है, कि @ शीआन द्वारा पिछली टिप्पणियों में कोड और खुद ओपी की स्थिति का अनुकरण करता है। इसे चलाने से स्थापित होता है कि एक समान रूप से वितरित जनसंख्या से 360 में से यादृच्छिक रूप से चुने गए 9 में से 9 या अधिक लोगों का जन्मदिन साझा करने का मौका केवल 100,000 में से 40 के आसपास है। साझा जन्मदिन की अधिकतम संख्या के लिए सबसे अधिक संभावना मूल्य है 5.
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.