यह देखते हुए कि आज एक छलांग का दिन है, क्या किसी को छलांग के दिन पैदा होने की संभावना पता है?
यह देखते हुए कि आज एक छलांग का दिन है, क्या किसी को छलांग के दिन पैदा होने की संभावना पता है?
जवाबों:
ज़रूर। यहाँ एक अधिक विस्तृत विवरण के लिए देखें: http://www.public.iastate.edu/~mlamias/LeapYear.pdf ।
लेकिन अनिवार्य रूप से लेखक का निष्कर्ष है, "2 सहस्राब्दी में 485 लीप वर्ष होते हैं। इसलिए, 2 सहस्राब्दी में, कुल दिन होते हैं। उन दिनों में 29 फरवरी होता है। उनमें से 485 (लीप वर्ष), इसलिए संभावना ”485 / 730,485 = .०००६६३९४२४
आंकड़ों का उपयोग करके उस संभाव्यता का सटीक अनुमान लगाने के लिए, यह जानना उपयोगी होगा कि जन्म कहाँ हुआ था।
यह पृष्ठ http://chmullig.com/2012/06/births-by-day-of-year/ में एक ग्राफ है जो प्रति दिन जन्मों की संख्या को दर्शाता है (29 वें को 4 से गुणा करना, जो गलत है, और अवांछनीय है। इस प्रश्न के लिए, लेकिन यह मूल डेटा से भी जुड़ता है और संयुक्त राज्य अमेरिका में आप क्या उम्मीद कर सकता है) का एक मोटा संकेत देता है। मुझे लगता है कि यह वक्र अन्य देशों के लिए सही नहीं है, और विशेष रूप से अन्य महाद्वीपों के लिए नहीं। विशेष रूप से दक्षिणी गोलार्ध और भूमध्यरेखीय क्षेत्र इन परिणामों से पर्याप्त व्युत्पन्न दिखा सकते हैं - यह मानते हुए कि जलवायु एक निर्धारण कारक है।
इसके अलावा, वहाँ "ऐच्छिक जन्म" ( http://bmjopen.bmj.com/content/3/8/e002920.full के लेखकों द्वारा छुआ गया ) का मुद्दा है - दुनिया के गरीब क्षेत्रों में, मैं एक अलग उम्मीद करूंगा जन्मों का वितरण, सिर्फ इसलिए कि (गैर-आपातकालीन-) सीजेरियन सेक्शन या प्रेरित जन्म विकसित देशों की तुलना में दुर्लभ हैं। इसने जन्म के अंतिम वितरण को रोक दिया।
अमेरिकी डेटा का उपयोग करते हुए, 29 फरवरी को ~ 71 मिलियन जन्म (मोटे तौर पर रेखांकन का मतलब * 366) और 46.000 जन्मों को मानते हुए, डेटा में लीप वर्षों के वितरण के लिए सही नहीं है, क्योंकि सटीक अवधि का संकेत नहीं दिया गया है, मैं एक संभावना पर पहुंचता हूं लगभग ~ 0.000648। यह उस मूल्य से थोड़ा कम है जो किसी को जन्म के एक फ्लैट वितरण की उम्मीद करेगा, और इस तरह ग्राफ द्वारा दिए गए सामान्य प्रभाव के अनुरूप होगा।
मैं एक प्रेरित पाठक के लिए इस मोटे अनुमान का एक महत्व परीक्षण छोड़ दूँगा। लेकिन यह देखते हुए कि 29 वाँ (हालांकि बिना सोचे - विचाराधीन वर्ष 2000 औसत से कम पूर्वाग्रह को डेटा में इंजेक्ट करता है) पहले से ही कम फरवरी के मानकों के लिए भी कम स्कोर करता है, मैं एक अपेक्षाकृत उच्च आत्मविश्वास मानता हूं कि समान वितरण की अशांति को खारिज किया जा सकता है।
मुझे लगता है कि इस प्रश्न का उत्तर केवल अनुभवजन्य हो सकता है। कोई भी सैद्धांतिक जवाब जन्मदिन के चयन की घटनाओं, मौसमी आदि के बिना त्रुटिपूर्ण होगा। ये चीजें सैद्धांतिक रूप से निपटने के लिए असंभव हैं।
गोपनीयता कारणों से अमेरिका में जन्मदिन का डेटा मिलना मुश्किल है। यहां एक अनाम डेटा सेट है । यह संयुक्त राज्य अमेरिका में बीमा अनुप्रयोगों से है। अन्य रिपोर्टों से अंतर, जैसे कि एक लोकप्रिय अक्सर उद्धृत एनटीटी लेख , यह है कि यह वर्ष में दिनों की सरल रैंकिंग के बजाय, जन्मों की आवृत्ति को सूचीबद्ध करता है। कमजोर बिंदु निश्चित रूप से नमूनाकरण पूर्वाग्रह है, क्योंकि यह बीमा से आता है: अविभाजित लोगों को शामिल नहीं किया जाता है आदि।
डेटा के अनुसार कुल 481040 के 29 फ़रवरी में 325 जन्म थे। रॉय मर्फी के अनुसार , नमूना 1981 से 1994 तक फैला है। इसमें कुल 14 वर्षों के 3 लीप वर्ष शामिल हैं। किसी भी समायोजन के बिना 1981 और 1994 के बीच 29 फरवरी को होने की संभावना 0.0675% होगी।
आप लीप वर्ष की आवृत्ति के लिए लेखांकन द्वारा संभावना को समायोजित कर सकते हैं, जो 1/4 के करीब है ( बिल्कुल नहीं ), उदाहरण के लिए, इस संख्या को से गुणा करके 0.079% अनुमान तक पहुंचने के लिए। यहां, एक लीप वर्ष में 29 फरवरी को पैदा होने की सशर्त संभाव्यता एक नमूना में लीप वर्षों की आवृत्ति द्वारा देखी गई आवृत्ति से जुड़ी हुई है : जहाँ एक नमूने में वर्षों की संख्या है, और जन्मों की कुल आवृत्ति है।
आम तौर पर, लीप वर्ष की संभावना , इसलिए, 29 फरवरी को पैदा होने की लंबी अवधि की औसत संभावना है:
आप 29 फरवरी को पैदा होने की सशर्त संभाव्यता में रुचि ले सकते हैं, जो कि आप लीप वर्ष में पैदा हुए थे:
इसलिए, और बीच की कड़ी कुछ धारणाओं पर आधारित है, उदाहरण के लिए कि किसी भी वर्ष में पैदा होने की संभावना एक समान है, और परिवर्तित नहीं होती है। पी
बेशक, यह चर्चा अमेरिकी केंद्रित थी। कौन जानता है कि अन्य देशों में क्या पैटर्न हैं।
अद्यतन: हम स्वचालित रूप से मानते हैं कि ओपी ग्रेगोरियन कैलेंडर है। यह और भी दिलचस्प हो जाता है अगर आप विभिन्न कैलेंडर जैसे चंद्र कैलेंडर हिजरी पर विचार करते हैं , जहां हर 30 साल में लीप वर्ष होता है।
अद्यतन 2:
आश्चर्य की बात यह है कि अनुमानित संभावना इस नमूने के लिए 29 फरवरी को जन्मदिन की अपेक्षित घटना की ओर जाता है: । यह केवल 1 जनवरी और 25 दिसंबर की तुलना में कम है, जो ऊपर NYT की रैंकिंग के अनुरूप है! वे केवल उल्लेख करते हुए डेटा के स्रोत का वर्णन नहीं करते हैं , लेकिन यह या तो समान है या खोज मजबूत है।एफ ⋅ पी = 1 , 527Amitabh Chandra, Harvard University
अब, यह कैसे संभव हो सकता है कि ग्रेगोरियन कैलेंडर में बहुत अजीब दिन: 1 जनवरी, 25 दिसंबर और देब 29 सबसे लोकप्रिय जन्मदिन के रूप में आएंगे? मैं कहता हूं कि यह एक बेतरतीब घटना है। इसलिए, यह देखना और भी दिलचस्प है कि हिजरी जैसे अन्य कैलेंडर में क्या चल रहा है।
अद्यतन 3:
ध्यान दें कि दोनों भोले सैद्धांतिक अनुमानों से अधिक हैं:
पी एल≈पी⋅366
अद्यतन 4:
बेन मिलवुड ने टिप्पणी की कि वर्ष के दिन तक जन्म का वितरण गैर-समान है। क्या हम इस कथन का परीक्षण कर सकते हैं? अपने डेटा का उपयोग कर सेट हम चला सकते हैं परीक्षण एक शून्य परिकल्पना है कि वितरण एक समान ना के साथ सैद्धांतिक वितरण पर। परिणाम अस्वीकृति है, यानी वितरण समान नहीं लगता है।
सैद्धांतिक वितरण इस तरह बनाया गया है। हम मानते हैं कि जन्म की आवृत्ति सभी कैलेंडर दिनों में समान है, यानी 14 साल में दिन के अंतराल पर । फिर हम दिनों को वर्ष के दिनों में रोल करते हैं, जो 366 है। जाहिर है कि केवल 3 लीप दिन का सामना करना पड़ा और 14 गैर-लीप दिन। नीचे मेरा MATLAB कोड और सैद्धांतिक और अनुभवजन्य की तुलना के लिए वितरण भूखंड है।
d=[0101 1482
...
1231 1352];
%%
tc = sum(d(:,2)); % total obs
idL = 60; % index of Feb 29
% theor frequency, assuming uniform
ny = 1994 - 1981 + 1; % num of years
nL = 3; % # of leap years: 1984, 1988, 1992
nd = 365*ny + nL; % total # of days
fc = tc/nd; % expected freq for calendar date in sample
td = ones(366,1)*fc*ny; % roll the dates into day of year
td(idL) = fc*nL;
fprintf(1,'non-leap day expected freq: %f\n',td(end))
fprintf(1,'leap day expected freq: %f\n',td(idL))
fprintf(1,'non-leap day average freq: %f\n',mean(d([1:idL-1 idL+1:end],2)))
fprintf(1,'non-leap day freq std dev: %f\n',std(d([1:idL-1 idL+1:end],2)))
fprintf(1,'leap day observed freq: %f\n',d(idL,2))
% plots
bar(d(:,2))
hold on
plot(td,'r')
legend('empirical','theoretical')
title('Distribution of birth dates 1981-1994')
set(gca,'XTick',1:30:366)
set(gca,'XTickLabels',[num2str(floor(d(1:30:366,1)/100)) repmat('/',13,1) num2str(rem(d(1:30:366,1),100))])
grid on
% chi^2 test
[h p]=chi2gof(d(:,2),'Expected',td)
उत्पादन:
non-leap day expected freq: 1317.144534
leap day expected freq: 282.245257
non-leap day average freq: 1317.027397
non-leap day freq std dev: 69.960227
leap day observed freq: 325.000000
h =
1
p =
0
मेरी पसंदीदा पुस्तक का कवर कभी भी जन्मों के एक समान आवंटन की तारीखों की धारणा के खिलाफ कुछ अत्यधिक प्रासंगिक सबूत प्रदान करता है। विशेष रूप से 1970 के बाद से अमेरिका में जन्म लेने वाले प्रत्येक व्यक्ति पर कई तरह के रुझान दिखाई देते हैं: एक लंबी, बहु-दशक की प्रवृत्ति, एक गैर-आवधिक प्रवृत्ति, दिन के रुझान, दिन के रुझान, छुट्टी के रुझान (क्योंकि सिजेरियन की प्रक्रियाएं) अनुभाग एक को जन्मतिथि को प्रभावी ढंग से निर्धारित करने की अनुमति देता है, और डॉक्टर अक्सर छुट्टियों पर नहीं जाते हैं)। इसका परिणाम यह है कि एक वर्ष में बेतरतीब ढंग से चुने गए दिन पर पैदा होने की संभावना एक समान नहीं होती है, और क्योंकि जन्म दर साल के बीच बदलती है, सभी वर्ष समान रूप से संभव नहीं होते हैं।
इससे यह भी सबूत मिलता है कि एक बहुत मजबूत दावेदार के रूप में अक्साल का समाधान भी अधूरा है। यहां खेलने पर सभी प्रभावों से छोटी संख्या में लीप दिन "दूषित" हो जाएगा, इसलिए अक्साल का अनुमान सप्ताह के दिनों के साथ-साथ दीर्घकालिक और दीर्घकालिक रुझानों के प्रभाव को भी पकड़ रहा है। 29 प्रभाव। कौन से प्रभाव हैं और शामिल करने के लिए उपयुक्त नहीं हैं, आपके प्रश्न से स्पष्ट रूप से परिभाषित नहीं हैं।
और इस विश्लेषण का केवल अमेरिका पर ही असर है, जिसमें जनसांख्यिकीय रुझान हैं जो अन्य देशों या आबादी से काफी भिन्न हो सकते हैं। उदाहरण के लिए, जापान की जन्म दर दशकों से घट रही है। चीन की जन्म दर राज्य द्वारा नियंत्रित की जाती है, इसके राष्ट्र की लिंग रचना के लिए कुछ परिणाम और इसलिए बाद की पीढ़ियों में जन्म दर।
इसी तरह, गेलमैन का विश्लेषण केवल हाल के दशकों का वर्णन करता है, और यह स्पष्ट रूप से स्पष्ट नहीं है कि यह आपके प्रश्न के लिए ब्याज का युग भी है।
उन लोगों के लिए जो इस तरह की चीज के बारे में उत्साहित हैं, कवर में सामग्री पर गौसेन प्रक्रियाओं पर अध्याय में लंबाई पर चर्चा की गई है।
29 फरवरी एक ऐसी तारीख है जो हर साल होती है जो 4 से अधिक है ।
हालाँकि, ऐसे वर्ष जो 100 में से एक हैं, लेकिन 400 में से एक नहीं हैं, को लीप वर्ष नहीं माना जाता है (उदाहरण: 1900 एक लीप वर्ष नहीं है जबकि 2000 या 1600 हैं)। इसलिए, आजकल, यह हर 400 साल में एक ही पैटर्न है।
तो चलो एक [0, 400 [ अंतराल] पर गणित करते हैं:
400 साल की अवधि में, वास्तव में 4 x 25 = 100 वर्ष हैं जो कि 4 से अधिक हैं । लेकिन हमें 100 से 3 (100 के कई वर्ष नहीं बल्कि 400 के) को घटाना होगा , और हमें 100 - 3 = 97 वर्ष मिलते हैं ।
अब हमें 97 को 366 से गुणा करना होगा, 97 x 366 = 35502 (400 साल की अवधि में एक लीप वर्ष में दिनों की संख्या), यह बनी हुई है (365 x (400-97)) = 110 595 (दिनों की संख्या जो उत्पन्न होती है) 400 वर्ष की अवधि में एक लीप वर्ष में टी)।
फिर हमें केवल 400 वर्ष की अवधि में कुल दिनों की संख्या जानने के लिए इन दो संख्याओं को जोड़ना होगा: 110 595 + 35502 = 146 097 ।
खत्म करने के लिए, हमारी संभावना एक 400 साल की अवधि में 29 फरवरी की संख्या है, इसलिए 97 दिया गया है कि हमारे अंतराल के दिनों की कुल संख्या से 97 लीप वर्ष विभाजित है:
p = 97/146097 60 0,0006639424492
आशा है कि यह सही और स्पष्ट है।
मेरा मानना है कि यहां दो सवालों को मिलाया जा रहा है। एक "29 फरवरी को किसी भी दिन होने की संभावना क्या है?"। दूसरा है (और वास्तव में पूछा गया) "छलांग के दिन पैदा होने की संभावना क्या है?"
बस गिनती के दिनों का दृष्टिकोण भ्रामक प्रतीत होता है क्योंकि अक्षल इसे इंगित कर रहा है। 29 फरवरी को दिनों की गणना और आवृत्तियों की गणना करना प्रश्न को संबोधित करता है: "क्या संभावना है कि किसी भी दिन 29 फरवरी है?" (एक कोमा के बाद जागने की कल्पना करें, कोई सुराग नहीं है कि यह किस दिन है। 29 फरवरी को होने की संभावना से ऊपर बताई गई है ।
अक्सकल के उत्तर के बाद, संभावना सिर्फ वर्ष के दिनों में जन्म के वितरण के अनुभवजन्य अध्ययन पर आधारित हो सकती है। अलग-अलग डेटा सेट अलग-अलग निष्कर्षों पर आएंगे (जैसे मौसमी के प्रभाव के कारण, जन्म दर में दीर्घकालिक रुझान, सांस्कृतिक अंतर)। Aksakal एक अध्ययन (एक टिप्पणी ने कहा: उल्लेख डेटा में एक लीप वर्ष की अप्रतिनिधिक घटना (के लिए खाते में यानी ) लीप वर्ष आवृत्तियां की लंबी अवधि आवृत्ति (यानी की तुलना में ) आपको द्वारा नमूना से 29 फरवरी को जन्म की आवृत्ति को गुणा करना होगा। )। ९ 97 97
अंत में, प्रश्न की एक तीसरी संभावित व्याख्या है, जो मुझे विश्वास है कि हालांकि इसका उद्देश्य नहीं था: "एक विशिष्ट व्यक्ति के जन्म के दिन छलांग लगाने की संभावना क्या है?" खैर, पहले से ही पैदा हुए किसी के लिए भी यह आसान है। यह या । किसी के लिए भी पैदा नहीं हुआ है, लेकिन पहले से ही यह कल्पना की गई है कि गर्भावस्था की लंबाई पर अनुभवजन्य अध्ययनों का उपयोग करके इसका अनुमान लगाया जा सकता है ( विकिपीडिया एक अवलोकन के लिए देखें )। किसी के लिए अभी तक गर्भधारण नहीं हुआ है, ऊपर देखें।1
मैंने देखा है कि ऊपर दिए गए अधिकांश उत्तर एक विशेष अवधि में लीप दिनों की संख्या की गणना करके इसे पूरा करते हैं। परिभाषा के अनुसार, उत्तर को 100% सही तरीके से प्राप्त करने का एक सरल तरीका है:
हम औसत उष्णकटिबंधीय वर्ष (उर्फ माध्य सौर वर्ष) के लिए नियमित (365 दिन) कैलेंडर को समायोजित करने के लिए लीप वर्षों का उपयोग करते हैं। माध्य उष्णकटिबंधीय वर्ष "वह समय है जो सूर्य ऋतुओं के चक्र में उसी स्थिति में लौटने में लगता है, जैसा कि पृथ्वी से देखा जाता है" (विकिपीडिया)। उष्णकटिबंधीय वर्ष थोड़ा बदलता है, लेकिन औसत (औसत) उष्णकटिबंधीय वर्ष 365.24667 के बारे में है।
यदि लीप दिन सही हैं, तो बेतरतीब ढंग से चयनित दिन होने का मौका एक लीप डे है, ((उष्णकटिबंधीय वर्ष) - (गैर-लीप-ईयर)) / उष्णकटिबंधीय वर्ष
हमारे पास अनुमानित संख्या में प्लगिंग, यह (365.24667-365) / 365.24667, या 0.24667 / 365.24667, या 675 प्रति मिलियन (0.0675%) है।
यह, हालांकि, बेतरतीब ढंग से चयनित दिन के लिए है। मुझे लगता है कि यह उन माता-पिता द्वारा काफी हद तक तिरछा है, जिन्हें अपने बच्चों को यह समझाने की ज़रूरत नहीं है, "आपका वास्तविक जन्मदिन केवल 4 साल में एक बार आता है"।