मुझे गणना करने में मदद करें कि मेरी शादी में कितने लोग आएंगे! क्या मैं प्रत्येक व्यक्ति को प्रतिशत बता सकता हूँ और उन्हें जोड़ सकता हूँ?


37

मैं अपनी शादी की योजना बना रहा हूं। मैं अनुमान लगाना चाहता हूं कि मेरी शादी में कितने लोग आएंगे। मैंने लोगों की एक सूची बनाई है और मौका है कि वे प्रतिशत में भाग लेंगे। उदाहरण के लिए

Dad 100% Mom 100% Bob 50% Marc 10% Jacob 25% Joseph 30%

मेरे पास प्रतिशत के साथ लगभग 230 लोगों की सूची है। मैं कैसे अनुमान लगा सकता हूं कि मेरी शादी में कितने लोग शामिल होंगे? क्या मैं केवल प्रतिशत जोड़ सकता हूं और इसे 100 से विभाजित कर सकता हूं? उदाहरण के लिए, यदि मैं आने वाले 10% अवसरों के साथ 10 लोगों को आमंत्रित करता हूं, तो मैं 1 व्यक्ति की उम्मीद कर सकता हूं? यदि मैं 20 लोगों को आने वाले 50% अवसर के साथ आमंत्रित करता हूं, तो क्या मैं 10 लोगों की उम्मीद कर सकता हूं?

अद्यतन: 140 लोग मेरी शादी में आए :)। नीचे वर्णित तकनीकों का उपयोग करके मैंने लगभग 150 की भविष्यवाणी की। बहुत जर्जर नहीं!


43
मैं उस व्यक्ति के लिए कोई आंकड़ा नहीं देख रहा हूं जिससे आप शादी कर रहे हैं। वह सबसे महत्वपूर्ण मात्रा है।
निक कॉक्स

6
मैंने अपनी शादी के लिए आपकी तकनीक का इस्तेमाल किया और इसने अच्छा काम किया; हमने लगभग 80 लोगों के बारे में भविष्यवाणी की और 85 या तो मिल गए। मैं ध्यान देता हूं कि एक बार जब आप अपने स्प्रैडशीट में उन सभी लोगों को शामिल कर लेते हैं, तो आप उसी स्प्रैडशीट का उपयोग उन चीजों को ट्रैक करने के लिए भी कर सकते हैं, जैसे आपने थैंक्स-नोट्स भेजे हैं।
एरिक लिपर्ट

2
प्रासंगिक: timharford.com/2013/10/guest-list-angst-a-statutic-approach । इसके लायक क्या है, मैंने लेखक के व्यक्तिगत ब्लॉग के लिंक को चुना है, लेकिन लेख फाइनेंशियल टाइम्स में उसके कॉलम से है।
स्टीव जेसोप

@EricLippert मैंने अपनी शादी के लिए कुछ ऐसा ही प्रयास किया लेकिन सफलता के रूप में अच्छा नहीं था। के दिन बहुत तेज आंधी आई और सभी ने एक घंटे के हंगामे के साथ <30% ish या अधिक नहीं दिखाया।
OSE

3
@NickCox इसके अलावा वे अपने खुद को भूल गए।
JFA

जवाबों:


32

यह मानते हुए कि शादी में आने के लिए आमंत्रित व्यक्तियों के निर्णय स्वतंत्र हैं, शादी में आने वाले मेहमानों की संख्या को बर्नौली यादृच्छिक चर के योग के रूप में चित्रित किया जा सकता है जो जरूरी नहीं कि सफलता की समान संभावनाएं हैं। यह पॉइसन द्विपद वितरण से मेल खाती है ।

चलो एक यादृच्छिक चर व्यक्तियों कि से बाहर अपनी शादी के लिए आ जाएगा की कुल संख्या के लिए इसी होना व्यक्तियों को आमंत्रित किया। प्रतिभागियों की अपेक्षित संख्या वास्तव में व्यक्तिगत '' शो-अप '' संभावनाओं का योग है , जो कि विश्वास अंतरालों की व्युत्पत्ति को सीधे-सीधे संभाव्यता द्रव्यमान फ़ंक्शन का रूप नहीं दिया जाता है । हालांकि, वे मोंटे कार्लो सिमुलेशन के साथ लगभग आसान हैं ।एन पी मैं( एक्स ) = एन Σ मैं = 1 पी मैंएक्सएनपीमैं

(एक्स)=Σमैं=1एनपीमैं

निम्नलिखित आंकड़ा, 230 आमंत्रित व्यक्तियों (बाएं) के लिए कुछ नकली शो-अप संभावनाओं का उपयोग करके 10000 नकली परिदृश्यों (दाएं) के आधार पर शादी में प्रतिभागियों की संख्या के वितरण का एक उदाहरण दिखाता है। इस सिमुलेशन को चलाने के लिए इस्तेमाल किया गया आर कोड नीचे दिखाया गया है; यह आत्मविश्वास के अंतराल प्रदान करता है।

यहाँ छवि विवरण दर्ज करें

## Parameters
N      <- 230    # Number of potential guests
nb.sim <- 10000  # Number of simulations

## Create example of groups of guests with same show-up probability
set.seed(345)
tmp    <- hist(rbeta(N, 3, 2), breaks = seq(0, 1, length.out = 21))
p      <- tmp$breaks[-1]    # Group show-up probabilities
n      <- tmp$counts        # Number of person per group

## Generate number of guests by group
guest.mat <- matrix(NA, nrow = nb.sim, ncol = length(p))
for (j in 1:length(p)) {
    guest.mat[, j] <- rbinom(nb.sim, n[j], p[j])
}

## Number of guest per scenario
nb.guests <- apply(guest.mat, 1, sum)

## Result summary
par(mfrow = c(1, 2))
barplot(n, names.arg = p, xlab = "Probability group", ylab = "Group size")
hist(nb.guests, breaks = 21, probability =  TRUE, main = "", xlab = "Guests")
par(mfrow = c(1, 1))

## Theoretical mean and variance
c(sum(n * p), sum(n * p * (1-p)))
#[1] 148.8500  43.8475

## Sample mean and variance
c(mean(nb.guests), var(nb.guests))
#[1] 148.86270  43.23657

## Sample quantiles
quantile(nb.guests, probs = c(0.01, 0.05, 0.5, 0.95, 0.99))
#1%     5%    50%    95%    99% 
#133.99 138.00 149.00 160.00 164.00 

1
वाह यह शानदार है। यह किस तरह का अनुकरण है?
बेहकाड

4
यह एक मोंटे कार्लो सिमुलेशन है
क्वांटआईबेक्स

आप "समूह आकार" को मेहमानों की संख्या में कैसे बदल सकते हैं? मेरे पास एक आकृति है जैसे कि आपकी बाईं ओर, लेकिन यह अनिश्चित है कि इसे दाईं ओर की आकृति में कैसे बदलना है ...
व्यवहार

यह उत्तर में उपलब्ध कराए गए कोड की 11 से 18 की पंक्तियों में किया जाता है। उदाहरण के लिए j, मैं एक द्विपद वितरण और उस समूह को दिखाने की संभावना का उपयोग करते हुए 20 संभावना समूह में से प्रत्येक के लिए "शो-अप" की संख्या उत्पन्न करता हूं।
क्वांटाइबेक्स

18

जैसा कि बताया गया है, उम्मीदें बस जोड़ती हैं।

हालाँकि, अपेक्षा को जानने से ज्यादा फायदा नहीं है, आपको इसके आस-पास की संभावित भिन्नता की भी कुछ समझ होनी चाहिए।

आप के बारे में चिंतित होने की जरूरत है तीन चीजें हैं:

  • उनकी अपेक्षा के आसपास के व्यक्तियों में भिन्नता (आने वाले 60% संभावना वाला व्यक्ति वास्तव में उनकी अपेक्षा को प्राप्त नहीं करता है; वे हमेशा ऊपर या नीचे होते हैं)

  • लोगों के बीच निर्भरता। जोड़े जो दोनों आ सकते हैं, वे दोनों में भाग लेंगे या न ही। छोटे बच्चे अपने माता-पिता के बिना उपस्थित नहीं होंगे। कुछ मामलों में, कुछ लोग आने से बच सकते हैं यदि वे जानते हैं कि कोई अन्य व्यक्ति वहां होगा।

  • संभावनाओं के आकलन में त्रुटि। वे संभावनाएं सिर्फ अनुमान हैं; आप कुछ अलग अनुमानों के प्रभाव पर विचार करना चाह सकते हैं (हो सकता है कि किसी और की संख्या का आकलन)

पहला गणना के लिए सामान्य है, या तो सामान्य सन्निकटन या सिमुलेशन के माध्यम से। दूसरे को विभिन्न मान्यताओं के तहत अनुकरण किया जा सकता है, या तो लोगों के लिए विशिष्ट है, या निर्भरता के कुछ वितरण पर विचार करके। (तीसरा आइटम अधिक कठिन है।)


टिप्पणियों में फॉलोअप प्रश्नों को संबोधित करने के लिए संपादित:

अगर मैं आपकी बात को सही तरह से समझ पाऊं, तो 4 के परिवार के लिए, आपके पास 4 लोगों में से प्रत्येक के लिए 50% मौका है या कोई भी नहीं आ रहा है। यह 2 की एक अपेक्षित संख्या है, निश्चित रूप से, लेकिन आप अपेक्षा के आसपास परिवर्तनशीलता के बारे में भी कुछ विचार करना चाहते हैं, जिस स्थिति में आप संभवतः 4 की 50% की वास्तविक स्थिति को रखना चाहते हैं।

यदि आप सभी को स्वतंत्र समूहों में विभाजित कर सकते हैं, तो एक अच्छा पहला सन्निकटन (इस तरह के बहुत सारे समूहों के साथ) तब स्वतंत्र समूहों में साधन और संस्करण जोड़ने के लिए होगा और फिर योग को सामान्य (शायद निरंतरता सुधार के साथ) माना जाएगा। अधिक सटीक दृष्टिकोण प्रक्रिया का अनुकरण करना या संख्यात्मक अभिसरण के माध्यम से वितरण की गणना करना होगा; जबकि दोनों दृष्टिकोण सीधे हैं, इस विशेष अनुप्रयोग के लिए यह एक अनावश्यक स्तर है, क्योंकि पहले से ही अनुमान की इतनी सारी परतें हैं - यह एक कमरे के आयामों को निकटतम पैर को बताया जा रहा है और फिर गणना करते हुए कि आपको कितने रंग की आवश्यकता होगी। निकटतम मिलिटर पर - अतिरिक्त परिशुद्धता व्यर्थ है।

तो कल्पना कीजिए (सादगी के लिए) हमारे चार समूह थे:

1) समूह ए (1 व्यक्तिगत) - उपस्थिति का 70% मौका

2) समूह बी (1 व्यक्तिगत) - उपस्थिति का 60% मौका

3) समूह C (4 का परिवार) - 0: 0.5 4: 0.5 (यदि कोई घर में रहता है, तो कोई नहीं आएगा)

4) ग्रुप डी (2 के जोड़े) - 0: 0.4 1: 0.1 2: 0.5 (यानी दोनों का 50% मौका, प्लस 10% मौका बिल्कुल एक आएगा, जैसे अगर दूसरे के पास कमिटमेंट है या बीमार है)

तब हमें निम्नलिखित साधन और संस्करण मिलते हैं:

      mean   variance
  A    0.7     0.21
  B    0.6     0.24
  C    2.0     4.0
  D    1.1     0.89

 Tot   4.4     5.34

तो एक सामान्य सन्निकटन इस मामले में बहुत अधिक मोटा होगा, लेकिन यह सुझाव देगा कि 7 से अधिक लोग बहुत कम संभावना (5% के आदेश पर) होंगे, और 6 या उससे कम समय में लगभग 75-80% होगा।

[प्रक्रिया का अनुकरण करने के लिए एक अधिक सटीक दृष्टिकोण होगा, लेकिन कट डाउन उदाहरण के बजाय पूरी समस्या पर यह संभवतः अनावश्यक है क्योंकि पहले से ही अनुमान की इतनी सारी परतें हैं।]


एक बार जब आपके पास आपका संयुक्त वितरण होता है जो इस तरह के समूह-निर्भरता को शामिल करता है, तो आप समग्र संयुक्त निर्भरता (जैसे गंभीर मौसम) के किसी भी स्रोत को लागू करने की इच्छा कर सकते हैं - या आप परिस्थितियों के आधार पर इस तरह की घटनाओं के खिलाफ बस बीमा या उपेक्षा करना चाह सकते हैं। ।


5
निर्भरता का उल्लेख करने के लिए +1। ये पारस्परिक संबंधों के अलावा अन्य कारणों से उत्पन्न होते हैं, जैसे कि मौसम और यात्रा की स्थिति। उनमें से कई सकारात्मक सहसंबंधों को प्रेरित करते हैं - जो अनिश्चितता की सीमा को चौड़ा करते हैं। यदि अनुमानों का उपयोग रसद (भोजन, सीटें, और इसी तरह) प्रदान करने के लिए किया जाएगा, तो सटीक रूप से भिन्नता का आकलन करना मूल्यवान है। हालांकि एक शादी के आवेदन में एक शिक्षित अनुमान से ज्यादा कुछ नहीं किया जा सकता है, इन सांख्यिकीय घटनाओं की गुणात्मक समझ होने से बेहतर अनुमान लग सकते हैं।
whuber

@ व्हाइटर निर्भरता के अन्य स्रोतों के बारे में अच्छा संकेत देता है, जैसे कि मौसम। कुछ परिस्थितियों में, ऐसी चीजें मेरे द्वारा बताए गए प्रभावों को आसानी से दूर कर सकती हैं।
Glen_b

मैं आसानी से खाता निर्भरता में कैसे ले सकता हूं? उदाहरण के लिए, अगर मुझे दो बच्चों के साथ एक दंपति के बारे में पता है, और मुझे उम्मीद है कि माता-पिता के पास आने का 50% मौका है। मुझे पता है कि अगर वे आते हैं तो वे अपने बच्चों को लाएंगे। क्या यह प्रत्येक व्यक्ति को 50% विशेषता देने के लिए बचा है, और मूल रूप से मान लें कि 2 लोग आ रहे हैं?
Behacad

2
@Beccad: यदि आप जानते हैं कि यह किसी दिए गए समूह के साथ सभी-या-कोई का सवाल है, तो आप समूह की एकल इकाई के रूप में आने की संभावना का अनुमान लगा सकते हैं और इसमें व्यक्तियों की संख्या से समूह का वजन कर सकते हैं। मैं सहमत हूं कि त्रुटि का मार्जिन आपके अनुमानों में भी शामिल करना अच्छा होगा।
निक स्टैनर

धन्यवाद। मेरे पास उस प्रतिशत वाले प्रतिशत और राशि वाले लोगों की एक छोटी तालिका है, लेकिन मुझे नहीं पता कि अब क्या करना है। मुझे जोड़ने का क्या मतलब होना चाहिए? क्या परिवर्तन? (100% -52, 90% -21, 80% -34, 70% -16,60% -32,50% -35,40% -25,30% -11,20% -22,10% -15 , 0% -9)
बेहकाद

5

(इस पर अपनी पहले की टिप्पणी को अनदेखा करें - मुझे सिर्फ एहसास हुआ कि मैं किसी और चीज़ के साथ उम्मीद को भ्रमित कर रहा था।) यह देखते हुए कि आप अनिवार्य रूप से दिखा रहे लोगों की संख्या की अपेक्षा को खोजने की कोशिश कर रहे हैं, आप सैद्धांतिक रूप से प्रत्येक व्यक्ति की संभावना दिखा सकते हैं ऐसा करने के लिए।

01

हालाँकि, यह आपको केवल अपेक्षित मूल्य देता है - बिना अधिक मान्यताओं के, लोगों के विचरण को दर्शाने वाली चीजों का अनुमान लगाना कठिन होगा, विशेष रूप से क्योंकि यह बहुत ही उचित है कि यह मान लेना कि व्यक्ति को दिखाना जरूरी नहीं है कि व्यक्ति बी से स्वतंत्र दिख रहा है।

एक तरफ, यहाँ एक प्रासंगिक बीबीसी लेख है।


धन्यवाद! तो बस पुष्टि करने के लिए, अगर मुझे लगता है कि 10 लोगों के पास आने का 10% मौका है, तो मैं अनुमान लगा सकता हूं कि 1 व्यक्ति आएगा, उदाहरण के लिए।
बेहकाड

सिद्धांत रूप में हां, लेकिन चीजों पर किसी भी अधिक मान्यताओं के बिना कुछ अधिक उपयोगी (जैसे विश्वास अंतराल) का निर्माण करना मुश्किल लगता है।

धन्यवाद। मैं विश्वास अंतराल पर कैसे पहुंच सकता हूं?
बेहकाड

कि मैं कई कारणों से पूरी तरह से निश्चित नहीं हूं। (मुझे शायद उस पर विस्तृत जवाब देने के लिए कुछ चीजें देखने के लिए अधिक समय बिताना होगा।)

4

बड़ी संख्या के लिए, 80% वह है जो आप अपेक्षा करेंगे। यह एक ऐसी स्थिति हो सकती है जहां एक विस्तृत विश्लेषण, जैसा कि आप प्रस्तावित करते हैं, केवल गणना में त्रुटियों को जोड़ता है।
उदाहरण के लिए, क्या मार्क की संभावित उपस्थिति वास्तव में जोसेफ की 1/3 है? और जोसेफ वास्तव में 30% है, या यह 25% हो सकता है? चीजें तब होती हैं जब आप बड़ी संख्या में पहुंचते हैं जो बस इस सभी विश्लेषण से 80% अधिक वैध बनाते हैं। मैं अभी एक शादी से वापस आया। 550 को आमंत्रित किया। 452 ने भाग लिया। हॉल की योजना बनाने और कैटरर से बात शुरू करने के प्रयोजनों के लिए, 440 का प्रारंभिक अनुमान ठीक था।

क्या मैं अपने टोस्ट से युगल को एक लाइन प्रदान कर सकता हूं? "याद रखें, अगर आपकी पत्नी खुश है, लेकिन आप खुश नहीं हैं, तो आप अभी भी खुश हैं, अगर आपकी पत्नी दुखी है, लेकिन आप खुश हैं।"


धन्यवाद! एक चिंता यह है कि लोग अलग-अलग और अलग-अलग दूरी से आ रहे होंगे। कुछ काफी दूर, दूसरों को बस सड़क के नीचे।
बेहकाद

3
यह आंकड़ा संस्कृति पर निर्भर हो सकता है।
जुहो कोक्कल

@ जूहू - जो हो सकता है। मैं अमेरिका में हूं और मेरे हालिया उदाहरण में, यह लगभग आधे आमंत्रितों के लिए एक गंतव्य शादी थी, यानी शादी दुल्हन के गृहनगर में थी। मुझे आश्चर्य है कि सांस्कृतिक अंतर क्या प्रभाव डालेंगे, लेकिन मुझे संदेह है कि आप सही हैं।
JTP -

4
यह एक अनुमानक का एक अद्भुत उदाहरण है जो सिद्धांत में मौजूद है, लेकिन व्यवहार में असामान्य लगता है (जब तक आप इस तरह की चीज नहीं देखते हैं): डेटा के किसी भी सेट को देखते हुए , यह एक पूर्व निर्धारित संख्या (इस मामले में 80%) देता है। यह गणना करना आसान है, बहुत सस्ती (डेटा संग्रह लागत शून्य तक कम की जा सकती है) और इसमें शून्य संस्करण है। यह बेयस (परमाणु पूर्व के लिए) और स्वीकार्य है। इसके पूर्वाग्रह और निरंतरता के बारे में अभी भी कई सवाल हैं, जिन्हें संबोधित करना मुश्किल हो सकता है और एक "विशेष विश्लेषण" से बचकर नहीं चलेगा।
व्ह्यूबर

2

एक सांख्यिकीविद् के रूप में जिन्होंने अभी-अभी शादी की है, मैं आपको बताता हूं कि जोटेक्पेयर का सही उत्तर है। 80% का आंकड़ा मुझे थोड़ा ऊँचा बनाता है, हालाँकि यह सटीक हो सकता है कि अधिकांश लोग स्थानीय हैं (हमारी मंजिल शादी थी और हम 65% के करीब आ गए)।

लेकिन फिर भी, आप पूर्व संभाव्यताओं में बहुत अधिक परिवर्तनशीलता मान रहे हैं जो लोग भाग लेते हैं, मुझे लगता है कि वास्तव में मौजूद है। यह मानते हुए कि आप ऐसे लोगों को आमंत्रित नहीं करते हैं जो आपको सक्रिय रूप से नापसंद करते हैं, आपको यह मान लेना चाहिए कि हर किसी के बारे में वही होगा जिनके लिए यह उनके साधन के भीतर है और उनके पास संघर्ष नहीं है (व्यापक अर्थ में), लेकिन कम से कम 10-20% कुछ होगा जो उन्हें भाग लेने से रहता है। जिन लोगों को यात्रा करनी है, उनके लिए समय और धन की आवश्यकता बढ़ जाती है, इसलिए 30-35% यात्री भाग नहीं लेंगे (दूरी के आधार पर)। अन्यथा, संभावनाओं को स्थिर रखें (भले ही आपके माता-पिता कहते हैं "ओह-और-तो ऑस्टिन के लिए सभी तरह से नहीं उड़ेंगे, हम सिर्फ उन्हें आमंत्रित करना चाहते हैं ...")। यदि आप एक मजेदार स्वागत कर रहे हैं, विशेष रूप से एक खुले बार के साथ, लोग आम तौर पर इसे छोड़ नहीं देंगे जब तक कि उन्हें नहीं करना है।

वैसे भी शादी की बधाई। अब इस संभावना के अनुसार कि आप शादीशुदा रहें, यह हमेशा एक अच्छा पढ़ा जाता है: http://users.nber.org/~bstevens/papers/Marital_Stability.pdf

:-)


1

सभी संभावनाएं जोड़ें, यही आपके आने वाले लोगों की अपेक्षित संख्या है।

पीमैंΣमैं1मैंपीमैं1मैं

बेशक, हम यह मान रहे हैं कि कोई व्यक्ति आता है या नहीं, अन्य लोगों की उपस्थिति पर निर्भर नहीं करता है। यह धारणा बस गलत है। जोड़ों पर विचार करें, वे अत्यधिक सहसंबद्ध हैं।

2×1मैंपीमैंपीमैं


1

अपनी शादी के लिए, मैंने दो सूचियाँ बनाईं - जिसमें भाग लेने की संभावना (and०%) और अटेंड करने की संभावना (२०%)। किसी भी कारण से अधिक परिष्कृत मूल्यांकन के बावजूद, मैंने सभी को दो समूहों में से एक को आमंत्रित किया। मैं 2 लोगों से दूर था। एन = 1. विशुद्ध रूप से हेयुरिस्टिक।


क्या मैं पूछ सकता हूँ? अंतिम% मतदान क्या था?
JTP -

72% ने हां में जवाब दिया, लेकिन मैं यह भूल जाता हूं कि कितने दिन रद्द हैं।
माइकललार्निओल

0

मैंने देखा कि किसी ने भी यह नहीं बताया है कि आपको 100 से विभाजित करने की आवश्यकता नहीं है। आपके प्रतिशत को किसी व्यक्ति के अपेक्षित भागों के रूप में देखा जा सकता है, यह समझने के साथ कि, श्रोडिंगर की बिल्ली की तरह, आपको किसी व्यक्ति के हिस्से नहीं मिलेंगे। उपस्थिति में या उपस्थिति में नहीं, लेकिन प्रत्येक व्यक्ति की उपस्थिति स्थिति पूरी तरह से घटना के क्षण में हल हो जाएगी।

चूंकि आपके प्रतिशत की सीमा 0% (कोई भी व्यक्ति जो दिखा रहा है) से लेकर 100% (सभी व्यक्ति जो दिखा रहा है) तक चलती है, आपके दो उदाहरणों में 10 और 20 लोग शामिल हैं, आपने प्रत्येक के हिस्से के लिए अपेक्षित मूल्य को अभिव्यक्त किया है व्यक्ति को दिखाने के लिए, और एक नंबर मिला जिसकी इकाइयाँ "लोग" थीं।

क्वांटिबेक के शानदार जवाब में प्रमुख समीकरण यह दर्शाता है कि घटना में अपेक्षित संख्या में प्रतिशत परिणाम का योग होता है, इसमें कोई विभाजन शामिल नहीं होता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.