कृपया पायथन 2 के लिए निम्नलिखित पायथन-लिपि देखें।
उत्तर डेविड सी के उत्तर से प्रेरित है।
मेरा अंतिम उत्तर होगा, https://www.ssa.gov/oact/babynames/limits.html "नेशनल डेटा" के आंकड़ों के अनुसार जैकब को एक कक्षा में कम से कम पांच जैकब मिलने की संभावना, सबसे संभावित नाम है। “2006 से।
संभावना की गणना एक द्विपद वितरण के अनुसार की जाती है जिसमें जैकब-प्रायिकता सफलता की संभावना है।
import pandas as pd
from scipy.stats import binom
data = pd.read_csv(r"yob2006.txt", header=None, names=["Name", "Sex", "Count"])
# count of children in the dataset:
sumCount = data.Count.sum()
# do calculation for every name:
for i, row in data.iterrows():
# relative counts of each name being interpreted as probabily of occurrence
data.loc[i, "probability"] = data.loc[i, "Count"]/float(sumCount)
# Probabilites being five or more children with that name in a class of size n=25,50 or 100
data.loc[i, "atleast5_class25"] = 1 - binom.cdf(4,25,data.loc[i, "probability"])
data.loc[i, "atleast5_class50"] = 1 - binom.cdf(4,50,data.loc[i, "probability"])
data.loc[i, "atleast5_class100"] = 1 - binom.cdf(4,100,data.loc[i, "probability"])
maxP25 = data["atleast5_class25"].max()
maxP50 = data["atleast5_class50"].max()
maxP100 = data["atleast5_class100"].max()
print ("""Max. probability for at least five kids with same name out of 25: {:.2} for name {}"""
.format(maxP25, data.loc[data.atleast5_class25==maxP25,"Name"].values[0]))
print
print ("""Max. probability for at least five kids with same name out of 50: {:.2} for name {}, of course."""
.format(maxP50, data.loc[data.atleast5_class50==maxP50,"Name"].values[0]))
print
print ("""Max. probability for at least five kids with same name out of 100: {:.2} for name {}, of course."""
.format(maxP100, data.loc[data.atleast5_class100==maxP100,"Name"].values[0]))
मैक्स। जेक नाम के लिए 25: 4.7e-07 में से एक ही नाम वाले कम से कम पांच बच्चों के लिए संभावना
मैक्स। 50 में से एक ही नाम वाले कम से कम पांच बच्चों के लिए संभावना: जैक-नाम के लिए 1.6e-05, बिल्कुल।
मैक्स। 100 में से एक ही नाम वाले कम से कम पांच बच्चों के लिए संभावना: नाम के जैकब के लिए 0.00045, बिल्कुल।
डेविड सी के रूप में 10 समान परिणाम के कारक द्वारा। धन्यवाद। (मेरे उत्तर में सभी नामों का योग नहीं है, चर्चा की जानी चाहिए)