सांख्यिकी अवधारणा की व्याख्या करने के लिए कि आपको कम संख्या में सिर को पूंछ के रूप में फ्लिप करने की संभावना क्यों है, क्योंकि फ़्लिप की संख्या बढ़ जाती है?


28

मैं कुछ किताबें पढ़कर और कुछ कोड लिखकर संभाव्यता और सांख्यिकी सीखने पर काम कर रहा हूं, और सिक्का फ्लिप्स का अनुकरण करते समय मैंने कुछ ऐसा देखा जो मुझे किसी के भोले अंतर्ज्ञान से थोड़ा काउंटर करता है। यदि आप एक उचित सिक्के को बार फ्लिप करते हैं , तो पूंछ के शीर्षों का अनुपात रूप में 1 की ओर बढ़ता है, ठीक उसी तरह जैसे आप उम्मीद करेंगे। लेकिन दूसरी ओर, जैसे-जैसे बढ़ता है, यह प्रतीत होता है कि आप पूंछ के समान ठीक उसी संख्या में फ्लिप करने की संभावना कम हो जाते हैं, जिससे ठीक 1 का अनुपात प्राप्त होता हैnnn

उदाहरण के लिए (मेरे कार्यक्रम से कुछ आउटपुट)

For 100 flips, it took 27 experiments until we got an exact match (50 HEADS, 50 TAILS)
For 500 flips, it took 27 experiments until we got an exact match (250 HEADS, 250 TAILS)
For 1000 flips, it took 11 experiments until we got an exact match (500 HEADS, 500 TAILS)
For 5000 flips, it took 31 experiments until we got an exact match (2500 HEADS, 2500 TAILS)
For 10000 flips, it took 38 experiments until we got an exact match (5000 HEADS, 5000 TAILS)
For 20000 flips, it took 69 experiments until we got an exact match (10000 HEADS, 10000 TAILS)
For 80000 flips, it took 5 experiments until we got an exact match (40000 HEADS, 40000 TAILS)
For 100000 flips, it took 86 experiments until we got an exact match (50000 HEADS, 50000 TAILS)
For 200000 flips, it took 96 experiments until we got an exact match (100000 HEADS, 100000 TAILS)
For 500000 flips, it took 637 experiments until we got an exact match (250000 HEADS, 250000 TAILS)
For 1000000 flips, it took 3009 experiments until we got an exact match (500000 HEADS, 500000 TAILS)

मेरा प्रश्न यह है: क्या सांख्यिकी / संभाव्यता सिद्धांत में कोई अवधारणा / सिद्धांत है जो यह बताता है? यदि हां, तो यह किस सिद्धांत / अवधारणा है?

यदि किसी ने यह देखने के लिए दिलचस्पी जताई कि मैंने इसे कैसे बनाया है, तो कोड से लिंक करें।

- संपादित करें -

इसके लायक क्या है, यहां मैं पहले खुद को यह कैसे समझा रहा था। यदि आप एक उचित सिक्का और प्रमुखों की संख्या की गणना करते हैं, तो आप मूल रूप से एक यादृच्छिक संख्या उत्पन्न कर रहे हैं। इसी तरह यदि आप एक ही काम करते हैं और पूंछ की गिनती करते हैं, तो आप एक यादृच्छिक संख्या भी उत्पन्न कर रहे हैं। इसलिए यदि आप दोनों को गिनते हैं, तो आप वास्तव में दो यादृच्छिक संख्याएँ उत्पन्न कर रहे हैं, और जैसा कि बड़ा हो रहा है, यादृच्छिक संख्याएँ बड़ी हो रही हैं। और जितने बड़े रैंडम नंबर आप उत्पन्न करते हैं, उतने ही अधिक मौके उनके लिए एक दूसरे को "मिस" करने के होते हैं। यह दिलचस्प बनाता है कि दो नंबर वास्तव में एक अर्थ में जुड़े हुए हैं, उनका अनुपात एक की ओर परिवर्तित होने के साथ-साथ वे बड़े होते जाते हैं, भले ही प्रत्येक संख्या अलगाव में यादृच्छिक हो। शायद यह सिर्फ मेरे लिए है, लेकिन मुझे लगता है कि नीट की तरह nnn


क्या आप सहज या गणितीय स्पष्टीकरण चाहते हैं?
Glen_b -Reinstate मोनिका

1
दोनों, सच में। मुझे लगता है कि मैं एक तरह से एक सहज ज्ञान युक्त अर्थ में कारण समझते हैं, लेकिन मैं इसके पीछे औपचारिक तर्क को समझने के लिए चाहते हैं।
माइंडक्राइम

1
क्या आप जानते हैं कि द्विपद संभावनाओं की गणना कैसे करें और उन्हें इस स्थिति में लागू करें? यदि नहीं, तो इसे देखें, और गणना का काम करें।
मार्क एल। स्टोन

वाह, इस प्रश्न के कई अच्छे उत्तर हैं। मुझे एक को स्वीकार करने में बुरा लगता है और दूसरे को नहीं। मुझे सिर्फ इतना कहना है कि मैं सभी उत्तरों और उन सभी की सराहना करता हूं जिन्होंने इस पर अपनी अंतर्दृष्टि साझा करने के लिए समय लिया।
माइंडक्राइम

जवाबों:


31

ध्यान दें कि मामला जहां सिर की संख्या और पूंछ की संख्या समान है, "ठीक उसी समय जब आप सिर प्राप्त करते हैं"। तो चलो यह देखने के लिए कि यह आधी संख्या है या समकक्षों की तुलना सिर के अनुपात में 0.5 है या नहीं, यह देखने के लिए सिर की संख्या गिनें।

जितना अधिक आप फ्लिप करते हैं, आपके पास प्रमुखों की संभावित संख्याओं की संख्या जितनी अधिक होगी - वितरण और अधिक फैलता जाता है (उदाहरण के लिए 95% युक्त हेड्स की संख्या के लिए एक अंतराल व्यापक रूप से बढ़ेगा, क्योंकि टॉस की संख्या बढ़ जाती है) , इसलिए आधे सिर की संभावना कम हो जाएगी क्योंकि हम और अधिक टॉस करेंगे।

इसके विपरीत, सिर का अनुपात अधिक संभव मान लेगा; यहां देखें, जहां हम 100 टोस से 200 टोस तक जाते हैं:

यहाँ छवि विवरण दर्ज करें

100 टोज़ के साथ हम 0.49 हेड या 0.50 हेड या 0.51 हेड (और इतने पर - लेकिन उन मानों के बीच में कुछ भी नहीं) के अनुपात का निरीक्षण कर सकते हैं, लेकिन 200 टॉस्क के साथ, हम 0.49 या 0.495 या 0.50 या 0.505 या 0.510 का निरीक्षण कर सकते हैं - संभाव्यता में "कवर" करने के लिए अधिक मूल्य हैं और इसलिए प्रत्येक को एक छोटा हिस्सा मिलेगा।

की तुलना में आप पर विचार करें कुछ संभावना के साथ उछालों पी मैं होने का मैं सिर (हम इन संभावनाओं को पता है, लेकिन यह इस हिस्से के लिए महत्वपूर्ण नहीं है), और आप दो और उछालों जोड़ें। में 2 n उछालों, एन सिर सबसे अधिक संभावना परिणाम है ( पी एन > पी एन ± 1 और वहाँ से नीचे चला जाता है)।2npii2nnpn>pn±1

2 n + 2 tosses में सिर होने की संभावना क्या है ?n+12n+2

(इन संभावनाओं को साथ लेबल करें ताकि हम उन्हें पिछले वाले के साथ भ्रमित न करें; पी (एचएच) को अगले दो टॉस में "हेड, हेड" की संभावना होने दें, और इसी तरह)q

qn+1=pn1P(HH)+pn(P(HT)+P(TH))+pn+1P(TT)

<pnP(HH)+pn(P(HT)+P(TH))+pnP(TT)=pn

यदि आप दो और सिक्के-टॉस जोड़ते हैं, तो मध्य मूल्य की संभावना स्वाभाविक रूप से कम हो जाती है क्योंकि यह दोनों पक्षों के छोटे मूल्यों के औसत के साथ सबसे अधिक संभावना (मध्य) मूल्य का औसत है)

तो जब तक आप सहज हैं कि चोटी मध्य में होगी ( ), वास्तव में आधा सिर की संभावना के रूप में कम हो जाना चाहिए n चला जाता है।2n=2,4,6,...n


वास्तव में हम दिखा सकते हैं कि बड़े , p n 1 के साथ आनुपातिक रूप से घट जाती हैnpn (आश्चर्यजनक रूप से, सिर के मानकीकृत संख्या के वितरण के बाद सामान्यता आ जाती है और सिर के अनुपात का विचरणn केसाथ कम हो जाता है)।1nn


जैसा कि अनुरोध किया गया है, यहां आर कोड है जो उपरोक्त भूखंड के करीब कुछ उत्पादन करता है:

 x1 = 25:75
 x2 = 50:150
 plot(x1 / 100, dbinom(x1, 100, 0.5), type = "h",
       main = "Proportion of heads in 100 and 200 tosses",
       xlab = "Proportion of heads",
       ylab = "probability")
 points(x2 / 200, dbinom(x2, 200, 0.5), type = "h", col = 3)

1
मैं आपके ग्राफिक के 1000-शब्द-नेस के ऊपर @RustyStatistician के साथ हूं। कोड के लिए पॉइंटर के लिए अतिरिक्त क्रेडिट।
टॉमरॉच

बहुत बढ़िया आंकड़ा और स्पष्टीकरण!

@ मैं ऐसा कोड शामिल करता हूं जो शीर्षक 200 में "हरे" को छोड़कर सब कुछ करता है।
Glen_b -Reinstate मोनिका

1
@Glen_b अभी तक एक और महान पोस्ट, और कोड लाइनों को साझा करने की उदारता के लिए धन्यवाद। सुंदर साजिश! इसे स्वीकार करना कठिन है, लेकिन मुझे आपकी पोस्ट में अवधारणा की गणितीय अभिव्यक्ति और विशेष रूप से ऊपरी-केस के उपयोग के साथ समस्या हो रही है । P
एंटोनी परेलाडा

1
@ एटन अर्थ है "दो अतिरिक्त टोकन पर " प्रमुख, प्रमुख 'प्राप्त करने की संभावना "। 2n + 2 tosses में n + 1 सिर प्राप्त करने के लिए, 2n tosses द्वारा आपने या तो n-1 सिर (और फिर 2 सिर) या n शीर्ष (और फिर 1 सिर फेंक दिया) या n + 1 सिर (और फिर उछाला गया होगा) 0 प्रमुख)। P(HH)
Glen_b -Reinstate Monica

19

वैसे हम जानते हैं कि बड़ी संख्याओं का कानून वह है जो आपके एक्सपीरिएंस के पहले निष्कर्ष की गारंटी देता है, अर्थात् यदि आप एक उचित सिक्का फ्लिप करते हैं बार, तो टेल्स के लिए सिर का अनुपात 1 के रूप में n बढ़ जाता है। nn

तो वहाँ कोई समस्या नहीं है। हालाँकि, लार्ज नंबर्स के सभी नियम हमें इस परिदृश्य में बताते हैं।

लेकिन अब, इस समस्या के बारे में अधिक सहजता से सोचें। एक सिक्के को छोटी संख्या में बार-बार फ़्लिप करने के बारे में सोचें, उदाहरण के लिए: n=2,4,8,10

जब आप एक सिक्का दो बार फ्लिप करते हैं, तो , दो फ़्लिप के संभावित परिदृश्यों के बारे में सोचें। (यहां एच सिर को निरूपित करेगा और टी पूंछ का संकेत देगा)। मुट्ठी फ्लिप पर आप एच प्राप्त कर सकते हैं और दूसरे फ्लिप पर आप टी प्राप्त कर सकते हैं । लेकिन यह सिर्फ एक ही तरीका है जिससे दोनों झड़ सकते हैं। आप पहले फ्लिप टी और दूसरे फ्लिप एच और अन्य सभी संभावित संयोजनों पर भी विचार कर सकते थे। इसलिए दिन के अंत में, जब आप 2 सिक्के फ्लिप करते हैं, तो संभव है कि आप दो फ़्लिप पर देख सकते हैं S = { H H , H T ,n=2HTHTTH और इसलिए एन = 2 सिक्कों कोफ़्लिप करने के लिए 4 संभावित परिदृश्य हैं।

S={HH,HT,TH,TT}
n=2

आप 4 सिक्के फ्लिप करने थे तो संयोजनों की संभावित संख्या आप देख सकते हैं होगा और इसलिए n = सिक्कों कोफ़्लिप करने के लिए १६ संभावित परिदृश्य हैं।

S={HHHH,HHHT,HHTH,HTHH,THHH,HHTT,HTTH,TTHH,THHT,THTH,HTHT,HTTT,THTT,TTHT,TTTH,TTTT}
n=4

Flipping सिक्के 256 संयोजन के लिए होता है।n=8

Flipping 1,024 संयोजन के लिए सिक्के सुराग।n=10

और विशेष रूप से, किसी भी संख्या सिक्कों को फ़्लिप करने से 2 n संभव संयोजन होते हैं।n2n

अब, आइए कोशिश करते हैं और इस समस्या को दृष्टिकोण के दृष्टिकोण से देखते हैं। के मामले में पीछे देखते हुए , हम जानते हैं कि हेड्स और टेल्स के बिल्कुल समान संख्या (यानी, जैसा कि आप इसे 1 के अनुपात में डालते हैं) की संभावना P r ( ठीक 1 का अनुपात ) हैn=2 जबn=4 होता है, तो हम जानते हैं कि हेड्स और टेल्स के समान संख्या में होने की संभावना Pr(ठीक 1 का अनुपात)= है

Pr(Ratio of exactly 1)=24=0.5
n=4
Pr(Ratio of exactly 1)=616=0.375

n

दूसरे शब्दों में, के रूप में , हम उस राशि पी आर ( वास्तव में 1 का अनुपात )n

Pr(Ratio of exactly 1)0

और इसलिए, आपके प्रश्न का उत्तर देने के लिए। वास्तव में आप जो देख रहे हैं, वह सिर्फ इस तथ्य का परिणाम है कि सिक्के के प्रवाह के कहीं अधिक संयोजन होंगे जहां संयोजन की संख्या की तुलना में सिर और पूंछ की संख्या समान नहीं है, जहां वे समान हैं।



जैसा कि @ मर्क एल स्टोन सुझाव देते हैं, यदि आप द्विपद सूत्र और द्विपद यादृच्छिक चर के साथ सहज हैं, तो आप उसी तर्क को दिखाने के लिए उपयोग कर सकते हैं।

XnXXBin(n,p=0.5)p=0.5 क्योंकि हम एक निष्पक्ष सिक्का साथ काम कर रहे) तो वास्तव में प्राप्त होने की संभाव्यता पूंछ की संख्या (यानी, ठीक 1 का अनुपात) के रूप में प्रमुखों की संख्या

Pr(Ratio of exactly 1)=Pr(X=n2)=(nn/2)0.5n/2(0.5)nn/2=(nn/2)0.5n

n(nn/2)0.5n0n


2
0.5n0n(nn/2)0.5n0n!0.5n0

@Glen_b मेरे पास आपकी पोस्ट पर टिप्पणी करने के लिए पर्याप्त अंक नहीं हैं, लेकिन भयानक ग्राफिक!

धन्यवाद @RustyStatistician, कि बहुत मदद करता है। आपके स्पष्टीकरण का पहला भाग उस तरीके से बहुत मेल खाता है जिस तरह से मैं इसके बारे में सोच रहा था, लेकिन मैं अभी तक अपने आँकड़ों के साथ काफी दूर नहीं हूं, यह जानने के लिए कि यह द्विपद वितरण का उपयोग करके कैसे काम करना है। मैंने मूल रूप से अपनी पुस्तक को एक बार पढ़ा, समस्याओं या किसी भी चीज पर काम नहीं किया और अब मैं सामग्री के विभिन्न पहलुओं का पता लगाने के लिए शुरुआत से ही लिख रहा हूं और कोड लिख रहा हूं।
माइंडक्राइम

@mindcrime बहुत अच्छा लगता है! मैं खुशी से मदद कर सकता है।

5

देख पास्कल त्रिभुज

सिक्का फ्लिप परिणामों की संभावना नीचे पंक्ति के साथ संख्याओं द्वारा दर्शाई गई है। बराबर सिर और पूंछ का परिणाम मध्य संख्या है। जैसे-जैसे पेड़ बड़ा होता है (यानी, अधिक झड़ जाता है), मध्य संख्या नीचे की पंक्ति के योग का एक छोटा अनुपात बन जाती है।


1

शायद यह रेखांकित करने में मदद करता है कि यह आर्क्सिन कानून से संबंधित है। इसमें कहा गया है कि सकारात्मक या नकारात्मक डोमेन में अधिकांश समय तक रहने की संभावना के परिणामों के एक मार्ग के लिए यह बहुत अधिक है कि आप अंतर्ज्ञान से अपेक्षा से अधिक और नीचे जा रहे हैं । यहाँ कुछ लिंक हैं:

http://www.math.unl.edu/~sdunbar1/ProbabilityTheory/Lessons/BernoulliTrials/ExcessHeads/excessheads.shtml

https://en.wikipedia.org/wiki/Arcsine_law


1

जबकि सिर से पूंछ तक का अनुपात 1 में परिवर्तित होता है, संभव संख्याओं की सीमा व्यापक हो जाती है। (मैं नंबर बना रहा हूं)। 100 के लिए कहो संभावना 90% है कि आप 45% और 55% प्रमुखों के बीच है। यह 90% है कि आपको 45 से 55 सिर मिलते हैं। प्रमुखों की संख्या के लिए 11 संभावनाएं। लगभग 9% मोटे तौर पर आपको समान संख्या में सिर और पूंछ मिलते हैं।

10,000 के लिए कहो संभावना 95% है जो आपको 49% और 51% के बीच मिलती है। तो अनुपात 1. के बहुत करीब आ गया है लेकिन अब आपके पास 4,900 और 5,100 सिर हैं। 201 संभावनाएं। समान संख्या की संभावना केवल लगभग 0.5% है।

और एक मिलियन थ्रो के साथ आपको 49.9% और 50.1% सिर के बीच का होना निश्चित है। यह 499,000 से लेकर 501,000 प्रमुखों तक की सीमा है। 2,001 संभावनाएं। मौका अब नीचे 0.05% है।

ठीक है, मैथ्स बनाया गया था। लेकिन यह आपको "क्यों" के बारे में एक विचार देना चाहिए। हालांकि अनुपात 1 के करीब आता है, संभावनाओं की संख्या अधिक हो जाता है, तो यह है कि मार वास्तव में आधा सिर, आधा पूंछ, और कम से कम हो जाता है की संभावना है।

एक और व्यावहारिक प्रभाव: यह व्यवहार में संभावना नहीं है कि आपके पास एक सिक्का है जहां सिर फेंकने की संभावना बिल्कुल 50% है। यदि आपके पास वास्तव में अच्छा सिक्का है तो यह 49.99371% हो सकता है। कम संख्या में फेंकता के लिए इससे कोई फर्क नहीं पड़ता। बड़ी संख्या के लिए, सिर का प्रतिशत 49.99371% तक पहुंच जाएगा, 50% नहीं। यदि फेंकता की संख्या काफी बड़ी है, तो 50% या अधिक सिर फेंकने की संभावना बहुत कम हो जाएगी।


0

ध्यान देने वाली एक बात यह है कि सम संख्या वाले फ़्लिप के साथ (अन्यथा बराबर सिर और पूंछ के फ़्लिप की संभावना बिल्कुल शून्य है), सबसे संभावित परिणाम हमेशा एक ही होगा, जैसे कई सिर फ़्लिप होते हैं।

n

(1+x2)n.
n
pn=2n(nn/2).

n!

p1πn/2
n/2n2n

2
np

0

मान लीजिए कि आपने एक सिक्का दो बार फ्लिप किया। चार संभावित परिणाम हैं: एचएच, एचटी, टीएच, और टीटी। इनमें से दो में, आपके पास समान संख्या में सिर और पूंछ हैं, इसलिए 50% संभावना है कि आपको समान संख्या में सिर और पूंछ मिलें।

अब मान लीजिए कि आपने एक सिक्का 4,306,492,102 बार फ्लिप किया है। आप 50 प्रतिशत संभावना है कि आप के साथ हवा जाएगा उम्मीद करते हैं कि वास्तव में +२१५३२४६०५१ सिर और २१५३२४६०५१ पूंछ?


नहीं, मेरे अंतर्ज्ञान ने मुझे बताया कि एक सटीक मिलान होने की संभावना कम थी, सिर्फ इसलिए कि संख्या बड़ी हो रही थी। लेकिन मैं अपने विचार की पुष्टि के लिए इसे अनुकरण करना चाहता था। जब मैंने देखा कि यह इस तरह से निकला है, तो मुझे इसके पीछे औपचारिक तर्क के रूप में समझा गया कि यह ऐसा क्यों है। यह मुझे दिलचस्प लगता है कि परिणामी अनुपात 1 की ओर परिवर्तित हो रहा है, साथ ही साथ कम होने की संभावना बन रही है 1.
माइंडक्राइम

3
इसके बारे में सोचने का एक तरीका यह है कि बड़े पैमाने पर n छोटे के लिए 50-50 के करीब होने के कई और तरीके हैं n
डैनियल मैक्लॉरी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.