सिक्कों को लहराने के लिए संभाव्यता की गंभीर समस्या


10

आइए कहते हैं कि मैं एक सिक्के के 10,000 फ़्लिप कर रहा हूं। मैं इस बात की प्रायिकता जानना चाहूंगा कि एक पंक्ति में लगातार 4 या अधिक सिर प्राप्त करने में कितने फ़्लिप होते हैं।

यह गिनती निम्नलिखित के रूप में काम करेगी, आप केवल एक ही सिर (4 सिर या अधिक) होने वाले फ़्लिप के एक क्रमिक दौर की गणना करेंगे। जब एक पूंछ टकराती है और सिर की लकीर टूट जाती है तो गिनती अगले फ्लिप से फिर से शुरू होगी। यह तब 10,000 फ़्लिप के लिए दोहराएगा।

मैं एक पंक्ति में केवल 4 या अधिक सिर की संभावना जानना चाहता हूं लेकिन, 6 या अधिक, और 10 या अधिक। यह स्पष्ट करने के लिए कि यदि 9 सिर की एक लकीर हासिल की जाती है तो इसे 1 लकीर 4 या अधिक (और / या 6 या अधिक) के रूप में लंबा किया जाएगा, न कि 2 अलग-अलग लकीरों से। उदाहरण के लिए यदि सिक्का THTHTHTHHHHH /// THAHTHT आया .... गिनती 13 होगी और एक बार फिर से अगली पूंछ पर शुरू होगी।

मान लीजिए कि डेटा दाईं ओर अत्यधिक तिरछा हो जाता है; औसतन 40 फ़्लिप होने पर औसतन 4 या उससे अधिक की एक लकीर को प्राप्त करने में मदद मिलती है, और वितरण u = 28 होता है। जाहिर है तिरछा।

मैं अपनी पूरी कोशिश कर रहा हूँ कि कुछ समझदार डेटा से बाहर निकलने का रास्ता खोज सकूँ, अब के अलावा मुझे कुछ भी नहीं मिला है।

मैं इसमें से कुछ समझदार संभावना प्राप्त करने का कोई तरीका खोजना चाहता हूं। एक सामान्य वक्र की तरह जहां +/- 1 एसडी 68% आदि है। मैंने लॉग को सामान्य बनाने में देखा है और यह केवल एक पैरामीट्रिक परीक्षण के लिए उपयोग किया जाता है जो मेरा लक्ष्य नहीं है।

मुझे बीटा डिस्ट्रीब्यूशन के बारे में बताया गया है, लेकिन मैंने जो सुझाव दिया है, वह काफी भ्रामक है। मैंने एक साल पहले यह सवाल पूछा था और मुझे कुछ जानकारी मिली लेकिन दुर्भाग्य से मेरे पास अभी भी इसका जवाब नहीं है। आप में से किसी के लिए धन्यवाद, जिसके पास विचार हैं।


मुझे शायद थोड़ा स्पष्ट करना चाहिए। 1) मैं तिरछे डेटा सेट से 1000 फ़्लिप (सामान्य वक्र प्रायिकता +/- 1 एसडी = 68% के समान कुछ के समान) में 4 से ऊपर लगातार सिर की मात्रा के वर्णनात्मक डेटा की समझ बनाने के लिए दूर देख रहा हूं। 2) बीटा वितरण का उपयोग करने की अनुशंसा की जाती है लेकिन कोई अन्य सुझाव बहुत अच्छा होगा!
डैन

1
डैन, मैंने अभी देखा कि आपके उदाहरण में सिर और पूंछ का सेट "ए" शामिल है।
Glen_b -Reinstate मोनिका

आपके द्वारा किया गया संपादन एक बड़ा सुधार है, लेकिन हमें कुछ और बदलाव करने की आवश्यकता है। जहां आप कहते हैं "और वितरण यू = 28" है, तो वास्तव में आपका क्या मतलब है? क्या आप मंझले की बात कर रहे हैं?
Glen_b -Reinstate मोनिका

@ बीटा केवल इस समस्या का कारक हो सकता है यदि आप बायेसियन दृष्टिकोण का उपयोग कर रहे हैं और एक प्रमुख की संभावना का अनुमान लगा रहे हैं, तो उस वितरण (और इससे जुड़ी अनिश्चितता) को आपके द्वारा बताई गई समस्या के गणितीय परिणाम में लागू करें।
एडमो

जवाबों:


12

यदि मैं सही ढंग से समझ गया हूं, तो समस्या उस समय के लिए एक संभाव्यता वितरण खोजने की है जिस पर या अधिक शीर्षों का पहला भाग समाप्त होता है।n

संपादित संभावनाओं सही ढंग से और जल्दी से निर्धारित किया जा सकता आव्यूह गुणन का उपयोग कर, और यह भी संभव है विश्लेषणात्मक गणना करने के लिए के रूप में मतलब और के रूप में विचरण जहां , लेकिन संभवतः वितरण के लिए केवल एक सरल बंद रूप नहीं है। सिक्के की एक निश्चित संख्या से अधिक होने पर, वितरण अनिवार्य रूप से एक ज्यामितीय वितरण होता है: यह बड़े लिए इस फॉर्म का उपयोग करने के लिए समझ में आता है ।σ 2 = 2 n + 2 ( μ - n - 3 ) - μ 2 + 5 μ μ = μ - + 1 टीμ=2n+11σ2=2n+2(μn3)μ2+5μμ=μ+1t

राज्य अंतरिक्ष में संभाव्यता वितरण के समय के विकास को राज्यों के लिए एक संक्रमण मैट्रिक्स का उपयोग करके मॉडलिंग की जा सकती है, जहां लगातार सिक्के की संख्या फ़्लिप होती है। राज्य इस प्रकार हैं:n =k=n+2n=

  • राज्य , कोई सिर नहींH0
  • स्टेट , हेड्स, मैं 1 मैं ( n - 1 )Hii1i(n1)
  • राज्य , या अधिक प्रमुख एनHnn
  • राज्य , या अधिक सिर जिसके बाद पूंछ होती है nHn

एक बार जब आप राज्य में तो आप किसी भी अन्य राज्य में वापस नहीं आ सकते।H

राज्यों में आने के लिए राज्य संक्रमण संभावनाएँ निम्नानुसार हैं

  • राज्य : संभावना से , , यानी खुद सहित, लेकिन राज्य नहींH0 एचआईi=0,,एन-1एचएन12Hii=0,,n1Hn
  • राज्य : से प्रायिकताHi एचi-112Hi1
  • राज्य : संभावना से साथ राज्य से, यानी सिर और खुदHn एचएन-1,एचएनएन-112Hn1,Hnn1
  • राज्य : से प्रायिकता और से संभाव्यता 1 (स्वयं)H एचएनएच12HnH

तो उदाहरण के लिए, , यह संक्रमण मैट्रिक्स देता हैn=4

X={H0H1H2H3H4HH01212121200H11200000H20120000H30012000H400012120H0000121}

केस , संभाव्यता के प्रारंभिक वेक्टर is । सामान्य तौर पर प्रारंभिक वेक्टर में p p = ( 1 , 0 , 0 , 0 , 0 , 0 ) p i = { 1 i = 0 0 i > 0n=4pp=(1,0,0,0,0,0)

pi={1i=00i>0

वेक्टर किसी भी समय के लिए अंतरिक्ष में संभाव्यता वितरण है । आवश्यक cdf समय में cdf है , और समय द्वारा कम से कम सिक्का फ़्लिप अंत में देखे जाने की संभावना है । इसे रूप में लिखा जा सकता है , यह देखते हुए कि हम निरंतर सिक्का फ़्लिप के चलने के बाद अंतिम अवस्था में 1 टाइमस्टेप पर पहुँचते हैं । एन टी ( एक्स टी + 1 पी ) कश्मीर एच *pnt(Xt+1p)kH

समय में आवश्यक pmf को रूप में लिखा जा सकता है । हालाँकि संख्यात्मक रूप से इसमें बहुत बड़ी संख्या ( ) से बहुत कम संख्या को और परिशुद्धता को सीमित करना शामिल है। इसलिए गणना में यह स्थापित करने के लिए बेहतर है बल्कि 1. फिर लिखने की तुलना में परिणामस्वरूप मैट्रिक्स के लिए , PMF है । यह वही है जो नीचे दिए गए सरल आर प्रोग्राम में लागू किया गया है, जो किसी भी लिए काम करता है ,1 एक्स कश्मीर , कश्मीर =(Xt+1p)k(Xtp)k1एक्स ' एक्स ' = एक्स | एक्स कश्मीर , कश्मीर = 0 ( एक्स ' टी + 1 पी ) कश्मीर n 2Xk,k=0XX=X|Xk,k=0(Xt+1p)kn2

n=4
k=n+2
X=matrix(c(rep(1,n),0,0, # first row
           rep(c(1,rep(0,k)),n-2), # to half-way thru penultimate row
           1,rep(0,k),1,1,rep(0,k-1),1,0), # replace 0 by 2 for cdf
         byrow=T,nrow=k)/2
X

t=10000
pt=rep(0,t) # probability at time t
pv=c(1,rep(0,k-1)) # probability vector
for(i in 1:(t+1)) {
  #pvk=pv[k]; # if calculating via cdf
  pv = X %*% pv;
  #pt[i-1]=pv[k]-pvk # if calculating via cdf
  pt[i-1]=pv[k] # if calculating pmf
}

m=sum((1:t)*pt)
v=sum((1:t)^2*pt)-m^2
c(m, v)

par(mfrow=c(3,1))
plot(pt[1:100],type="l")
plot(pt[10:110],type="l")
plot(pt[1010:1110],type="l")

ऊपरी भूखंड 0 और 100 के बीच pmf को दर्शाता है। निचले दो भूखंड 10 और 110 के बीच और 1010 और 1110 के बीच भी pmf दिखाते हैं, आत्म-समानता और इस तथ्य को दर्शाते हुए कि जैसा @Glen_b कहता है, वितरण ऐसा हो सकता है एक बसने के बाद एक ज्यामितीय वितरण द्वारा अनुमानित अवधि।

यहां छवि विवरण दर्ज करें

eigenvector अपघटन का उपयोग करके इस व्यवहार की आगे जांच करना संभव है । ऐसा करने से पता चलता है कि पर्याप्त रूप से बड़े , , जहाँ समीकरण का हल है । यह सन्निकटन में वृद्धि के साथ बेहतर हो जाता है और उत्कृष्ट के लिए है रेंज में लगभग 30 से 50 करने के लिए, के मूल्य के आधार , के रूप में की गणना के लिए नीचे लॉग त्रुटि की साजिश में दिखाया गया (इंद्रधनुष रंग, पर लाल लिए छोड़ दिया गयाटी पी टी + 1सी ( एन ) पी टी सी ( एन )Xtpt+1c(n)ptc(n)एन टी एन पी 100 एन = 2 टी2n+1cn(c1)+1=0ntnp100n=2)। (वास्तव में संख्यात्मक कारणों से, यह वास्तव में बेहतर होगा कि जब बड़ा हो तो संभावनाओं के लिए ज्यामितीय सन्निकटन का उपयोग करें ।)t

यहां छवि विवरण दर्ज करें

मुझे संदेह है कि (ईडी) वितरण के लिए एक बंद रूप उपलब्ध हो सकता है क्योंकि साधन और संस्करण जैसे मैंने उनकी गणना निम्नानुसार की है

nMeanVariance2724315144431736563339261271472072556169685112534409102310291201020474151296

(मुझे इसे t=100000प्राप्त करने के लिए समय क्षितिज तक संख्या को टक्कर देना पड़ा लेकिन कार्यक्रम अभी भी सभी बारे में 10 सेकंड से कम समय के लिए चला।) विशेष रूप से साधन एक बहुत स्पष्ट पैटर्न का पालन करते हैं; वैरिएन्स कम हैं। मैंने अतीत में एक सरल, 3-राज्य संक्रमण प्रणाली को हल किया है, लेकिन अभी तक मुझे इस पर एक सरल विश्लेषणात्मक समाधान के साथ कोई भाग्य नहीं है। शायद वहाँ कुछ उपयोगी सिद्धांत है कि मैं के बारे में पता नहीं कर रहा हूँ, जैसे संक्रमण matrices से संबंधित।n=2,,10

संपादित करें : बहुत सी झूठी शुरुआत के बाद मैं एक पुनरावृत्ति सूत्र के साथ आया था। चलो में राज्य किया जा रहा है की संभावना हो समय में । बता दें कि राज्य , यानी अंतिम स्थिति, समय होने की संचयी संभावना है । एनबीpi,tHitq,tHt

  • किसी भी दिए गए , और लिए स्थान पर संभाव्यता वितरण है , और तुरंत नीचे मैं इस तथ्य का उपयोग करता हूं कि उनकी संभावनाएं 1 में जुड़ती हैं।tpi,t,0inq,ti
  • p,t समय पर एक प्रायिकता वितरण का निर्माण करता । बाद में, मैं इस तथ्य का उपयोग साधनों और भिन्नताओं को प्राप्त करने में करता हूं।t

समय पर पहला राज्य होने की संभावना , अर्थात कोई प्रमुख नहीं है, राज्यों द्वारा संक्रमण की संभावनाओं द्वारा दी जाती है जो समय (कुल संभावना के प्रमेय का उपयोग करके) से इसे वापस कर सकते हैं । लेकिन राज्य से प्राप्त करने के लिए को लेता है कदम, इसलिए और एक बार फिर कुल संभावना के प्रमेय द्वारा प्रायिकता की संभावना परt+1tएच0

p0,t+1=12p0,t+12p1,t+12pn1,t=12i=0n1pi,t=12(1pn,tq,t)
H0Hn1n1pn1,t+n1=12n1p0,t
pn1,t+n=12n(1pn,tq,t)
Hnसमय पर is और इस तथ्य का उपयोग करते हुए कि , इसलिए, , बदलकरt+1
pn,t+1=12pn,t+12pn1,t=12pn,t+12n+1(1pn,tnq,tn)()
q,t+1q,t=12pn,tpn,t=2q,t+12q,t
2q,t+22q,t+1=q,t+1q,t+12n+1(12q,tn+1+q,tn)
tt+n
2q,t+n+23q,t+n+1+q,t+n+12nq,t+112n+1q,t12n+1=0

यह पुनरावृत्ति सूत्र मामलों और लिए जाँच करता है । उदाहरण के लिए इस फॉर्मूले का एक प्लॉट मशीन ऑर्डर सटीकता देता है।n=4n=6n=6t=1:994;v=2*q[t+8]-3*q[t+7]+q[t+6]+q[t+1]/2**6-q[t]/2**7-1/2**7

यहां छवि विवरण दर्ज करें

संपादित करें मैं नहीं देख सकता कि इस पुनरावृत्ति संबंध से एक बंद रूप खोजने के लिए कहां जाना है। हालांकि, यह है मतलब के लिए एक बंद फार्म पाने के लिए संभव।

से शुरू , और उस , से तक रकम लेना और माध्य लिए सूत्र लागू करना और उस नोट करना। वितरण संभावना देता है ()p,t+1=12pn,t

pn,t+1=12pn,t+12n+1(1pn,tnq,tn)()2n+1(2p,t+n+2p,t+n+1)+2p,t+1=1q,t
t=0E[X]=x=0(1F(x))p,t
2n+1t=0(2p,t+n+2p,t+n+1)+2t=0p,t+1=t=0(1q,t)2n+1(2(112n+1)1)+2=μ2n+1=μ
यह राज्य तक पहुंचने का मतलब है ; सिर के रन के अंत के लिए इसका मतलब इससे कम है।H

सूत्र का उपयोग करके समान दृष्टिकोण संपादित करेंइस सवाल से विचरण पैदा होता है। E[X2]=x=0(2x+1)(1F(x))

t=0(2t+1)(2n+1(2p,t+n+2p,t+n+1)+2p,t+1)=t=0(2t+1)(1q,t)2t=0t(2n+1(2p,t+n+2p,t+n+1)+2p,t+1)+μ=σ2+μ22n+2(2(μ(n+2)+12n+1)(μ(n+1)))+4(μ1)+μ=σ2+μ22n+2(2(μ(n+2))(μ(n+1)))+5μ=σ2+μ22n+2(μn3)+5μ=σ2+μ22n+2(μn3)μ2+5μ=σ2

साधन और संस्करण आसानी से प्रोग्रामेटिक रूप से उत्पन्न किए जा सकते हैं। उदाहरण के लिए उपयोग के ऊपर की मेज से साधन और प्रकार की जांच करने के लिए

n=2:10
m=c(0,2**(n+1))
v=2**(n+2)*(m[n]-n-3) + 5*m[n] - m[n]^2

अंत में, मुझे यकीन नहीं है कि जब आप लिखे थे तब आप क्या चाहते थे

जब पूंछ टकराती है और सिर की लकीर टूट जाती है तो गिनती अगले फ्लिप से फिर से शुरू होगी।

यदि आपका मतलब है कि अगली बार के लिए प्रायिकता वितरण क्या है जिस पर या अधिक हेड का पहला रन समाप्त होता है, तो महत्वपूर्ण बिंदु इस टिप्पणी में @Glen_b द्वारा समाहित है , जो यह है कि प्रक्रिया एक पूंछ के बाद फिर से शुरू होती है (cf प्रारंभिक समस्या जहां आपको तुरंत या अधिक सिर का रन मिल सकता है )।nn

इसका मतलब यह है कि, उदाहरण के लिए, पहली घटना के लिए औसत समय , लेकिन घटनाओं के बीच औसत समय हमेशा (विचरण समान है)। सिस्टम के "व्यवस्थित" होने के बाद राज्य में होने की दीर्घकालिक संभावनाओं की जांच के लिए एक संक्रमण मैट्रिक्स का उपयोग करना भी संभव है। उपयुक्त संक्रमण मैट्रिक्स प्राप्त करने के लिए, और ताकि सिस्टम से राज्य पर तुरंत वापस । फिर इस नए मैट्रिक्स के पहले आइगेनवेक्टर को स्थिर संभावनाएं मिलती हैं । साथ इन स्थिर संभावनाओं हैंμ1μ+1Xk,k,=0X1,k=1H0Hn=4

एच*=1/0.03030303=33=μ+1

probabilityH00.48484848H10.24242424H20.12121212H30.06060606H40.06060606H0.03030303
राज्यों के बीच अपेक्षित समय संभावना के पारस्परिक द्वारा दिया जाता है। तो विज़िट के बीच अपेक्षित समय ।H=1/0.03030303=33=μ+1

परिशिष्ट : पायथन कार्यक्रम का उपयोग tosses nपर लगातार सिर की = संख्या के लिए सटीक संभावनाएं उत्पन्न करने के लिए किया जाता है N

import itertools, pylab

def countinlist(n, N):
    count = [0] * N
    sub = 'h'*n+'t'
    for string in itertools.imap(''.join, itertools.product('ht', repeat=N+1)):
        f = string.find(sub)
        if (f>=0):
            f = f + n -1 # don't count t, and index in count from zero 
            count[f] = count[f] +1
            # uncomment the following line to print all matches
            # print "found at", f+1, "in", string
    return count, 1/float((2**(N+1)))

n = 4
N = 24
counts, probperevent = countinlist(n,N)
probs = [count*probperevent for count in counts]

for i in range(N):
    print '{0:2d} {1:.10f}'.format(i+1,probs[i]) 
pylab.title('Probabilities of getting {0} consecutive heads in {1} tosses'.format(n, N))
pylab.xlabel('toss')
pylab.ylabel('probability')
pylab.plot(range(1,(N+1)), probs, 'o')
pylab.show()

7

मुझे यकीन नहीं है कि बीटा इस समस्या से निपटने के तरीके के रूप में विशेष रूप से उपयुक्त होगा - "जब तक नाटकों की संख्या ..." स्पष्ट रूप से एक गिनती है। यह एक पूर्णांक है, और उन मूल्यों पर कोई ऊपरी सीमा नहीं है जहां आपको सकारात्मक संभावना मिलती है।

इसके विपरीत बीटा वितरण निरंतर है, और एक बंधे अंतराल पर, इसलिए यह एक असामान्य विकल्प प्रतीत होगा। यदि आप एक स्केल किए गए बीटा से मेल खाते हैं, तो संचयी वितरण फ़ंक्शन संभवतः वितरण के केंद्रीय निकाय में इतनी बुरी तरह से अनुमानित नहीं हो सकते हैं। हालांकि, कुछ अन्य विकल्प में या तो पूंछ में काफी बेहतर होने की संभावना है।

यदि आपके पास वितरण से संभाव्यता या सिमुलेशन के लिए या तो एक अभिव्यक्ति है (जो कि आपको एक अनुमानित बीटा खोजने के लिए जरूरी है), तो आप सीधे उन का उपयोग क्यों नहीं करेंगे?


यदि आपकी रुचि संभावनाओं के लिए अभिव्यक्ति खोजने में है या अपेक्षित संख्या में टॉस की संभावना का वितरण है, तो संभवतया सबसे सरल विचार संभाव्यता उत्पन्न करने वाले कार्यों के साथ काम करना है। ये संभाव्यता के बीच पुनरावर्ती संबंधों से कार्यों को प्राप्त करने के लिए उपयोगी होते हैं, जो कार्य (पीजीएफ) बदले में हमें जो भी संभवताएं निकालने की अनुमति देते हैं वे आवश्यक हैं।

यहाँ बीजगणितीय दृष्टिकोण लेते हुए एक अच्छा उत्तर दिया गया है, जो दोनों कठिनाइयों की व्याख्या करता है और pgfs और आवर्ती संबंधों का अच्छा उपयोग करता है। यह "एक पंक्ति में दो सफलताओं" मामले में माध्य और विचरण के लिए विशिष्ट अभिव्यक्ति है:

/math/73758/probability-of-n-successes-in-a-row-at-the-k-th-bernoulli-trial-geometric

चार सफलताओं का मामला निश्चित रूप से अधिक कठिन होगा। दूसरी ओर, कुछ चीजों को सरल करता है।p=12

-

यदि आप केवल संख्यात्मक उत्तर चाहते हैं, तो अनुकरण अपेक्षाकृत सरल है। प्रायिकता का अनुमान सीधे इस्तेमाल किया जा सकता है, या वैकल्पिक रूप से यह नकली संभावनाओं को सुचारू करने के लिए उचित होगा।

यदि आपको एक अनुमानित वितरण का उपयोग करना चाहिए, तो आप संभवतः कुछ ऐसा चुन सकते हैं जो बहुत अच्छा करता है।

यह संभव है कि नकारात्मक द्विपद ('परीक्षणों की संख्या' के बजाय 'सफलताओं की संख्या' संस्करण) का मिश्रण उचित हो। दो या तीन घटकों से अपेक्षा की जानी चाहिए कि वे सभी में एक अच्छा सन्निकटन दें, लेकिन अत्यधिक पूंछ।

यदि आप सन्निकटन के लिए एक ही निरंतर वितरण चाहते हैं, तो बीटा वितरण की तुलना में बेहतर विकल्प हो सकते हैं; यह जांच के लिए कुछ होगा।


ठीक है, मैंने थोड़ा बीजगणित किया है, कुछ पुनरावृत्ति संबंधों के साथ खेल रहा हूं, कुछ अनुकरण और यहां तक ​​कि थोड़ी सोच भी।

एक बहुत अच्छे सन्निकटन के लिए, मुझे लगता है कि आप पहले चार नॉनज़रो संभावनाओं (जो आसान है) को निर्दिष्ट करने के साथ दूर हो सकते हैं, पुनरावृत्ति के माध्यम से पुनरावृत्ति के माध्यम से मानों के अगले कुछ मुट्ठी भर की गणना करना और फिर एक बार ज्यामितीय पूंछ का उपयोग करना। शुरू में संभावनाओं की कम चिकनी प्रगति को सुचारू किया।

ऐसा लगता है कि आप ज्यामितीय पूंछ को k = 20 से बहुत अधिक सटीकता के साथ उपयोग कर सकते हैं, हालांकि यदि आप केवल 4 आंकड़ा सटीकता के बारे में चिंतित हैं तो आप इसे पहले ला सकते हैं।

यह आपको पीडीएफ और cdf को अच्छी सटीकता के साथ गणना करने देना चाहिए।

मैं थोड़ा चिंतित हूं - मेरी गणना बताती है कि टॉस की औसत संख्या 30.0 है, और मानक विचलन 27.1 है; अगर मुझे समझ में आया कि "x" और "u" से आपका क्या मतलब है, तो आपको अपने टॉस में 40 और 28 मिले। 28 ठीक लग रहा है, लेकिन 40 जो मुझे मिला उससे काफी दूर लगता है ... जिससे मुझे चिंता होती है कि मैंने कुछ गलत किया है।

====

नोट: पहली बार और बाद के समय के बीच की जटिलताओं को देखते हुए, मैं अभी पूरी तरह से निश्चित होना चाहता हूं कि हम एक ही चीज की गिनती कर रहे हैं।

यहाँ एक छोटा अनुक्रम है, जिसमें '4 या अधिक H' अनुक्रमों के सिरों को चिह्नित किया गया है (अंतिम H के तुरंत बाद फ़्लिप के बीच के अंतर की ओर इशारा करते हुए)

       \/                     \/
TTHHHHHHTTHTTTTTHHTTHTTHHTHHHHHT...
       /\                     /\

उन दो निशानों के बीच मैं 23 झलकों को गिनता हूँ; जैसे ही (इस मामले में 6) एच के छोर के पिछले अनुक्रम के रूप में, हम तुरंत टी के बाद की गिनती शुरू करते हैं और फिर हम 5 एच के अनुक्रम के अंत में गिनती करते हैं (इस मामले में) जो अगले अनुक्रम को समाप्त करता है इस मामले में 23 की गिनती दे रहा है।

यह है कि आप उन्हें कैसे गिनते हैं?


उपरोक्त को देखते हुए यह सही है, कम से कम 4 शीर्षों में से एक रन के बाद टॉस की संख्या की संभावना कार्य पूरा हो जाता है जब तक कि कम से कम 4 सिर का अगला भाग पूरा न हो जाए:

सिक्के की जांच

पहली नज़र में ऐसा लगता है कि यह पहले कुछ मूल्यों के लिए सपाट है, फिर एक ज्यामितीय पूंछ है, लेकिन यह धारणा बिल्कुल सटीक नहीं है - एक प्रभावी ज्यामितीय पूंछ के लिए बसने में थोड़ा समय लगता है।

मैं एक उपयुक्त सन्निकटन के साथ आने पर काम कर रहा हूं जिसका उपयोग आप इस प्रक्रिया से जुड़ी संभावनाओं के बारे में जो भी प्रश्न कर सकते हैं, वह इस प्रक्रिया से जुड़ी अच्छी सटीकता के लिए है जो एक ही समय में यथासंभव सरल है। मेरे पास एक बहुत अच्छा सन्निकटन है जो काम करना चाहिए (कि मैंने पहले ही एक बिलियन सिक्के के सिक्के के अनुकरण के खिलाफ जांच की है) लेकिन संभाव्यता में कुछ (छोटे लेकिन सुसंगत) पूर्वाग्रह हैं जो सन्निकटन रेंज के हिस्से में देता है और मैं चाहूंगा देखें कि क्या मैं इससे अधिक सटीकता का अतिरिक्त अंक प्राप्त कर सकता हूं।

यह हो सकता है कि ऐसा करने का सबसे अच्छा तरीका यह है कि बस आपको प्रायिकता फ़ंक्शन की एक तालिका दी जाए और एक बिंदु तक सीएफडी से आगे बढ़ाया जाए, जहां एक ज्यामितीय वितरण का उपयोग किया जा सके।

हालाँकि, यह मदद करेगा यदि आप उन चीजों की श्रेणी का कुछ विचार दे सकते हैं जिनके लिए आपको सन्निकटन का उपयोग करने की आवश्यकता है।


मुझे उम्मीद है कि pgf के दृष्टिकोण के माध्यम से अनुसरण किया जा सकता है, लेकिन यह संभव है कि कोई और मेरे साथ उनसे अधिक कुशल होगा और केवल 4-केस ही नहीं बल्कि अन्य मामले भी कर सकता है।


आगे की बातें शायद स्पष्ट करने के लिए। एक वितरण जो 4 या अधिक सफल प्रमुखों के प्रवाह को ध्यान में रखता है, जो अनुकार या अनुलोम-विलोम अनुकरण को आदर्श बनाता है। उदाहरण के लिए, यदि पॉपुलैटन का मतलब 4 लगातार सिर के लिए 150 फ़्लिप है। यदि 4 या अधिक सिर 8 वें फ्लिप पर आए। यह संभावना नहीं है कि एक और 4 या अधिक सिर एक और 20 या इतने फ़्लिप में नहीं आएंगे (मैं सिर्फ अनुमान लगा रहा हूं) और शायद मतलब के करीब हो। ऐसा कुछ जो मुझे तब मिल सकेगा जब उसके संभावित 4 लगातार हेड्स एक निश्चित सीमा के भीतर हो जाएंगे।
डैन

जब आपके पास सिर्फ 4 सिर होता है, यदि आपको 5 वां सिर मिलता है, तो क्या वह 4 के सबसे हाल के सेट को 4 के दूसरे सेट के रूप में गिनता है, या गिनती रीसेट करता है, इसलिए आप पहले सिर से फिर से शुरू करते हैं (जैसे ही आप देखते हैं एक)?
Glen_b -Reinstate मोनिका

(मैंने अब तक यह मान लिया है कि यदि आप चार के कई अनुक्रम उत्पन्न करते हैं, तो कोई ओवरलैप नहीं है - एक बार जब आप 4 प्राप्त करते हैं, तो एस के रीसेट की संख्या 0.)
Glen_b -Reinstate Monica

इसके 4 सिर या इससे अधिक के रूप में जैसे ही आप एक पूंछ मिल जाएगा 4 सिर के बाद लकीर बंद हो जाएगा। तब तक गिनती फिर से शुरू हो जाएगी जब तक आप लगातार 4 सिर या अधिक बार नहीं देखते हैं।
दान

4 सिर या अधिक - मैं देखता हूं कि वास्तव में यह सवाल में क्या कहता है, मैंने अभी इसे काफी सही नहीं समझा था। तो 9 सिर को 4 के दो लॉट के रूप में नहीं गिना जाएगा। यह पूरी तरह से गणनाओं को बदलता है जो मैं कर रहा था। मेरे द्वारा उपयोग किया जा रहा पुनरावृत्ति संबंध गलत है। मूल अवधारणा - कि इसमें एक ज्यामितीय पूंछ होनी चाहिए - जो अभी भी पकड़ लेगी।
Glen_b -Reinstate Monica

0

आप ज्यामितीय वितरण चाहते हैं । विकिपीडिया से:

बर्नौली परीक्षणों की संख्या की संभाव्यता वितरण को एक सफलता प्राप्त करने की आवश्यकता थी, सेट {1, 2, 3, ...} पर समर्थित।X

चलो सर H एक असफलता है और T एक सफलता है। रैंडम वैरिएबल तो पहले टेल्स देखने के लिए जरूरी सिक्के के फलैक्स की संख्या है। उदाहरण के लिए, अनुक्रम HHHT होगा। यहाँ लिए संभाव्यता वितरण है :XX=4X

P(X=x)=(1p)x1p

हालांकि, हम केवल सिर की संख्या चाहते हैं। इसके बजाय को सिर की संख्या के रूप में परिभाषित करें । यहाँ यह वितरण है:Y=X1

P(Y+1=x)=(1p)x1pP(Y=x1)=(1p)x1pP(Y=y)=(1p)yp

के लिए । हम एक उचित सिक्का मानते हैं, जिससे । इसलिए: y=0,1,2,3...p=0.5

P(Y=y)=(0.5)y(0.5)=0.5y+1

यह सब flips की संख्या मान लिया गया पर्याप्त रूप से बड़े (10,000) की तरह है। छोटे (परिमित) , हमें अभिव्यक्ति के लिए एक सामान्यीकरण कारक जोड़ना होगा । सीधे शब्दों में कहें, तो हमें यह सुनिश्चित करने की आवश्यकता है कि कुल योग 1 के बराबर है। हम इसे सभी संभावनाओं के योग से विभाजित करके कर सकते हैं, यहाँ रूप में परिभाषित किया गया है :nnα

α=i=0n1P(Y=i)

इसका मतलब है , का सुधरा हुआ रूप , जिसे जाता है:YZ

P(Z=z)=1α(1p)zp=1i=0n1(1p)ip(1p)zp

फिर से, , हम इसे और भी कम कर सकते हैं, एक जियोमेट्रिक श्रृंखला योग का उपयोग करके :p=0.5

P(Z=z)=1i=0n10.5i+10.5z+1=110.5n0.5z+1=0.5z+110.5n

और हम देख सकते हैं कि, के रूप में , हमारे संशोधित संस्करण दृष्टिकोण पहले से।जेड वाईnZY


2
मुझे लगता है कि आपके द्वारा याद किए गए प्रश्न के कुछ विवरण हैं। जब तक मैं बुरी तरह से इस सवाल को गलत नहीं समझती, यह केवल ज्यामितीय नहीं है।
Glen_b -Reinstate मोनिका

मैंने इसे परिमित करने के लिए अद्यतन किया n। और हां, अब मैं देख रहा हूं कि वह सटीक गणना के बजाय एक खिड़की को स्थानांतरित करना चाहता था। मेरा केवल जंजीरों के लिए काम करता है, उनके बीच का समय नहीं।
क्लिंटनमॉन्क

एक अच्छा पहला कदम @ Glen_b की पोस्ट में ग्राफ पर एक नज़र रखना है, और देखें कि क्या आप इसे दोहरा सकते हैं। मैंने पायथन प्रोग्राम भी जोड़ा है जो मैंने सटीक संभावनाओं की जांच करने के लिए लिखा था। यदि आप इसे चलाने में सक्षम हैं, तो उस रेखा को अनलाइक करें जो प्रिंट से मेल खाती है, N5 और 7 के बीच कहीं घटती है, और आपको उन घटनाओं के लिए एक अच्छा अनुभव मिलेगा जो आवश्यक हैं (नोट pylabकेवल साजिश रचने के लिए आवश्यक है)।
टूटॉन

दुर्भाग्य से मैं एक पीसी के आसपास नहीं हूं जिसे मैं वर्तमान में परीक्षण कर सकता हूं। मैंने स्थिर करने के लिए एक मार्कोव प्रक्रिया का उपयोग करना शुरू कर दिया, ताकि स्थिर ज्यामिति (और ई [लौटने का समय] = 1 / ) , लेकिन मेरे पास इसे पूरी तरह से बाहर करने का समय नहीं था। πi
क्लिंटनमॉन्क

हां, यदि स्थिर समाधान द्वारा, आप पूंछ में निरंतर संभावनाओं के अनुपात के बारे में बात कर रहे हैं, तो स्थिर समाधान वास्तव में ज्यामितीय है, जैसा कि पिछले दोनों जवाबों ने कहा है।
Glen_b -Reinstate मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.