यदि मैं सही ढंग से समझ गया हूं, तो समस्या उस समय के लिए एक संभाव्यता वितरण खोजने की है जिस पर या अधिक शीर्षों का पहला भाग समाप्त होता है।n
संपादित संभावनाओं सही ढंग से और जल्दी से निर्धारित किया जा सकता आव्यूह गुणन का उपयोग कर, और यह भी संभव है विश्लेषणात्मक गणना करने के लिए के रूप में मतलब और के रूप में विचरण जहां , लेकिन संभवतः वितरण के लिए केवल एक सरल बंद रूप नहीं है। सिक्के की एक निश्चित संख्या से अधिक होने पर, वितरण अनिवार्य रूप से एक ज्यामितीय वितरण होता है: यह बड़े लिए इस फॉर्म का उपयोग करने के लिए समझ में आता है ।σ 2 = 2 n + 2 ( μ - n - 3 ) - μ 2 + 5 μ μ = μ - + 1 टीμ−=2n+1−1σ2=2n+2(μ−n−3)−μ2+5μμ=μ−+1t
राज्य अंतरिक्ष में संभाव्यता वितरण के समय के विकास को राज्यों के लिए एक संक्रमण मैट्रिक्स का उपयोग करके मॉडलिंग की जा सकती है, जहां लगातार सिक्के की संख्या फ़्लिप होती है। राज्य इस प्रकार हैं:n =k=n+2n=
- राज्य , कोई सिर नहींH0
- स्टेट , हेड्स, मैं 1 ≤ मैं ≤ ( n - 1 )Hii1≤i≤(n−1)
- राज्य , या अधिक प्रमुख एनHnn
- राज्य , या अधिक सिर जिसके बाद पूंछ होती है nH∗n
एक बार जब आप राज्य में तो आप किसी भी अन्य राज्य में वापस नहीं आ सकते।H∗
राज्यों में आने के लिए राज्य संक्रमण संभावनाएँ निम्नानुसार हैं
- राज्य : संभावना से , , यानी खुद सहित, लेकिन राज्य नहीं१H0 एचआईi=0,…,एन-1एचएन12Hii=0,…,n−1Hn
- राज्य : से प्रायिकता१Hi एचi-112Hi−1
- राज्य : संभावना से साथ राज्य से, यानी सिर और खुद१Hn एचएन-1,एचएनएन-112Hn−1,Hnn−1
- राज्य : से प्रायिकता और से संभाव्यता 1 (स्वयं)१H∗ एचएनएच∗12HnH∗
तो उदाहरण के लिए, , यह संक्रमण मैट्रिक्स देता हैn=4
एक्स= ⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪एच0एच1एच2एच3एच4एच*एच012120000एच112012000एच212001200एच312000120एच400001212एच*000001⎫⎭⎬⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪
केस , संभाव्यता के प्रारंभिक वेक्टर is । सामान्य तौर पर प्रारंभिक वेक्टर में
p p = ( 1 , 0 , 0 , 0 , 0 , 0 ) p i = { 1 i = 0 0 i > 0n = 4पीपी =(1,0,0,0,0,0)
पीमैं= { १0मैं = ०मैं > 0
वेक्टर किसी भी समय के लिए अंतरिक्ष में संभाव्यता वितरण है । आवश्यक cdf समय में cdf है , और समय द्वारा कम से कम सिक्का फ़्लिप अंत में देखे जाने की संभावना है । इसे रूप में लिखा जा सकता है , यह देखते हुए कि हम निरंतर सिक्का फ़्लिप के चलने के बाद अंतिम अवस्था में 1 टाइमस्टेप पर पहुँचते हैं । एन टी ( एक्स टी + 1 पी ) कश्मीर एच *पीnटी( एक्स)टी + १पी )कएच*
समय में आवश्यक pmf को रूप में लिखा जा सकता है । हालाँकि संख्यात्मक रूप से इसमें बहुत बड़ी संख्या ( ) से बहुत कम संख्या को और परिशुद्धता को सीमित करना शामिल है। इसलिए गणना में यह स्थापित करने के लिए बेहतर है बल्कि 1. फिर लिखने की तुलना में परिणामस्वरूप मैट्रिक्स के लिए , PMF है । यह वही है जो नीचे दिए गए सरल आर प्रोग्राम में लागू किया गया है, जो किसी भी लिए काम करता है , ≈ 1 एक्स कश्मीर , कश्मीर =( एक्स)टी + १पी )क- ( एक्सटीपी )क≈ १एक्स ' एक्स ' = एक्स | एक्स कश्मीर , कश्मीर = 0 ( एक्स ' टी + 1 पी ) कश्मीर n ≥ 2एक्सके , के= 0X′X′=X|Xk,k=0(X′t+1p)kn≥2
n=4
k=n+2
X=matrix(c(rep(1,n),0,0, # first row
rep(c(1,rep(0,k)),n-2), # to half-way thru penultimate row
1,rep(0,k),1,1,rep(0,k-1),1,0), # replace 0 by 2 for cdf
byrow=T,nrow=k)/2
X
t=10000
pt=rep(0,t) # probability at time t
pv=c(1,rep(0,k-1)) # probability vector
for(i in 1:(t+1)) {
#pvk=pv[k]; # if calculating via cdf
pv = X %*% pv;
#pt[i-1]=pv[k]-pvk # if calculating via cdf
pt[i-1]=pv[k] # if calculating pmf
}
m=sum((1:t)*pt)
v=sum((1:t)^2*pt)-m^2
c(m, v)
par(mfrow=c(3,1))
plot(pt[1:100],type="l")
plot(pt[10:110],type="l")
plot(pt[1010:1110],type="l")
ऊपरी भूखंड 0 और 100 के बीच pmf को दर्शाता है। निचले दो भूखंड 10 और 110 के बीच और 1010 और 1110 के बीच भी pmf दिखाते हैं, आत्म-समानता और इस तथ्य को दर्शाते हुए कि जैसा @Glen_b कहता है, वितरण ऐसा हो सकता है एक बसने के बाद एक ज्यामितीय वितरण द्वारा अनुमानित अवधि।
eigenvector अपघटन का उपयोग करके इस व्यवहार की आगे जांच करना संभव है । ऐसा करने से पता चलता है कि पर्याप्त रूप से बड़े , , जहाँ समीकरण का हल है । यह सन्निकटन में वृद्धि के साथ बेहतर हो जाता है और उत्कृष्ट के लिए है रेंज में लगभग 30 से 50 करने के लिए, के मूल्य के आधार , के रूप में की गणना के लिए नीचे लॉग त्रुटि की साजिश में दिखाया गया (इंद्रधनुष रंग, पर लाल लिए छोड़ दिया गयाटी पी टी + 1 ≈ सी ( एन ) पी टी सी ( एन )Xtpt+1≈c(n)ptc(n)एन टी एन पी 100 एन = 2 टी2n+1cn(c−1)+1=0ntnp100n=2)। (वास्तव में संख्यात्मक कारणों से, यह वास्तव में बेहतर होगा कि जब बड़ा हो तो संभावनाओं के लिए ज्यामितीय सन्निकटन का उपयोग करें ।)t
मुझे संदेह है कि (ईडी) वितरण के लिए एक बंद रूप उपलब्ध हो सकता है क्योंकि साधन और संस्करण जैसे मैंने उनकी गणना निम्नानुसार की है
n2345678910Mean715316312725551110232047Variance241447363392147206169625344010291204151296
(मुझे इसे t=100000
प्राप्त करने के लिए समय क्षितिज तक संख्या को टक्कर देना पड़ा लेकिन कार्यक्रम अभी भी सभी बारे में 10 सेकंड से कम समय के लिए चला।) विशेष रूप से साधन एक बहुत स्पष्ट पैटर्न का पालन करते हैं; वैरिएन्स कम हैं। मैंने अतीत में एक सरल, 3-राज्य संक्रमण प्रणाली को हल किया है, लेकिन अभी तक मुझे इस पर एक सरल विश्लेषणात्मक समाधान के साथ कोई भाग्य नहीं है। शायद वहाँ कुछ उपयोगी सिद्धांत है कि मैं के बारे में पता नहीं कर रहा हूँ, जैसे संक्रमण matrices से संबंधित।n=2,…,10
संपादित करें : बहुत सी झूठी शुरुआत के बाद मैं एक पुनरावृत्ति सूत्र के साथ आया था। चलो में राज्य किया जा रहा है की संभावना हो समय में । बता दें कि राज्य , यानी अंतिम स्थिति, समय होने की संचयी संभावना है । एनबीpi,tHitq∗,tH∗t
- किसी भी दिए गए , और लिए स्थान पर संभाव्यता वितरण है , और तुरंत नीचे मैं इस तथ्य का उपयोग करता हूं कि उनकी संभावनाएं 1 में जुड़ती हैं।tpi,t,0≤i≤nq∗,ti
- p∗,t समय पर एक प्रायिकता वितरण का निर्माण करता । बाद में, मैं इस तथ्य का उपयोग साधनों और भिन्नताओं को प्राप्त करने में करता हूं।t
समय पर पहला राज्य होने की संभावना , अर्थात कोई प्रमुख नहीं है, राज्यों द्वारा संक्रमण की संभावनाओं द्वारा दी जाती है जो समय (कुल संभावना के प्रमेय का उपयोग करके) से इसे वापस कर सकते हैं ।
लेकिन राज्य से प्राप्त करने के लिए को लेता है कदम, इसलिए और
एक बार फिर कुल संभावना के प्रमेय द्वारा प्रायिकता की संभावना परt+1tएच0
p0,t+1=12p0,t+12p1,t+…12pn−1,t=12∑i=0n−1pi,t=12(1−pn,t−q∗,t)
H0Hn−1n−1pn−1,t+n−1=12n−1p0,tpn−1,t+n=12n(1−pn,t−q∗,t)
Hnसमय पर is
और इस तथ्य का उपयोग करते हुए कि ,
इसलिए, ,
बदलकर
t+1pn,t+1=12pn,t+12pn−1,t=12pn,t+12n+1(1−pn,t−n−q∗,t−n)(†)
q∗,t+1−q∗,t=12pn,t⟹pn,t=2q∗,t+1−2q∗,t2q∗,t+2−2q∗,t+1=q∗,t+1−q∗,t+12n+1(1−2q∗,t−n+1+q∗,t−n)
t→t+n2q∗,t+n+2−3q∗,t+n+1+q∗,t+n+12nq∗,t+1−12n+1q∗,t−12n+1=0
यह पुनरावृत्ति सूत्र मामलों और लिए जाँच करता है । उदाहरण के लिए इस फॉर्मूले का एक प्लॉट मशीन ऑर्डर सटीकता देता है।n=4n=6n=6t=1:994;v=2*q[t+8]-3*q[t+7]+q[t+6]+q[t+1]/2**6-q[t]/2**7-1/2**7
संपादित करें मैं नहीं देख सकता कि इस पुनरावृत्ति संबंध से एक बंद रूप खोजने के लिए कहां जाना है। हालांकि, यह है मतलब के लिए एक बंद फार्म पाने के लिए संभव।
से शुरू , और उस ,
से
तक रकम लेना और माध्य लिए सूत्र लागू करना और उस नोट करना। वितरण संभावना देता है
(†)p∗,t+1=12pn,t
pn,t+12n+1(2p∗,t+n+2−p∗,t+n+1)+2p∗,t+1=12pn,t+12n+1(1−pn,t−n−q∗,t−n)(†)=1−q∗,t
t=0∞E[X]=∑∞x=0(1−F(x))p∗,t2n+1∑t=0∞(2p∗,t+n+2−p∗,t+n+1)+2∑t=0∞p∗,t+12n+1(2(1−12n+1)−1)+22n+1=∑t=0∞(1−q∗,t)=μ=μ
यह राज्य तक पहुंचने का मतलब है ; सिर के रन के अंत के लिए इसका मतलब इससे कम है।
H∗
सूत्र का उपयोग करके समान दृष्टिकोण संपादित करेंइस सवाल से विचरण पैदा होता है।
E[X2]=∑∞x=0(2x+1)(1−F(x))
∑t=0∞(2t+1)(2n+1(2p∗,t+n+2−p∗,t+n+1)+2p∗,t+1)2∑t=0∞t(2n+1(2p∗,t+n+2−p∗,t+n+1)+2p∗,t+1)+μ2n+2(2(μ−(n+2)+12n+1)−(μ−(n+1)))+4(μ−1)+μ2n+2(2(μ−(n+2))−(μ−(n+1)))+5μ2n+2(μ−n−3)+5μ2n+2(μ−n−3)−μ2+5μ=∑t=0∞(2t+1)(1−q∗,t)=σ2+μ2=σ2+μ2=σ2+μ2=σ2+μ2=σ2
साधन और संस्करण आसानी से प्रोग्रामेटिक रूप से उत्पन्न किए जा सकते हैं। उदाहरण के लिए उपयोग के ऊपर की मेज से साधन और प्रकार की जांच करने के लिए
n=2:10
m=c(0,2**(n+1))
v=2**(n+2)*(m[n]-n-3) + 5*m[n] - m[n]^2
अंत में, मुझे यकीन नहीं है कि जब आप लिखे थे तब आप क्या चाहते थे
जब पूंछ टकराती है और सिर की लकीर टूट जाती है तो गिनती अगले फ्लिप से फिर से शुरू होगी।
यदि आपका मतलब है कि अगली बार के लिए प्रायिकता वितरण क्या है जिस पर या अधिक हेड का पहला रन समाप्त होता है, तो महत्वपूर्ण बिंदु इस टिप्पणी में @Glen_b द्वारा समाहित है , जो यह है कि प्रक्रिया एक पूंछ के बाद फिर से शुरू होती है (cf प्रारंभिक समस्या जहां आपको तुरंत या अधिक सिर का रन मिल सकता है )।nn
इसका मतलब यह है कि, उदाहरण के लिए, पहली घटना के लिए औसत समय , लेकिन घटनाओं के बीच औसत समय हमेशा (विचरण समान है)। सिस्टम के "व्यवस्थित" होने के बाद राज्य में होने की दीर्घकालिक संभावनाओं की जांच के लिए एक संक्रमण मैट्रिक्स का उपयोग करना भी संभव है। उपयुक्त संक्रमण मैट्रिक्स प्राप्त करने के लिए, और ताकि सिस्टम से राज्य पर तुरंत वापस । फिर इस नए मैट्रिक्स के पहले आइगेनवेक्टर को स्थिर संभावनाएं मिलती हैं । साथ इन स्थिर संभावनाओं हैंμ−1μ+1Xk,k,=0X1,k=1H0H∗n=4
एच*=1/0.03030303=33=μ+1
H0H1H2H3H4H∗probability0.484848480.242424240.121212120.060606060.060606060.03030303
राज्यों के बीच अपेक्षित समय संभावना के पारस्परिक द्वारा दिया जाता है। तो विज़िट के बीच अपेक्षित समय ।
H∗=1/0.03030303=33=μ+1
परिशिष्ट : पायथन कार्यक्रम का उपयोग tosses n
पर लगातार सिर की = संख्या के लिए सटीक संभावनाएं उत्पन्न करने के लिए किया जाता है N
।
import itertools, pylab
def countinlist(n, N):
count = [0] * N
sub = 'h'*n+'t'
for string in itertools.imap(''.join, itertools.product('ht', repeat=N+1)):
f = string.find(sub)
if (f>=0):
f = f + n -1 # don't count t, and index in count from zero
count[f] = count[f] +1
# uncomment the following line to print all matches
# print "found at", f+1, "in", string
return count, 1/float((2**(N+1)))
n = 4
N = 24
counts, probperevent = countinlist(n,N)
probs = [count*probperevent for count in counts]
for i in range(N):
print '{0:2d} {1:.10f}'.format(i+1,probs[i])
pylab.title('Probabilities of getting {0} consecutive heads in {1} tosses'.format(n, N))
pylab.xlabel('toss')
pylab.ylabel('probability')
pylab.plot(range(1,(N+1)), probs, 'o')
pylab.show()