टेड में पीटर डोनली की बात से प्रेरित होकर , जिसमें उन्होंने चर्चा की कि सिक्के के टॉस की एक श्रृंखला में एक निश्चित पैटर्न को प्रदर्शित होने में कितना समय लगेगा, मैंने निम्न स्क्रिप्ट को आर। में दो पैटर्न 'एचटीटी' और 'राइट्स' को देखते हुए बनाया। गणना करता है कि इनमें से एक पैटर्न को हिट करने से पहले आपको औसतन कितना समय लगता है (यानी कितने सिक्के कम होते हैं)।
coin <- c('h','t')
hit <- function(seq) {
miss <- TRUE
fail <- 3
trp <- sample(coin,3,replace=T)
while (miss) {
if (all(seq == trp)) {
miss <- FALSE
}
else {
trp <- c(trp[2],trp[3],sample(coin,1,T))
fail <- fail + 1
}
}
return(fail)
}
n <- 5000
trials <- data.frame("hth"=rep(NA,n),"htt"=rep(NA,n))
hth <- c('h','t','h')
htt <- c('h','t','t')
set.seed(4321)
for (i in 1:n) {
trials[i,] <- c(hit(hth),hit(htt))
}
summary(trials)
सारांश आँकड़े निम्नानुसार हैं,
hth htt
Min. : 3.00 Min. : 3.000
1st Qu.: 4.00 1st Qu.: 5.000
Median : 8.00 Median : 7.000
Mean :10.08 Mean : 8.014
3rd Qu.:13.00 3rd Qu.:10.000
Max. :70.00 Max. :42.000
बात में यह समझाया गया है कि सिक्का पैटर्न की औसत संख्या दो पैटर्न के लिए अलग होगी; जैसा कि मेरे अनुकरण से देखा जा सकता है। बात को कुछ समय देखने के बावजूद मैं अभी भी नहीं समझ पा रहा हूं कि ऐसा क्यों होगा। मैं समझता हूं कि 'hth' अपने आप ही ओवरलैप हो जाता है और सहज रूप से मुझे लगता है कि आप '' hth '' हिट 'की तुलना में जल्दी हिट करेंगे, लेकिन ऐसा नहीं है। अगर कोई मुझे यह समझा सकता है तो मैं वास्तव में इसकी सराहना करूंगा।