विभिन्न पॉलीहेड्रल पासा के लिए वितरण एक ही बार में क्या लुढ़का है?


15

5 प्लैनेटिक सॉलिड्स को डनगेन्स एंड ड्रैगन्स डाइस के सेट से लें। इनमें 4-पक्षीय, 6-पक्षीय (पारंपरिक), 8-पक्षीय, 12-पक्षीय और 20-पक्षीय पासा शामिल हैं। सभी नंबर 1 से शुरू करते हैं और 1 से ऊपर की गिनती करते हैं।

उन सभी को एक साथ रोल करें, उनकी राशि लें (न्यूनतम योग 5 है, अधिकतम 50 है)। ऐसा कई बार करें। वितरण क्या है?

जाहिर है कि वे कम अंत की ओर बढ़ेंगे, क्योंकि उच्च से अधिक संख्या कम है। लेकिन क्या व्यक्ति की मृत्यु की प्रत्येक सीमा पर उल्लेखनीय विभक्ति बिंदु होंगे?

[संपादित करें: स्पष्ट रूप से, जो स्पष्ट प्रतीत होता है वह नहीं है। टीकाकारों में से एक के अनुसार, औसत (5 + 50) / 2=27.5 है। मुझे इसकी उम्मीद नहीं थी। मैं अब भी एक ग्राफ देखना चाहूंगा।] [edit2: यह देखने के लिए अधिक समझ में आता है कि n पासा का वितरण प्रत्येक पासा के समान है, एक साथ जोड़ा गया है।]


1
क्या आपका मतलब है कि असतत वर्दी का योग क्या है ? [1,4]+[1,6]+[1,8]+[1,12]+[1,20]
गूँग - मोनिका

2
इसकी जांच करने का एक तरीका अनुकरण है। आर में hist(rowSums(sapply(c(4, 6, 8, 12, 20), sample, 1e6, replace = TRUE))):। यह वास्तव में कम अंत की ओर नहीं जाता है; 5 से 50 तक के संभावित मान, औसत 27.5 है, और वितरण सामान्य से बहुत दूर नहीं है।
डेविड रॉबिन्सन

2
मेरे डी एंड डी सेट में एक डी 10 है और साथ ही आपके द्वारा उल्लेखित 5 (साथ ही एक डिकैडर, जिसे मैं आपको शामिल नहीं करता हूं) का
उल्लेख करता हूं

1
वोल्फ्राम अल्फा उत्तर की गणना बिल्कुल करता है । यहाँ प्रायिकता जनरेटिंग फंक्शन है , जहाँ से आप सीधे वितरण को पढ़ सकते हैं। Btw, इस सवाल का एक का एक विशेष मामला है कि कहा जाता है और अच्छी तरह से पर जवाब है stats.stackexchange.com/q/3614 और कम से stats.stackexchange.com/questions/116792
whuber

2
@AlecTeal: आसान है, सख्त आदमी। यदि आपने अपना शोध किया है, तो आप देखेंगे कि मेरे पास अनुकार को चलाने के लिए एक omputer नहीं था। और 100 बार लुढ़कना, इस तरह के एक सरल प्रश्न के लिए उतना प्रभावी नहीं था।
मार्कोस

जवाबों:


18

मैं इसे बीजगणितीय रूप से नहीं करना चाहता, लेकिन आप केवल पर्याप्त रूप से pmf की गणना कर सकते हैं (यह सिर्फ दृढ़ संकल्प है, जो वास्तव में स्प्रेडशीट में आसान है)।

मैंने एक स्प्रेडशीट में इनकी गणना की *:

i        n(i)   100 p(i)
5         1     0.0022
6         5     0.0109
7        15     0.0326
8        35     0.0760
9        69     0.1497
10      121     0.2626
11      194     0.4210
12      290     0.6293
13      409     0.8876
14      549     1.1914
15      707     1.5343
16      879     1.9076
17     1060     2.3003
18     1244     2.6997
19     1425     3.0924
20     1597     3.4657
21     1755     3.8086
22     1895     4.1124
23     2014     4.3707
24     2110     4.5790
25     2182     4.7352
26     2230     4.8394
27     2254     4.8915
28     2254     4.8915
29     2230     4.8394
30     2182     4.7352
31     2110     4.5790
32     2014     4.3707
33     1895     4.1124
34     1755     3.8086
35     1597     3.4657
36     1425     3.0924
37     1244     2.6997
38     1060     2.3003
39      879     1.9076
40      707     1.5343
41      549     1.1914
42      409     0.8876
43      290     0.6293
44      194     0.4210
45      121     0.2626
46       69     0.1497
47       35     0.0760
48       15     0.0326
49        5     0.0109
50        1     0.0022

यहाँ प्रत्येक कुल प्राप्त करने के तरीकों की संख्या है i ; पी ( मैं ) संभावना है, जहां है पी ( मैं ) = n ( मैं ) / 46,080 । सबसे अधिक संभावित परिणाम 5% से कम समय में होता है।n(i)ip(i)p(i)=n(i)/46080

Y- अक्ष संभावना प्रतिशत के रूप में व्यक्त किया गया है। यहाँ छवि विवरण दर्ज करें

* मैं जिस विधि का उपयोग करता हूं वह यहां उल्लिखित प्रक्रिया के समान है , हालांकि सटीक मैकेनिक्स इसे स्थापित करने में शामिल है क्योंकि उपयोगकर्ता इंटरफ़ेस विवरण बदल जाता है (यह पद अब लगभग 5 साल पुराना है, हालांकि मैंने इसे एक साल पहले अपडेट किया था)। और मैंने इस बार एक अलग पैकेज का उपयोग किया (मैंने इस बार लिबरऑफिस के कैल्क में किया था)। फिर भी, यह इसका सार है।


कमाल है, मैं बिल्कुल एक सममित वितरण की उम्मीद नहीं कर रहा था। मुझे यकीन नहीं है कि मेरा अंतर्ज्ञान इतनी दूर क्यों था।
मार्कोस

6
वितरण में स्वतंत्र सममित यादृच्छिक चर का योग भी सममित है।
Glen_b -Reinstate मोनिका

अच्छा नियम। क्या वह कहीं प्रकाशित है?
मार्कोस

3
हां, लेकिन मेरी बात यह है कि इसे प्रकाशित करने के लिए एक पत्रिका प्राप्त करना बहुत तुच्छ है, यह केवल एक छात्र के लिए एक अभ्यास के रूप में निर्धारित किया जाएगा। आप इस तथ्य का उपयोग कर सकते हैं कि एक यादृच्छिक चर की विशेषता फ़ंक्शन जो मूल के चारों ओर सममित है वास्तविक है और यहां तक ​​कि (जो तथ्य आप इसे विशेषता फ़ंक्शन पर विकिपीडिया पृष्ठ पर कहा जा सकता है ) - ठीक है, और मुझे लगता है कि आपको एक की आवश्यकता है के रूप में अच्छी तरह से pmfs बनाम की एक संपत्ति, या दोहरे संबंध का उपयोग करने के लिए स्थापित करें कि एक भी सीएफ भी एक सममित pmf का अर्थ है ...
Glen_b -Reinstate Monica

2
... और तथ्य यह है कि एक उत्पाद का कार्य भी समान है, लेकिन यह वास्तव में स्पष्ट है कि प्रत्यक्ष कैसे काम करता है, इस बात पर विचार करने से - दो सममित कार्यों (इस मामले में pmfs) के एक संकल्प में, हर शब्द के योग में एक छोर पर उत्पादों के दूसरे छोर पर समान आकार का एक समान शब्द होता है, सममित रूप से केंद्र के चारों ओर रखा जाता है।
Glen_b -Reinstate मोनिका

7

इसलिए मैंने यह कोड बनाया:

d4 <- 1:4  #the faces on a d4
d6 <- 1:6  #the faces on a d6
d8 <- 1:8  #the faces on a d8
d10 <- 1:10 #the faces on a d10 (not used)
d12 <- 1:12 #the faces on a d12
d20 <- 1:20 #the faces on a d20

N <- 2000000  #run it 2 million times
mysum <- numeric(length = N)

for (i in 1:N){
     mysum[i] <- sample(d4,1)+
                 sample(d6,1)+
                 sample(d8,1)+
                 sample(d12,1)+
                 sample(d20,1)
}

#make the plot
hist(mysum,breaks = 1000,freq = FALSE,ylim=c(0,1))
grid()

नतीजा यह साजिश है। यहाँ छवि विवरण दर्ज करें

यह दिखने में काफी गाऊसी है। मुझे लगता है कि हमने (फिर से) केंद्रीय सीमा प्रमेय पर एक भिन्नता का प्रदर्शन किया हो सकता है।


2
हम्म, आपके सिमुलेशन में सबसे कम रोल 6 है। इसे रोल करने की संभावना (या किसी भी एकल रोल, मरने की पहचान को संरक्षित करना) 1: 4 * 1: 6 * 1: 8 * 1: 10 * 1: 12 * 1: 20 = 1: 460,800। मेरी प्रक्रियाएं मेरे मॉडलिंग में किसी भी त्रुटि को प्रकट करने के लिए कम से कम दो बार (शायद 4x) इस राशि (एक Nyquist सीमा की तरह) के नमूने का आकार मांगेंगी।
मार्कोस

Nyquist के साथ मेरा अनुभव भी 4x न्यूनतम कहता है। ... किया हुआ। यदि 2 मिलियन पर्याप्त नहीं है, तो मुझे बताएं कि यह क्या होना चाहिए।
EngrStudent - मोनिका

3
n

1
@EngrStudent: BTW, क्या आपका परिणाम CLT की पुष्टि नहीं करता है?
मार्कोस

1
@ डॉटर नहीं, यह कारणों की मेजबानी के लिए CLT की पुष्टि नहीं करता है
Glen_b -Reinstate Monica

7

अपने अंतर्ज्ञान के लिए एक छोटी सी मदद:

पहले, विचार करें कि क्या होता है अगर आप एक के सभी चेहरों को जोड़ते हैं, जैसे कि d4। इसलिए, 1,2,3,4 के बजाय, चेहरे अब 2,3,4,5 दिखाते हैं।

इस स्थिति की तुलना मूल से करने पर, यह देखना आसान है कि कुल योग अब एक से अधिक है जो पहले हुआ करता था। इसका मतलब है कि वितरण का आकार अपरिवर्तित है, यह सिर्फ एक कदम पक्ष में है।

अब प्रत्येक डाई के औसत मूल्य को उस डाई के प्रत्येक पक्ष से घटाएं

इससे पासा चिन्हित होता है

  • 32121232
  • 523212123252
  • 7252321212325272

आदि।

अब, इन पासा का योग अभी भी मूल के समान होना चाहिए, केवल नीचे की ओर स्थानांतरित हो गया। यह स्पष्ट होना चाहिए कि यह योग शून्य के आसपास सममित है। इसलिए मूल वितरण भी सममित है।


4

पी(एक्स=मैं)=पी(मैं)
एक्समैं0,1,...,n(0,1/6,1/6,1/6,1/6,1/6,1/6)। प्रायिकता जनरेटिंग फंक्शन (pgf) इसके द्वारा दिया जाता हैपी(टी)=Σ06पी(मैं)टीमैं। दूसरे पासे को वेक्टर द्वारा दिया गया वितरण हैक्ष(जे) साथ में जे रेंज में 0,1,...,। फिर pgf के उत्पाद द्वारा दिए गए दो स्वतंत्र पासा रोल पर आंखों के योग का वितरण,पी(टी)क्ष(टी)। Thet उत्पाद को लिखते हुए हम देख सकते हैं कि यह गुणांक अनुक्रमों के दृढ़ संकल्प द्वारा दिया गया है, इसलिए R फ़ंक्शन कनवल्शन () द्वारा पाया जा सकता है। इसे दो चरणों में मानक पासे से देखें:
> p  <-  q  <-  c(0, rep(1/6,6))
> pq  <-  convolve(p,rev(q),type="open")
> zapsmall(pq)
 [1] 0.00000000 0.00000000 0.02777778 0.05555556 0.08333333 0.11111111
 [7] 0.13888889 0.16666667 0.13888889 0.11111111 0.08333333 0.05555556
[13] 0.02777778

और आप देख सकते हैं कि यह सही है (हाथ की गणना से)। अब असली सवाल के लिए, 5,6, 4,6,8,12,20 पक्षों के साथ। मैं प्रत्येक पासा के लिए एकसमान प्रक्रिया मानकर गणना करूंगा। फिर:

> p1  <-  c(0,rep(1/4,4))
> p2 <-  c(0,rep(1/6,6))
> p3 <-  c(0,rep(1/8,8))
> p4  <-  c(0, rep(1/12,12))
> p5  <-  c(0, rep(1/20,20))
> s2  <-  convolve(p1,rev(p2),type="open")
> s3 <-  convolve(s2,rev(p3),type="open")
> s4 <-  convolve(s3,rev(p4),type="open")
> s5 <- convolve(s4, rev(p5), type="open")
> sum(s5)
[1] 1
> zapsmall(s5)
 [1] 0.00000000 0.00000000 0.00000000 0.00000000 0.00000000 0.00002170
 [7] 0.00010851 0.00032552 0.00075955 0.00149740 0.00262587 0.00421007
[13] 0.00629340 0.00887587 0.01191406 0.01534288 0.01907552 0.02300347
[19] 0.02699653 0.03092448 0.03465712 0.03808594 0.04112413 0.04370660
[25] 0.04578993 0.04735243 0.04839410 0.04891493 0.04891493 0.04839410
[31] 0.04735243 0.04578993 0.04370660 0.04112413 0.03808594 0.03465712
[37] 0.03092448 0.02699653 0.02300347 0.01907552 0.01534288 0.01191406
[43] 0.00887587 0.00629340 0.00421007 0.00262587 0.00149740 0.00075955
[49] 0.00032552 0.00010851 0.00002170
> plot(0:50,zapsmall(s5))

प्लॉट नीचे दिखाया गया है:

enter image description here

अब आप सिमुलेशन के साथ इस सटीक समाधान की तुलना कर सकते हैं।


1

केंद्रीय सीमा प्रमेय आपके प्रश्न के उत्तर। हालांकि इसका विवरण और इसका प्रमाण (और यह विकिपीडिया लेख) कुछ हद तक मस्तिष्क-झुकने वाला है, इसका सार सरल है। प्रति विकिपीडिया, यह बताता है कि

परिमित संस्करण के साथ कई स्वतंत्र और समान रूप से वितरित यादृच्छिक चर का योग एक सामान्य वितरण की ओर बढ़ेगा क्योंकि चर की संख्या बढ़ती है।

आपके मामले के लिए एक सबूत का स्केच:

जब आप कहते हैं "एक ही बार में सभी पासा को रोल करें", सभी पासा के प्रत्येक रोल एक यादृच्छिक चर है।

आपके पासे का परिमित संख्या उन पर मुद्रित है। उनके मूल्यों का योग इसलिए परिमित विचरण है।

हर बार जब आप सभी पासा रोल करते हैं, तो परिणाम की संभावना समान होती है। (रोल के बीच पासा नहीं बदलता है।)

यदि आप पासा को निष्पक्ष रूप से रोल करते हैं, तो हर बार जब आप उन्हें रोल करते हैं, तो परिणाम स्वतंत्र होता है। (पिछले रोल भविष्य के रोल को प्रभावित नहीं करते हैं।)

स्वतंत्र? चेक। समान रूप से वितरित? चेक। परिमित रूपांतर? चेक। इसलिए योग एक सामान्य वितरण की ओर जाता है।

इससे कोई फर्क नहीं पड़ता कि सभी पासा के एक रोल के लिए वितरण कम अंत की ओर लोप किया गया। मुझे कोई फर्क नहीं पड़ता अगर उस वितरण में cusps थे। सभी योग इसे सुचारू करते हैं और इसे एक सममित गॉसियन बनाते हैं। आपको इसे दिखाने के लिए कोई बीजगणित या अनुकरण करने की भी आवश्यकता नहीं है! यह सीएलटी की आश्चर्यजनक अंतर्दृष्टि है।


3
जबकि CLT प्रासंगिक है, और जैसा कि अन्य पदों से पता चलता है, वितरण मोटे तौर पर गाऊसी दिख रहे हैं, हम केवल 5 स्वतंत्र गैर-समान वितरणों के योग से निपट रहे हैं । तो 1 बिंदु 5) वास्तव में इतना बड़ा नहीं है कि वह एक ऐसे प्रमेय का आह्वान करे जो "अनंत पर" लागू होता है। बिंदु 2) आप वेनिला सीएलटी का उपयोग नहीं कर सकते, क्योंकि आपके द्वारा लिखी गई चीजें आईआईडी नहीं हैं। मुझे लगता है कि आपको Lyapunov CLT की जरूरत है।
पीटर

2
आपको यह कहने के लिए केंद्रीय सीमा प्रमेय की आवश्यकता नहीं है कि कुछ स्वतंत्र यादृच्छिक चर के योगों को उनके संबंधित केंद्रों के बारे में सममिति के साथ केंद्रों के योग के बारे में सममित वितरण है।
हेनरी

@Peter: आप मेरे प्रमाण की संरचना को याद कर रहे हैं। ओपी कहते हैं, "उन सभी को एक साथ रोल करें।" मैं सभी पासा के प्रत्येक रोल को एक यादृच्छिक चर के रूप में ले रहा हूं । उन यादृच्छिक चर का समान वितरण होता है। Lyapunov के लिए कोई ज़रूरत नहीं है। इसके अलावा, ओपी का कहना है कि "ऐसा कई बार करें," जिसका मतलब मैं "सीमा में" लेता हूं, इसलिए आपकी बात # 1 मान्य नहीं है। हम यहां केवल 5 पासा के एक रोल को समेट नहीं रहे हैं।
पॉल कैंटरेल

2
@PaulCantrell सभी पासा के प्रत्येक रोल में पाँच स्वतंत्र गैर-पहचान वाले वितरित चर का योग है। ओपी उस राशि के वितरण के बारे में पूछ रहा है। आप 5 पासा के कई रोल कर सकते हैं, लेकिन यह सवाल के तहत वितरण से सिर्फ नमूना है, कोई भी उन नमूनों को समेट नहीं रहा है।
पीटर

1
@PaulCantrell मुझे लगता है कि यह इस बात पर निर्भर करता है कि आप कैसे "कई बार ऐसा करते हैं।" ऐसा कई बार करते हैं, और वे फिर से (एकल मान प्राप्त करते हैं), या ऐसा कई बार करते हैं और उन नमूनों के हिस्टोग्राम को देखते हैं (कई मान प्राप्त कर रहे हैं)। मैंने बाद की व्याख्या ली।
पीटर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.