क्या समान रूप से वितरित संख्याओं के बीच अंतर समान रूप से वितरित किया जाता है?


22

हम बड़ी संख्या में 6-पक्षीय मर जाते हैं।

एक रोल और उसके पूर्ववर्ती रोल के बीच अंतर (निरपेक्ष मूल्य) की गणना, क्या अंतर समान रूप से वितरित होने की उम्मीद है?

10 रोल के साथ वर्णन करने के लिए:

roll num  result diff
1           1     0
2           2     1
3           1     1
4           3     2
5           3     0
6           5     2
7           1     4
8           6     5
9           4     2
10          4     0

क्या diffमूल्यों को समान रूप से वितरित किया जाएगा?


13
कम से कम एक समझ पाने के लिए एक हिस्टोग्राम प्लॉट करें
बंदूक


यह होमवर्क जैसा दिखता है ....
मनु एच

@ मनु एच, मैं आपको आश्वस्त करता हूं कि होमवर्क के दिन मेरे पीछे हैं
हेयूड

जवाबों:


37

नहीं, यह एक समान नहीं है

आप पूर्ण मतभेदों के लिए 36 समान रूप से संभावित संभावनाओं की गणना कर सकते हैं

     second 1   2   3   4   5   6
first                           
1           0   1   2   3   4   5
2           1   0   1   2   3   4
3           2   1   0   1   2   3
4           3   2   1   0   1   2
5           4   3   2   1   0   1
6           5   4   3   2   1   0

जो के पूर्ण अंतर के लिए एक संभावना वितरण देता है

0    6/36  1/6
1   10/36  5/18
2    8/36  2/9
3    6/36  1/6
4    4/36  1/9
5    2/36  1/18

27
@onurcanbektas इस तालिका में तालिका स्पष्ट रूप से आपके दावे का खंडन करती है: उदाहरण के लिए, यह दर्शाता है कि संभावित अंतरों में से केवल 5 में से 5 हैं, जबकि उनमें से 6 0. हैं। चूंकि सभी 36 संभावनाएं समान रूप से संभावित हैं, इसलिए यह गैर-समान है।
whuber

13
@onurcanbektas मैं आपको एक बार फिर से तालिका पर विचार करने के लिए आमंत्रित करता हूं। चूंकि इसमें 5 के केवल दो पूर्ण अंतर हैं, क्या यह स्पष्ट नहीं है कि दो से अधिक अंतर 5 के बराबर नहीं हो सकते?
whuber

14
@onurcanbektas सरल अंतरों के लिए (अर्थात संकेत के साथ, इसलिए पूर्णांक -5 से +5 तक हालांकि), वितरण एक सममितीय असतत त्रिकोणीय वितरण है जिसमें मोड (सबसे अधिक संभावना मूल्य) 0. पूर्ण अंतर के लिए जैसा कि मेरे उत्तर में दिखाया गया है, मोड 1. है
हेनरी

2
हालांकि यह ध्यान देने योग्य बात है कि हस्ताक्षरित अंतर मोडुलो 6 समान रूप से वितरित किया गया है।
फेडरिको पोलोनी

2
@FedericoPoloni क्या यह तुच्छ रूप से स्पष्ट नहीं है? मेरा मतलब है कि मैं वास्तव में इसके बारे में कभी नहीं, हालांकि टिप्पणी पढ़ने से पहले, लेकिन यह स्पष्ट है कि यह सिर्फ सच है
Cruncher

21

संभावनाओं और वास्तविक संख्याओं के बारे में केवल सबसे बुनियादी स्वयंसिद्ध का उपयोग करते हुए, कोई बहुत मजबूत कथन साबित कर सकता है:

किसी भी दो स्वतंत्र का अंतर है, हूबहू nonconstant यादृच्छिक मान वितरित XY कभी नहीं एक असतत समान वितरण है।

(निरंतर चर के लिए एक अनुरूप बयान दो आरवी के अंतर के यूनिफ़ॉर्म पीडीएफ पर सिद्ध होता है ।)

विचार यह है कि मौका XY एक चरम मान है जो XY शून्य है, क्योंकि मौका से कम होना चाहिए , क्योंकि XY ) को अधिकतम करने का केवल एक ही तरीका है, जबकि अंतर शून्य बनाने के कई तरीके हैं , क्योंकि X और Y का समान वितरण है और इसलिए एक दूसरे के बराबर हो सकते हैं। यहाँ विवरण हैं।

पहले यह देखें कि प्रश्न में काल्पनिक दो चर X और Y सकारात्मक संभावना वाले मानों की केवल एक परिमित संख्या n प्राप्त कर सकते हैं , क्योंकि कम से कम n अलग-अलग अंतर होंगे और एक समान वितरण उन्हें सभी समान संभाव्यता प्रदान करता है। यदि n अनंत है, तो ऐसे में सकारात्मक, समान संभावना वाले संभावित अंतरों की संख्या होगी, जहां उनके अवसरों का योग अनंत होगा, जो कि असंभव है।

अगला , चूंकि मतभेदों की संख्या परिमित है, उनमें से एक सबसे बड़ा होगा। सबसे बड़ा अंतर केवल तभी प्राप्त किया जा सकता है जब Y let के कॉल के सबसे छोटे मूल्य को घटाकर इसे m और मान लें कि इसमें प्रायिकता q=Pr(Y=m) है - X let के कॉल के सबसे बड़े मूल्य से जो कि एक M साथ है। p=Pr(X=M). क्योंकि X और Y स्वतंत्र हैं, इस अंतर की संभावना इन अवसरों का उत्पाद है,

(*)Pr(XY=Mm)=Pr(X=M)Pr(Y=m)=pq>0.

अंत में , क्योंकि X और Y का समान वितरण है, ऐसे कई तरीके हैं जिनके अंतर से मान उत्पन्न हो सकता है 0. इन तरीकों में ऐसे मामले हैं जहाँ X=Y=m और X=Y=M. क्योंकि इस वितरण nonconstant है, m से भिन्न M.इससे पता चलता है कि उन दो मामलों में घटनाओं को खारिज कर दिया गया है और इसलिए उन्हें कम से कम एक राशि p2+q2 का मौका देना चाहिए जो कि XYशून्य है; अर्थात्,

Pr(XY=0)Pr(X=Y=m)+Pr(X=Y=M)=p2+q2.

के बाद से संख्या के वर्गों नकारात्मक नहीं हैं, 0(pq)2, जिस कारण से हम से निकालना () कि

Pr(XY=Mm)=pqpq+(pq)2=p2+q2pq<p2+q2Pr(XY=0),

XY का वितरण एक समान नहीं दिखा , QED है।

टिप्पणी के जवाब में संपादित करें

पूर्ण मतभेदों का एक समान विश्लेषण |XY|का मानना है कि क्योंकि X और Y एक ही वितरण, है m=M.इसके लिए हमें Pr(XY=|Mm|)=2pq. का अध्ययन करना होगा एक ही बीजीय तकनीक लगभग एक ही परिणाम पैदावार, लेकिन वहाँ संभावना है कि है 2pq=2pq+(pq)2 और2pq+p2+q2=1. समीकरणों के सिस्टम अनूठा समाधान है किp=q=1/2 एक निष्पक्ष सिक्का करने के लिए इसी (एक "दो तरफा मरने")। इस अपवाद के अलावा पूर्ण अंतर के लिए परिणाम अंतर के लिए समान है, और समान अंतर्निहित कारणों के लिए पहले से ही दिए गए हैं: अर्थात्, दो iid यादृच्छिक चर के पूर्ण अंतर को समान रूप से वितरित नहीं किया जा सकता है जब भी दो से अधिक भिन्न अंतर हों सकारात्मक संभावना के साथ।

(संपादन का अंत)


आइए इस परिणाम को प्रश्न पर लागू करें, जो कुछ और जटिल के बारे में पूछता है।

रैंडम वैरिएबल X i , i = 1 , 2 , , n के साथ डाई के प्रत्येक स्वतंत्र रोल (जो एक अनुचित मौत हो सकता है ) को मॉडल करें मतभेद इन में मनाया एन रोल नंबर दिए गए हैं Δ एक्स मैं = एक्स मैं + 1 - एक्स मैं हमें आश्चर्य हो सकता है कि इन n - 1 संख्याओं को समान रूप से कैसे वितरित किया जाए । की अपेक्षित संख्या क्या है: वास्तव में सांख्यिकीय अपेक्षाओं के बारे में एक सवाल है कि Δ एक्स मैंXi, i=1,2,,n.nΔXi=Xi+1Xi.n1ΔXiउदाहरण के लिए, शून्य के बराबर हैं? की उम्मीद संख्या क्या है ΔXi के बराबर 1 ? आदि आदि।

इस सवाल का समस्याग्रस्त पहलू यह है कि है ΔXi कर रहे हैं नहीं , उदाहरण के लिए: स्वतंत्र ΔX1=X2X1 और ΔX2=X3X2 एक ही रोल शामिल X2.

हालाँकि, यह वास्तव में एक कठिनाई नहीं है। चूंकि सांख्यिकीय उम्मीद additive है और सभी मतभेद, एक ही वितरण हो, तो हम किसी भी संभावित मूल्य लेने k मतभेदों के कारण, कई बार की अपेक्षित संख्या के बराबर होती है अंतर k का पूरा अनुक्रम में n रोल सिर्फ है n1 के समय पर अपेक्षित संख्या में बार अंतर के बराबर होती है k प्रक्रिया का एक ही चरण में। यही कारण है कि एकल कदम उम्मीद है Pr(ΔXi=k) (किसी के लिए i )। ये अपेक्षाएँ सभी k (अर्थात, समान) के लिए समान होंगी) यदि और केवल यदि वे एक ही के लिए समान हैं ΔXi. लेकिन जैसा कि हमने देखा है कि कोई है ΔXi एक समान वितरण है, तब भी जब मरने पक्षपातपूर्ण हो सकता है। इस प्रकार, अपेक्षित आवृत्तियों के इस कमजोर अर्थ में भी , रोल के अंतर समान नहीं हैं।


@ मिचेल गुड पॉइंट: मैंने पूछे गए प्रश्न का उत्तर दिया (जो कि "अंतर" के बारे में है), बल्कि सचित्र के रूप में (जो स्पष्ट रूप से पूर्ण मतभेदों को संदर्भित करता है)। एक ही तकनीक लागू होती है - एक को अधिकतम और न्यूनतम अंतर दोनों पर विचार करना होगा। इस मामले में जहां उन केवल दो संभावनाएं (शून्य के साथ) कर रहे हैं में, हम है जो समानता प्राप्त कर सकते हैं, जहां Bernoulli परिणाम से (दिखा यह अनूठा उदाहरण है) आता है। (1/2)
whuber

इसका एक विशेष उत्तर साबित करने वाला एक और जवाब यहाँ है
मोनिका

धन्यवाद, @Ben: मैं उस धागे को भूल गया था। क्योंकि यह एक बेहतर संदर्भ है, मैं अब इस उत्तर में सीधे इसे लिंक करता हूं।
whuber

12

एक सहज स्तर पर, एक यादृच्छिक घटना केवल समान रूप से वितरित की जा सकती है यदि इसके सभी परिणाम समान रूप से होने की संभावना है।

सवाल में यादृच्छिक घटना के लिए ऐसा है - दो पासा रोल के बीच पूर्ण अंतर?

यह इस मामले में चरम सीमाओं को देखने के लिए पर्याप्त है - इस अंतर को ले जाने वाले सबसे बड़े और सबसे छोटे मूल्य क्या हो सकते हैं?

स्पष्ट रूप से 0 सबसे छोटा है (हम पूर्ण मतभेदों को देख रहे हैं और रोल समान हो सकते हैं), और 5 सबसे बड़ा ( 6बनाम 1) है।

हम दिखा सकते हैं कि घटना गैर-समान है जो 0यह दिखाती है कि (या कम) होने की संभावना है 5

एक नज़र में, 5 होने के केवल दो तरीके हैं - यदि पहला पासा 6 है और दूसरा 1, या इसके विपरीत । 0 के कितने तरीके हो सकते हैं?


1
+ 1 मुझे लगता है कि यह बात दिल तक पहुँच जाती है। मैंने इस प्रश्न का एक सामान्यीकरण पोस्ट किया है जो अंततः उसी अवलोकन पर निर्भर करता है।
whuber

5

जैसा कि हेनरी द्वारा प्रस्तुत किया गया था, समान रूप से वितरित वितरण के अंतर समान रूप से वितरित नहीं किए गए हैं।

नकली डेटा के साथ इसका वर्णन करने के लिए, हम एक बहुत ही सरल आर स्क्रिप्ट का उपयोग कर सकते हैं:

barplot(table(sample(x=1:6, size=10000, replace=T)))

enter image description here

हम देखते हैं कि यह वास्तव में एक समान वितरण का उत्पादन करता है। आइए अब इस वितरण से दो यादृच्छिक नमूनों के पूर्ण अंतर के वितरण पर एक नज़र डालें।

barplot(table(abs(sample(x=1:6, size=10000, replace=T) - sample(x=1:6, size=10000, replace=T))))

enter image description here


6
सीएलटी के साथ ऐसा करने के लिए कुछ क्यों नहीं है, जो बड़ी संख्या में आईआईडी मूल्यों के साधनों के विषम वितरण को चिंतित करता है?
whuber

2
nnn>1n=2 which is what OP is asking. (If this isn't self-explanatory, consider that if the sum were uniformly distributed when n=2, reindexing would imply that it is also uniform when n=4, etc, including for large n.)
krubo

3
@Krubo The original question asks about the distribution of differences between successive rolls of a die. The CLT has nothing to say about that. Indeed, no matter how many times the die is rolled, the distribution of those differences will not approach normality.
whuber

Does this distribution tend to uniform as the number of die faces tends to infinity? Not sure how to go about showing that, but intuitively it feels like it heads in that direction, but I don't know if it get asymptotically "blocked" somewhere before flattening enough
Cruncher

@Cruncher you can easily change the number of die faces in the R-Code. The more faces there are, the more apparent the stairwairs nature of the distribution becomes. '1' is always the peak of that stair and with larger differences the probabilities approximate zero. Additionally, difference of '0' is distinctly rarer than '1'. (at least if the die's smallest value is '1')
LuckyPal

2

Others have worked the calculations, I will give you an answer that seems more intuitive to me. You want to study the sum of two unifrom r.v. (Z = X + (-Y)), the overall distribution is the (discrete) convolution product :

P(Z=z)=k=P(X=k)P(Y=zk)

This sum is rather intuitive : the probability to get z, is the sum of the probabilities to get something with X (noted k here) and the complement to z with -Y.

From signal processing, we know how the convolution product behave:

  • The convolution product of two uniform function (two rectangles) will give a triangle. This is illustrated by wikipedia for continuous functions:

enter image description here

  • You can understand what happen here : as z move up (the vertical dotted line) the common domain of both rectangle move up then down, which correspond to the probability to get z.

  • More generally we know that the only functions that are stable by convolution are those of the gaussian familly. i.e. Only gaussian distribution are stable by addition (or more generally, linear combination). This is also meaning that you don't get a uniform distribution when combining uniform distributions.

As to why we get those results, the answer lies in the Fourrier decomposition of those functions. The Fourrier transformation of a convolution product being the simple product of the Fourrier transformations of each function. This give direct links between the fourrier coefficients of the rectangle and triangle functions.


Please check the validity of your claims and the logic of your answer. The question isn't whether the convolution of two uniform distributions is uniform: it's whether the convolution of some distribution and its reversal can be uniform. And there are far more distributional families than the Gaussian that are stable under convolution (modulo standardization, of course): see en.wikipedia.org/wiki/Stable_distribution
whuber

You are right about stable distributions. For the question, I am pretty sure this is about the difference of two random values with uniform distribution (as indicated by the title). The question whether the convolution of some distribution and its reversal can be uniform is larger than what is asked here.
lcrmorin

1

If x and y are two consecutive dice rolls, you can visualize |xy|=k (for k=0,1,2,3,4,5) as follows where each color corresponds to a different value of k:

consecutive dice rolls difference visualization

As you can easily see, the number of points for each color is not the same; therefore, the differences are not uniformly distributed.


0

Let Dt denote the difference and X the value of the roll, then P(Dt=5)=P(Xt=6,Xt1=1)<P((Xt,Xt1){(6,3),(5,2)})<P(Dt=3)

So the function P(Dt=d) is not constant in d. This means that the distribution is not uniform.

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.