एन अंतराल को समान रूप से यादृच्छिक रूप से आकर्षित करना, संभावना है कि कम से कम एक अंतराल सभी अन्य के साथ ओवरलैप हो


17

[ 0 , 1 ] से यादृच्छिक रूप से एनn अंतराल , जहां प्रत्येक अंत बिंदु A, B को [ 0 , 1 ] के बीच समान वितरण से चुना जाता है ।[0,1][0,1]

क्या संभावना है कि कम से कम एक अंतराल सभी दूसरों के साथ ओवरलैप हो जाए?


आप इस संभावना को देख सकते हैं कि अंतिम खींचा गया A nAn , पहले खींचे गए A के न्यूनतम से छोटा है A, और अंतिम B nBn , सभी पहले खींचे गए B के अधिकतम से अधिक है Bयह मददगार होना चाहिए। फिर इस तथ्य को ध्यान में रखने की संभावना बढ़ जाती है कि हमें पिछले एक की आवश्यकता नहीं है , लेकिन कोई भी। (मेरे पास इसके माध्यम से काम करने का समय नहीं है, लेकिन यह एक छोटी सी समस्या की तरह लग रहा है। सौभाग्य!)
एस। कोलास - मोनिका

यह कुछ आश्चर्यजनक हो सकता है कि (1) उत्तर वितरण पर निर्भर नहीं करता है (केवल यह कि यह निरंतर हो) और (2) n > 1 के लिएn>1 यह निरंतर है!
whuber

1
क्या यह है कि कैसे n वें अंतराल को विवश किया जाता है: i) [0,1] से यादृच्छिक रूप से दो संख्याओं को समान रूप से आकर्षित करते हैं, ii) छोटे को A nAn और बड़े को B n होने देंBn ?
इक्वल

जवाबों:


5

यह पोस्ट प्रश्न का उत्तर देती है और इसे सही साबित करने की दिशा में आंशिक प्रगति की रूपरेखा देती है।


के लिए n = 1 , जवाब तुच्छता है 1 । सभी बड़े के लिए n , यह हमेशा है (आश्चर्यजनक) 2 / 3n=11n2/3

यह देखने के लिए, पहले यह देखें कि प्रश्न को किसी भी सतत वितरण F (समान वितरण के स्थान पर) के लिए सामान्यीकृत किया जा सकता है । वह प्रक्रिया जिसके द्वारा n अंतरालों को 2 n iid वेरिएंट X 1 , X 2 , , X 2 n को F से आरेखित करने और अंतराल बनाने के लिए राशियाँ उत्पन्न की जाती हैं।Fn2nX1,X2,,X2nF

[ मिनट ( एक्स 1 , एक्स 2 ) , अधिकतम ( एक्स 1 , एक्स 2 ) ] , , [ मिनट ( एक्स 2 एन - 1 , एक्स 2 एन ) , अधिकतम ( एक्स 2 एन - 1 , एक्स 2 एन ) ]

[min(X1,X2),max(X1,X2)],,[min(X2n1,X2n),max(X2n1,X2n)].

क्योंकि सभी 2 n की एक्स मैं स्वतंत्र हैं, वे कर रहे हैं विनिमय। इसका मतलब है कि समाधान समान होगा यदि हम यादृच्छिक रूप से उन सभी को अनुमति देने के लिए थे। आइए , एक्स i को छाँटते हुए प्राप्त किए गए आदेश आँकड़ों पर अपनी स्थिति दें :2nXiXi

एक्स ( 1 ) < एक्स ( 2 ) < < एक्स ( 2 n )

X(1)<X(2)<<X(2n)

(जहां, क्योंकि एफ निरंतर है, शून्य संभावना है कि कोई भी दो समान होंगे)। N अंतराल एक यादृच्छिक क्रमपरिवर्तन का चयन करके बनते हैं σ एस 2 n और उन्हें जोड़े में जोड़नेFnσS2n

[ मिनट ( एक्स σ ( 1 ) , एक्स σ ( 2 ) ) , अधिकतम ( एक्स σ ( 1 ) , एक्स σ ( 2 ) ) ] , ... , [ मिनट ( एक्स σ ( 2 n - 1 ) , एक्स σ ( 2 n ) ) , अधिकतम ( एक्स σ ( 2 n - 1 ) , एक्स σ ( 2 एन ) )]

[min(Xσ(1),Xσ(2)),max(Xσ(1),Xσ(2))],,[min(Xσ(2n1),Xσ(2n)),max(Xσ(2n1),Xσ(2n))].

इन ओवरलैप के किसी भी दो या नहीं, के मूल्यों पर निर्भर नहीं करता एक्स ( मैं ) ,X(i) क्योंकि ओवरलैपिंग करते हुए किसी monotonic परिवर्तन संरक्षित है : आरआर और वहाँ इस तरह के परिवर्तनों कि भेजने हैं एक्स ( मैं ) के लिए मैं । इस प्रकार, बिना किसी नुकसान के, हम X ( i ) = i ले सकते हैं और प्रश्न बन जाता है:f:RRX(i)iX(i)=i

सेट करें { 1 , 2 , , 2 n - 1 , 2 n } को n disjoint doubletons में विभाजित किया जाए । उनमें से कोई भी दो, { l 1 , r 1 } और { l 2 , r 2 } ( l i < r i के साथ ), जब r 1 > l 2 और r 2 > l 1 ओवरलैप होते हैं{1,2,,2n1,2n}n{l1,r1}{l2,r2}li<rir1>l2r2>l1। यह कहें कि एक विभाजन "अच्छा" है, जब इसका कम से कम एक तत्व सभी अन्य को ओवरलैप करता है (और अन्यथा "बुरा" है)। N के एक समारोह के रूप में , अच्छे विभाजन का अनुपात क्या है?n

वर्णन करने के लिए, मामले पर विचार करें n = 2 । तीन विभाजन हैं,n=2

{ { 1 , 2 } , { 3 , 4 } } , { { 1 , 4 } , { 2 , 3 } } , { { 1 , 3 } , { 2 , 4 } } ,  

{{1,2},{3,4}}, {{1,4},{2,3}}, {{1,3},{2,4}},

जिनमें से दो अच्छे (दूसरे और तीसरे) लाल रंग के हैं। इस प्रकार के मामले में जवाब n = 2 है 2 / 3n=22/3

हम इस तरह के विभाजन को ग्राफ़ कर सकते हैं { { l i , r i } , "i = 1 , 2 , , n } अंकों की साजिश रचकर { 1 , 2 , , 2 n } को एक संख्या रेखा पर और प्रत्येक l i और r i के बीच रेखाखंडों को आरेखित करते हुए, दृश्य ओवरलैप्स को हल करने के लिए उन्हें थोड़ा ऑफसेट करते हुए। यहाँ एक ही रंग के साथ एक ही क्रम में पूर्ववर्ती तीन विभाजन के भूखंड हैं:{{li,ri},i=1,2,,n}{1,2,,2n}liri

Figure 1

अब से, इस प्रारूप में ऐसे भूखंडों को आसानी से फिट करने के लिए, मैं उन्हें बग़ल में बदल दूंगा। उदाहरण के लिए, यहाँ n = 3 के लिए 15 विभाजन हैं , एक बार फिर अच्छे लाल रंग के साथ:15n=3

Figure 2

दस, अच्छे हैं तो के लिए जवाब n = 3 है 10 / 15 = 2 / 3n=310/15=2/3

पहली दिलचस्प स्थिति तब होती है जब n = 4 । अब, पहली बार, अंतराल के संघ के लिए 2 एन के माध्यम से 1 को स्पैन करना संभव है, उनमें से किसी एक के बिना दूसरों को प्रतिच्छेद करना। एक उदाहरण { { 1 , 3 } , { 2 , 5 } , { 4 , 7 } , { 6 , 8 } } है । लाइन खंडों का संघ 1 से 8 तक अखंड चलता हैn=412n{{1,3},{2,5},{4,7},{6,8}}1 but this is not a good partition. Nevertheless, 70 of the 105 partitions are good and the proportion remains 2/3.


The number of partitions increases rapidly with n: it equals 1352n1=(2n)!/(2nn!). Exhaustive enumeration of all possibilities through n=7 continues to yield 2/3 as the answer. Monte-Carlo simulations through n=100 (using 10000 iterations in each) show no significant deviations from 2/3.

I am convinced there is a clever, simple way to demonstrate there is always a 2:1 ratio of good to bad partitions, but I have not found one. A proof is available through careful integration (using the original uniform distribution of the Xi), but it is rather involved and unenlightening.


Very cool. I have a hard time following what it means to "condition on the order statistics", would it be possible to add a line of intuition? Seems like a useful technique. I understand up to that the Xi are exchangeable, indeed even iid, that that this allows us to consider any permutation.
ekvall

1
@Student To "condition on" means to say, let's temporarily hold these values fixed and consider what we can learn from that. Later, we will let those values vary (according to their probability distribution). In this case, once we find that the answer is 2/3 regardless of the fixed values of the order statistics, then we no longer have to carry out the second step of varying the order statistics. Mathematically, the order stats are a vector-valued variable X and the indicator of being good is Y, so E(Y)=E(E(Y|X))=E(2/3)=2/3.
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.