टूटी हुई छड़ी (स्पेसिंग) के सबसे बड़े टुकड़े का वितरण


21

लंबाई 1 की छड़ी को k+1 टुकड़े में समान रूप से यादृच्छिक पर तोड़ा जाए । सबसे लंबे टुकड़े की लंबाई का वितरण क्या है?

और अधिक औपचारिक रूप से, (U1,Uk) IID U(0,1) , और let (U(1),,U(k)) संबंधित आदेश आँकड़े हों, अर्थात हम केवल ऐसे नमूने का आदेश देते हैं एक तरीका है कि U(1)U(2),,U(k) । चलोZk=max(U(1),U(2)U(1),,U(k)U(k1),1U(k))

मुझे के वितरण में । क्षण, स्पर्शोन्मुख परिणाम, या लिए सन्निकटन भी दिलचस्प हैं।Zkk


9
यह एक अच्छी तरह से अध्ययन की समस्या है; आर। पाइके (1965), "स्पेसिंग," जेआरएसएस (बी) 27 : 3, पीपी। 395-449 देखें। मैं बाद में कुछ जानकारी जोड़ने के लिए वापस आने की कोशिश करूंगा जब तक कि कोई मुझे इसके लिए नहीं धड़कता। एक ही लेखक (" स्पेसिंग रिविजिटेड ") द्वारा 1972 का एक पेपर भी है, लेकिन मुझे लगता है कि आप जो कुछ भी कर रहे हैं, वह पहले में बहुत ज्यादा है। Devroye (1981) में कुछ स्पर्शोन्मुख दवाएं हैं, "यूनिफ़ॉर्म स्पेसिंग्स के ऑर्डर स्टेटिस्टिक्स के लिए लॉटर आइटरेटेड लॉगरिथम" । Probab। , 9 : 5, 860-867।
Glen_b -Reinstate Monica

4
जिन्हें बाद में जरूरत पड़ने पर काम करने के लिए कुछ अच्छे खोज शब्द देने चाहिए।
Glen_b -Reinstate मोनिका

3
यह कमाल का है। पहला संदर्भ खोजना कठिन है। रुचि रखने वालों के लिए, मैंने इसे द ग्रैंड लोस पर रखा ।
गुइयूम जुमे

कृपया गलत विवरण सही करें: बजाय । Y(k)U(k)
विक्टर

धन्यवाद @Viktor! ऐसी छोटी चीजों के लिए, अपने आप को संपादित करने में संकोच न करें (मुझे लगता है कि अनुमोदन के लिए अन्य उपयोगकर्ताओं द्वारा इसकी समीक्षा की जाएगी)।
gui11aume

जवाबों:


18

@Glen_b द्वारा दी गई जानकारी से मुझे इसका उत्तर मिल सकता है। प्रश्न के रूप में समान सूचनाओं का उपयोग करना

P(Zkx)=j=0k+1(k+1j)(1)j(1jx)+k,

जहां if और अन्यथा। मैं Gumbel ( NB : बीटा नहीं ) वितरण के लिए अपेक्षा और असममित अभिसरण भी देता हूंएक > 0 0a+=aa>00

E(Zk)=1k+1i=1k+11ilog(k+1)k+1,P(Zkx)exp(e(k+1)x+log(k+1)).

प्रमाणों की सामग्री को संदर्भों में जुड़े कई प्रकाशनों से लिया गया है। वे कुछ लंबे, लेकिन सीधे हैं।

1. सटीक वितरण का प्रमाण

आज्ञा देना IID अंतराल में एक समान यादृच्छिक चर हैं । उन्हें आदेश देकर, हम प्राप्त किए गए ऑर्डर आंकड़े प्राप्त करते हैं । समान को , और रूप में परिभाषित किया गया है । आदेश दिए गए स्पेसिफिकेशन संबंधित क्रमबद्ध आँकड़े । ब्याज का चर ।( 0 , 1 ) कश्मीर ( यू ( 1 ) , ... , यू ( कश्मीर ) ) Δ मैं = यू ( मैं ) - यू ( मैं - 1 ) यू ( 0 ) = 0 यू ( कश्मीर + 1 ) = 1 Δ ( 1 )(U1,,Uk)(0,1)k(U(1),,U(k))Δi=U(i)U(i1)U(0)=0U(k+1)=1 Δ ( कश्मीर + 1 )Δ(1)Δ(k+1)Δ(k+1)

निश्चित , हम संकेतक चर । समरूपता द्वारा, यादृच्छिक वेक्टर विनिमेय है, इसलिए आकार सबसेट का संयुक्त वितरण उसी तरह है जैसे संयुक्त वितरण पहला । उत्पाद का विस्तार करके, हम इस प्रकार प्राप्त करते हैं1 मैं = 1 { Δ मैं > एक्स } ( 1 1 , ... , 1 कश्मीर + 1 ) जे जेx(0,1)1i=1{Δi>x}(11,,1k+1)jj

P(Δ(k+1)x)=E(i=1k+1(11i))=1+j=1k+1(k+1j)(1)jE(i=1j1i).

अब हम साबित करेंगे कि , जो ऊपर दिए गए वितरण को स्थापित करेगा। हम इसे लिए साबित करते हैं , क्योंकि सामान्य मामला भी इसी तरह साबित होता है। j = 2E(i=1j1i)=(1jx)+kj=2

E(i=121i)=P(Δ1>xΔ2>x)=P(Δ1>x)P(Δ2>x|Δ1>x).

यदि , ब्रेकप्वाइंट अंतराल । इस घटना पर सशर्त रूप से, विराम बिंदु अभी भी विनिमेय हैं, इसलिए यह संभावना है कि दूसरे और पहले विराम बिंदु के बीच की दूरी की तुलना में अधिक है , संभावना है कि पहले विराम बिंदु और बाएं अवरोध के बीच की दूरी (स्थिति ) से अधिक है । इसलिएΔ1>xk(x,1)xxx

P(Δ2>x|Δ1>x)=P(all points are in (2x,1)|all points are in (x,1)),soP(Δ2>xΔ1>x)=P(all points are in (2x,1))=(12x)+k.

2. अपेक्षा

परिमित सहायता के साथ वितरण के लिए, हमारे पास है

E(X)=P(X>x)dx=1P(Xx)dx.

के वितरण को एकीकृत करते हुए , हम प्राप्त करते हैंΔ(k+1)

E(Δ(k+1))=1k+1j=1k+1(k+1j)(1)j+1j=1k+1j=1k+11j.

अंतिम समानता हार्मोनिक संख्या का एक क्लासिक प्रतिनिधित्व है , जिसे हम नीचे प्रदर्शित करते हैं।Hi=1+12++1i

Hk+1=011+x++xkdx=011xk+11xdx.

परिवर्तनशील के परिवर्तन और उत्पाद के विस्तार के साथ, हम प्राप्त करते हैंu=1x

Hk+1=01j=1k+1(k+1j)(1)j+1uj1du=j=1k+1(k+1j)(1)j+1j.

3. वर्दी स्पेसिंग का वैकल्पिक निर्माण

सबसे बड़े टुकड़े के एसिम्प्टोटिक वितरण को प्राप्त करने के लिए, हमें समान स्पैकिंग के शास्त्रीय निर्माण का प्रदर्शन करना होगा, क्योंकि उनकी राशि से विभाजित घातीय चर। संबंधित आदेश आँकड़ों की संभाव्यता घनत्व है(U(1),,U(k))

fU(1),U(k)(u(1),,u(k))=k!,0u(1)u(k+1).

यदि हम एक समान को साथ निरूपित करते हैं , तो हम प्राप्त करते हैंΔi=U(i)U(i1)U(0)=0

fΔ1,Δk(δ1,,δk)=k!,0δi++δk1.

को परिभाषित करके , हम इस प्रकार प्राप्त करते हैंU(k+1)=1

fΔ1,Δk+1(δ1,,δk+1)=k!,δ1++δk=1.

अब, साथ IID घातीय यादृच्छिक चर , और । परिवर्तनशील परिवर्तन के साथ, हम इसे देख सकते हैं(X1,,Xk+1)S=X1++Xk+1

fX1,Xk,S(x1,,xk,s)=es.

परिभाषित करें , जैसे कि परिवर्तनशील परिवर्तन हम प्राप्त करते हैंYi=Xi/S

fY1,Yk,S(y1,,yk,s)=skes.

इस घनत्व को संबंध में एकीकृत करते हुए , हम इस प्रकार प्राप्त करते हैंs

fY1,Yk,(y1,,yk)=0skesds=k!,0yi++yk1,and thusfY1,Yk+1,(y1,,yk+1)=k!,y1++yk+1=1.

तो अंतराल पर वर्दी स्पेसिंग का संयुक्त वितरण उनकी राशि से विभाजित घातीय यादृच्छिक चर के संयुक्त वितरण के समान है । हम वितरण के निम्नलिखित तुल्यता पर आते हैंk+1(0,1)k+1

Δ(k+1)X(k+1)X1++Xk+1.

4. असममित वितरण

उपरोक्त समानता का उपयोग करते हुए, हम प्राप्त करते हैं

P((k+1)Δ(k+1)log(k+1)x)=P(X(k+1)(x+log(k+1))X1++Xk+1k+1)=P(X(k+1)log(k+1)x+(x+log(k+1))Tk+1),

जहां । यह चर संभावना में गायब हो जाता है क्योंकि और । समान रूप से, वितरण । क्योंकि IID हैं, हमारे पास हैंTk+1=X1++Xk+1k+11E(Tk+1)=0Var(log(k+1)Tk+1)=(log(k+1))2k+10X(k+1)log(k+1)Xi

P(X(k+1)log(k+1)x)=P(X1x+log(k+1))k+1=(1exlog(k+1))k+1=(1exk+1)k+1exp{ex}.

5. ग्राफिकल अवलोकन

नीचे दिए गए कथानक विभिन्न मूल्यों के लिए सबसे बड़े टुकड़े के वितरण को दर्शाता है । के , मैंने एसिम्प्टोटिक गम्बल वितरण (पतली रेखा) पर भी काबू पा लिया है। Gumbel छोटे मानों के लिए एक बहुत ही खराब सन्निकटन है इसलिए मैं चित्र को ओवरलोड न करने के लिए उन्हें छोड़ देता हूं। Gumbel सन्निकटन से अच्छा है ।kk=10,20,50kk50

टूटी हुई छड़ी के सबसे बड़े टुकड़े का वितरण

6. सन्दर्भ

उपरोक्त प्रमाण 2 और 3 के संदर्भों से लिए गए हैं। उद्धृत साहित्य में कई और परिणाम होते हैं, जैसे कि किसी भी रैंक के आदेशित spacings का वितरण, उनकी सीमा वितरण और आदेशित वर्दी spacings के कुछ वैकल्पिक निर्माण। मुख्य संदर्भ आसानी से सुलभ नहीं हैं, इसलिए मैं पूर्ण पाठ के लिंक भी प्रदान करता हूं।

  1. बैरमोव एट अल। (2010) आदेशित वर्दी स्पेसिंग के लिए परिणाम सीमित करें , स्टेटमेंट पेपर, 51: 1, पीपी 227-240
  2. होल्स्ट (1980) यादृच्छिक पर टूटी एक छड़ी के टुकड़ों की लंबाई पर , जे। एपल। शायद, 17, पीपी 623-634
  3. पाइके (1965) स्पेसिंग , जेआरएसएस (बी) 27: 3, पीपी 395-449
  4. रेनी (1953) ऑर्डर के आंकड़ों के सिद्धांत पर , एक्टा मैथ हंग, 4, पीपी 191-231

प्रतिभाशाली। वैसे, क्या लिए एक ज्ञात ? E(Zk2)
आमिर सगिव

@AmirSagiv यह एक अच्छा सवाल है। मेरे पास संदर्भों पर एक त्वरित नज़र थी और मुझे यह नहीं मिला। मैं उपर्युक्त प्रमाण को भी अनुकूल नहीं बना सका। इससे मुझे एहसास हुआ कि मुझे नहीं पता कि गमबेल के एक वर्ग का वितरण क्या है। शायद एक अच्छी जगह शुरू करने के लिए?
gui11aume

1
$ gui11aume यहाँ देखें: mathoverflow.net/a/293381/42864
अमीर सगिव

1
@AmirSagiv यह एक बहुत अच्छी पोस्ट है। किसी कारण से, मैंने आपके प्रश्न को गलत समझा और सोचा कि आप के वितरण में रुचि रखते थे (भले ही आपकी टिप्पणी बहुत स्पष्ट थी), इसलिए उपरोक्त मेरी टिप्पणी इतनी प्रासंगिक नहीं है। Zk2
gui11aume

3

यह पूर्ण उत्तर नहीं है, लेकिन मैंने कुछ त्वरित सिमुलेशन किए, और यही मैंने प्राप्त किया: Histogram of the longest fragment

यह उल्लेखनीय रूप से बीटा-ईश लगता है, और यह थोड़ा समझ में आता है, क्योंकि आईआईडी वर्दी वितरण के आदेश आँकड़े बीटा विकी हैं

यह परिणामी पीडीएफ प्राप्त करने के लिए कुछ शुरुआती बिंदु दे सकता है।

यदि मुझे अंतिम बंद समाधान मिल जाता है तो मैं अपडेट करूंगा।

चीयर्स!


बस एक और बात, बढ़ती कश्मीर के लिए हिस्टोग्राम का आकार काफी हद तक नहीं बदलता है, इसके अलावा "स्क्विट" को 0. के करीब होने पर
लीमा

1
आपके विचारों के लिए धन्यवाद @ लिमा (और क्रॉस वेलिडेट में आपका स्वागत है)। मुझे लगता है कि आपके उत्तर में सुधार किया जा सकता है। पहले, मैं बिना सबूत के बयान देने से बचना चाहूंगा। यदि यह गलत है, तो आप उन लोगों को रख सकते हैं जो इस धागे को गलत रास्ते पर देखते हैं। दूसरा, मैं दस्तावेज करूंगा कि आपने क्या किया। आपके द्वारा उपयोग किए गए और बिना कोड के मान के बिना , आंकड़ा किसी की मदद नहीं करता है। अंत में, मैं उत्तर को कॉपी-एडिट करूंगा और हर उस चीज को हटा दूंगा जो सीधे सवाल का जवाब नहीं दे रही है। k
गुई

1
सुझाव के लिए धन्यवाद। वे स्टैक एक्सचेंज से परे वैध हैं, और मैं उनका उपयोग करना याद रखूंगा।
लीमा

1

मैंने 2005 में सिएना (इटली) में एक सम्मेलन के लिए जवाब तैयार किया। कागज (2006) मेरी वेब-साइट पर यहां प्रस्तुत किया गया है (पीडीएफ) । सभी स्पेसिंग (सबसे छोटे से सबसे बड़े) के सटीक वितरण पृष्ठ 75 और 76 पर पाए जाते हैं।

मैं सितंबर 2016 में मैनचेस्टर (इंग्लैंड) में आरएसएस सम्मेलन में इस विषय पर एक प्रस्तुति देने की उम्मीद कर रहा हूं।


2
साइट पर आपका स्वागत है। हम प्रश्नों और उत्तरों के रूप में उच्च-गुणवत्ता वाले सांख्यिकीय जानकारी का एक स्थायी भंडार बनाने की कोशिश कर रहे हैं। इस प्रकार, हम लिंक-ओनली उत्तरों से सावधान रहते हैं, क्योंकि लिंकरोट के कारण। यदि आप मृत हो जाते हैं, तो क्या आप लिंक पर पूर्ण उद्धरण और जानकारी का सारांश पोस्ट कर सकते हैं? इसके अलावा, कृपया यहां अपनी पोस्ट पर हस्ताक्षर न करें। हर पोस्ट में आपके उपयोगकर्ता पृष्ठ का एक लिंक होता है जहाँ आप उस जानकारी को पोस्ट कर सकते हैं।
गंग -
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.