असतत वर्दी वितरण से प्रतिस्थापन के बिना खींचे गए नमूनों के बीच अधिकतम अंतर


16

यह समस्या रोबोटिक कवरेज में मेरी प्रयोगशाला के अनुसंधान से संबंधित है:

प्रतिस्थापन के बिना सेट से यादृच्छिक रूप से संख्याएँ खींचें और संख्याओं को क्रम में क्रमबद्ध करें। ।n{1,2,,m}1nm

संख्याओं की इस क्रमबद्ध सूची से , लगातार संख्याओं और सीमाओं के बीच अंतर उत्पन्न करना: । यह अंतराल देता है ।{a(1),a(2),,a(n)}g={a(1),a(2)a(1),,a(n)a(n1),m+1a(n)}n+1

अधिकतम अंतर का वितरण क्या है?

P(max(g)=k)=P(k;m,n)=?

यह आदेश आँकड़ों का उपयोग करके तैयार किया जा सकता है : P(g(n+1)=k)=P(k;m,n)=?

अंतराल के वितरण के लिए लिंक देखें , लेकिन यह सवाल अधिकतम अंतराल के वितरण को पूछता है ।

मैं औसत मूल्य, \ mathbb {E} [g _ {(n + 1)}] से संतुष्ट रहूंगाE[g(n+1)]

यदि n=m सभी अंतराल आकार हैं 1. यदि n+1=m आकार 2 का एक अंतराल है 2, और n+1 संभावित स्थान हैं। अधिकतम गैप आकार है mn+1 , और इस अंतर से पहले या में से किसी के बाद रखा जा सकता है n , संख्या के लिए कुल n+1 संभव पदों। सबसे छोटा अधिकतम गैप आकार mnn+1 । किसी भी दिए गए संयोजन T = {m \ choose n} ^ {- 1} की संभावना को परिभाषित करें T=(mn)1

मैंने P (g _ {(n + 1)} = k) = P (k; m, n) = \ start {मामलों} 0 & k <\ lceil \ frac {mn} {के रूप में प्रायिकता मास फ़ंक्शन को आंशिक रूप से हल किया है (1)P(g(n+1)=k)=P(k;m,n)={0k<mnn+11k=mnn+11k=1 (occurs when m=n)T(n+1)k=2 (occurs when m=n+1)T(n+1)k=m(n1)n?m(n1)nkmn+1T(n+1)k=mn+10k>mn+1

वर्तमान कार्य (1): पहले अंतर के लिए समीकरण, a(1) सीधा है:

P(a(1)=k)=P(k;m,n)=1(mn)k=1mn+1(mk1n1)
अपेक्षित मूल्य का एक सरल मूल्य है: E[P(a(1))]=1(mn)k=1mn+1(mk1n1)k=mn1+n । समरूपता से, मुझे उम्मीद है कि सभी n अंतरालों में यह वितरण होगा। शायद इस वितरण n समय से ड्राइंग द्वारा समाधान पाया जा सकता है ।

वर्तमान कार्य (2): मोंटे कार्लो सिमुलेशन चलाना आसान है।

simMaxGap[m_, n_] := Max[Differences[Sort[Join[RandomSample[Range[m], n], {0, m+1}]]]];
m = 1000; n = 1; trials = 100000;
SmoothHistogram[Table[simMaxGap[m, n], {trials}], Filling -> Axis,
Frame -> {True, True, False, False},
FrameLabel -> {"k (Max gap)", "Probability"},
PlotLabel -> StringForm["m=``,n=``,smooth histogram of maximum map for `` trials", m, n, trials]][![enter image description here][1]][1]

1
इन शर्तों के साथ आपके पास n <= m होना चाहिए। मुझे लगता है कि आप g = {a_ (1), a_ (2) -a_ (1), ..., a_ (n) -a_ (n-1)} चाहते हैं। क्या बेतरतीब ढंग से पहली बार ड्रॉ पर प्रायिकता 1 / मी के साथ प्रत्येक संख्या का चयन करने का मतलब है? चूँकि आप दूसरी पर 1 / (m-1) की संभावना को प्रतिस्थापित नहीं करते हैं और इसलिए m = 0 पर नीचे 1 पर यदि n = m है। यदि n <m यह अंतिम ड्रॉ के साथ पहले रुकेगा तो nth ड्रा पर संभावना 1 / (m- (n-1)) होगा।
माइकल आर। चेर्निक

2
आपके मूल विवरण का कोई मतलब नहीं था, क्योंकि (मेरा मानना ​​है कि) आपने दो सदस्यताएँ लीं। कृपया पुष्टि करें कि मेरा संपादन आपके इरादे के अनुरूप है: विशेष रूप से, कृपया पुष्टि करें कि आपका मतलब वहाँ अंतराल है, जिनमें से पहला है। gna(1)
व्हिबर

1
@ मुझे लगता है कि यह आत्म-अध्ययन के बजाय शोध है
Glen_b -Reinstate मोनिका

1
मुझे लगता है कि आपके न्यूनतम और अधिकतम अंतर का आकार और होना चाहिए । न्यूनतम अंतर आकार तब होता है जब लगातार पूर्णांक चुने जाते हैं, और अधिकतम अंतराल आकार तब होता है जब आप और पहले पूर्णांक (या और ) का चयन करते हैं1mn+1mn11,,n11mn+2,,m
probabilityislogic

1
धन्यवाद माइकल चेरिक और प्रोबेबिलिसलॉगिक, आपके सुधार किए गए हैं। सुधार करने के लिए धन्यवाद @whuber!
एरोनबेकर

जवाबों:


9

आज्ञा देना मौका है कि न्यूनतम, , बराबर ; अर्थात् , नमूना में और -subset का समाहित है । कर रहे हैं से बाहर इस तरह के सबसेट समान रूप से होने की संभावना सबसेट, जिस कारण सेएक ( 1 ) जी जी एन - 1 { + 1 , जी + 2 , ... , मीटर } ( मीटर - जीf(g;n,m)a(1)ggn1{g+1,g+2,,m}( एम(mgn1)(mn)

Pr(a(1)=g=f(g;n,m)=(mgn1)(mn).

से अधिक सभी संभावित मूल्यों के लिए जोड़ने से उत्तरजीविता फलन होता हैकश्मीर जीf(k;n,m)kg

Pr(a(1)>g)=Q(g;n,m)=(mg)(mg1n1)n(mn).

चलो हो यादृच्छिक चर सबसे बड़ी खाई द्वारा दिए गए:Gn,m

Gn,m=max(a(1),a(2)a(1),,a(n)a(n1)).

(यह प्रश्न का उत्तर मूल रूप से तैयार किया गया है, इससे पहले कि यह और बीच एक अंतर को शामिल करने के लिए संशोधित किया गया था ) मीटरa(n)m पी(;n,मी)=पीआर( जी एन , मीटर >जी), जी एन , एम एन=1 हम इसके उत्तरजीविता फ़ंक्शन ) की गणना करेंगे जिसमें से का संपूर्ण वितरण आसानी से प्राप्त होता है। विधि शुरू होने वाला एक गतिशील कार्यक्रम है , जिसके लिए यह स्पष्ट है कि

P(g;n,m)=Pr(Gn,m>g),
Gn,mn=1

(1)P(g;1,m)=Pr(G1,m>1)=mgm, g=0,1,,m.

बड़े , ध्यान दें कि इवेंट इवेंट का संघ हैG n , m > gn>1Gn,m>g

a1>g,

जिसके लिए बहुत पहले अंतर , और अलग घटनाओं से अधिक हैजीgg

a1=k and Gn1,mk>g, k=1,2,,g

जिसके लिए पहला अंतराल बराबर और से बड़ा अंतर बाद में नमूने में होता है। कुल संभाव्यता का कानून इन घटनाओं की संभावनाओं को जोड़कर बताता है, जहांजीkg

(2)P(g;n,m)=Q(g;n,m)+k=1gf(k;n,m)P(g;n1,mk).

फिक्स करना और और द्वारा अनुक्रमित दो-तरफ़ा सरणी , हम का उपयोग करके गणना कर सकते हैं प्रत्येक पंक्ति में संचालन प्रति पंक्ति का उपयोग करके भरने के लिए इसकी पहली पंक्ति और को भरना है । नतीजतन तालिका संचालन में पूरी की जा सकती है और माध्यम से लिए सभी तालिकाओं का निर्माण संचालन में किया जा सकता है ।मैं = 1 , 2 , ... , n j = 1 , 2 , ... , मी पी ( ; n , मी ) ( 1 ) ( 2 ) हे ( जी एम ) हे ( जी एम एन ) जी = 1 ग्राम = मीटर - एन + 1 ( एम 3 एन )gi=1,2,,nj=1,2,,mP(g;n,m)(1)(2)O(gm)O(gmn)g=1g=mn+1O(m3n)

आकृति

ये ग्राफ़ अस्तित्व समारोह दिखाने के लिए । जैसे ही बढ़ता है, ग्राफ बड़े अंतराल की घटती संभावनाओं के अनुरूप बाईं ओर चला जाता है।gP(g;n,64)n=1,2,4,8,16,32,64n

लिए बंद किए गए सूत्र कई विशेष मामलों में प्राप्त किए जा सकते हैं, विशेष रूप से बड़े , लेकिन मैं एक बंद सूत्र प्राप्त करने में सक्षम नहीं हूं जो सभी पर लागू होता है । निरंतर समरूप चर के लिए अनुरूप समस्या के साथ इस समस्या को प्रतिस्थापित करके आसानी से उपलब्ध हैं।P(g;n,m)ng,n,m

अंत में, की उम्मीद को पर शुरू होने वाले अपने अस्तित्व समारोह के योग द्वारा प्राप्त किया जाता है :Gn,mg=0

E(Gn,m)=g=0mn+1P(g;n,m).

चित्र 2: अपेक्षा के समोच्च भूखंड

उम्मीद का यह समोच्च प्लॉट , अंधेरे से प्रकाश में स्नातक की उपाधि प्राप्त करता है।2,4,6,,32


सुझाव: लाइन "Let सबसे बड़ा अंतर द्वारा दिया गया यादृच्छिक चर है:", कृपया के अंतिम अंतराल को जोड़ें । आपकी उम्मीद की साजिश मेरे मोंटे कार्लो सिमुलेशन से मेल खाती है। Gn,mm+1an
एरोनबेकर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.