कूपन कलेक्टर समय पर एक तंग कम बाध्य है?


20

क्लासिक कूपन कलेक्टर की समस्या में , यह सर्वविदित है कि समय बेतरतीब ढंग से चुने गए कूपन के एक सेट को पूरा करने के लिए आवश्यक है, , , और ।TnE[T]nlnnVar(T)n2Pr(T>nlnn+cn)<ec

यह ऊपरी सीमा चेबीशेव असमानता द्वारा दिए गए से बेहतर है, जो लगभग 1/c2

मेरा सवाल है: टी के लिए एक बेहतर से बेहतर Chebyshev कम बाध्य है ? (उदाहरण के लिए, \ Pr (T <n \ ln n - cn) <e ^ {- c} ) जैसा कुछ ?TPr(T<nlnncn)<ec


एक स्पष्ट निचली सीमा Pr(T<n)=0 , लेकिन मुझे लगता है कि आप इसके बारे में जानते हैं ...
onestop

जवाबों:


14

मैं इसे दूसरे उत्तर के रूप में प्रदान कर रहा हूं क्योंकि विश्लेषण पूरी तरह से प्राथमिक है और वास्तव में वांछित परिणाम प्रदान करता है।

प्रस्ताव के लिए c>0 और n1 ,

P(T<nlogncn)<ec.

प्रमाण के पीछे का विचार सरल है:

  1. उस समय का प्रतिनिधित्व करें जब तक कि सभी कूपन T = \ sum_ {i = 1} ^ n T_i के रूप में एकत्र न हो जाएंT=i=1nTi , जहां Ti वह समय है जब i th (heretofore) अद्वितीय कूपन एकत्र किया जाता है। Ti की औसत समय के साथ ज्यामितीय यादृच्छिक परिवर्तनीय हैं nni+1
  2. चेर्नॉफ़ बाउंड के एक संस्करण को लागू करें और सरल करें।

प्रमाण

किसी भी और किसी , हमारे पास उस रों > 0 पी ( टी < टी ) = पी ( - रों टी > - रों टी ) एस टी- रों टीt s>0

P(T<t)=P(esT>est)estEesT.

चूँकि और स्वतंत्र हैं, इसलिए हम टी मैं - रों टी = n Π मैं = 1- रों टी मैंT=iTiTi

EesT=i=1nEesTi

अब चूंकि ज्यामितीय है, चलो सफलता की संभावना के साथ कहें , तो एक साधारण गणना p i E e - s T i = p iTipi

EesTi=pies1+pi.

हमारी समस्या के लिए कर रहे हैं , , , आदि इसलिए, पी 1 = 1 पी 2 = 1 - 1 / n पी 3 = 1 - 2 / n n Π मैं = 1- रों टी मैं = n Π मैं = 1 मैं / npip1=1p2=11/np3=12/n

i=1nEesTi=i=1ni/nes1+i/n.

चलो चुनें और कुछ के लिए । फिर और , पैदावार टी = n लॉग ऑन n - सी एन सी > 0 एस टी = n - सीएस = 1 / n1 + 1 / n n Π मैं = 1 मैं / ns=1/nt=nlogncnc>0

est=nec
es=e1/n1+1/n
i=1ni/nes1+i/ni=1nii+1=1n+1.

इसे एक साथ रखने पर, हमें वह

P(T<nlogncn)nn+1ec<ec

जैसी इच्छा।


यह बहुत अच्छा है और बस डॉक्टर ने जो आदेश दिया है। धन्यवाद।
डेविड

@ डेविड, बस जिज्ञासु: इरादा आवेदन क्या है?
कार्डिनल

लम्बी कहानी। मैं एक मार्कोव श्रृंखला के मिश्रण समय के लिए एक निचली सीमा को साबित करने की कोशिश कर रहा हूं, जिसे मैंने एक एल्गोरिथ्म के चलने के समय का विश्लेषण करने के लिए पकाया है, जिसमें मेरी रुचि है - जो सी-बाउंडिंग सी को कम करने के लिए निकलता है .लक समस्या। BTW, मैं इस तरह के चेरनॉफ़-शैली के बाउंड को खोजने की कोशिश कर रहा था, लेकिन मुझे पता नहीं था कि उस उत्पाद से कैसे छुटकारा । अच्छा कॉल चुनना :-)। s = 1 / nis=1/n
डेविड

@ डेविड, , जबकि लगभग निश्चित रूप से उप-अपनाने वाला, स्पष्ट करने की कोशिश की तरह लग रहा था क्योंकि उसने , जो कि व्युत्पत्ति में प्राप्त किए गए शब्द के समान है। ऊपरी बाउंड। एस टी = n - सीs=1/nest=nec
कार्डिनल

1
निवेदन : मैंने जो प्रमाण दिया है वह मेरा अपना है। मैंने इस पर आनंद से काम किया, क्योंकि समस्या ने मुझे परेशान कर दिया। हालांकि, मैं नवीनता का कोई दावा नहीं करता हूं। वास्तव में, मैं कल्पना नहीं कर सकता कि एक समान तकनीक का उपयोग करने वाला एक समान प्रमाण पहले से ही साहित्य में मौजूद नहीं है। यदि किसी को किसी संदर्भ का पता है, तो कृपया इसे एक टिप्पणी के रूप में यहां पोस्ट करें। मुझे एक के बारे में जानने में बहुत दिलचस्पी होगी ।
कार्डिनल

9

हालाँकि @cardinal ने पहले ही एक जवाब दे दिया है जो ठीक उसी तरह का बाउंड देता है जिसकी मुझे तलाश थी, मुझे एक समान चेरोफ़-शैली का तर्क मिला है जो एक मजबूत बाउंड दे सकता है:

प्रस्ताव : (यह लिए अधिक मजबूत है )c > π 2

Pr(Tnlogncn)exp(3c2π2).
c>π23

प्रमाण :

जैसा कि @ कार्डिनल के उत्तर में, हम इस तथ्य का उपयोग कर सकते हैं कि स्वतंत्र ज्यामितीय यादृच्छिक चर जिसमें सफलता की संभावनाएं । यह इस प्रकार है कि और ।TTipi=1i/nE[Ti]=1/piE[T]=i=1nE[Ti]=ni=1n1inlogn

अब नए चर और । फिर हम Si:=TiE[Ti]S:=iSi

Pr(Tnlogncn)Pr(TE[T]cn)=Pr(Scn)
=Pr(exp(sS)exp(scn))escnE[esS]

औसत की गणना करना, हमारे पास है

E[esS]=iE[esSi]=ies/pi1+1pi(es1)e12s2ipi2
जहां असमानता तथ्यों से है कि और भी के लिए ।es1sez1+ze12z2z0

इस प्रकार, के बाद से , हम लिख सकते हैं ipi2=n2i=1n11i2n2π2/6

Pr(Tnlogncn)e112(nπs)2scn.

से कम करने पर , हम अंत में s>0

Pr(Tnlogncn)e3c2π2

1
(+1) मोदुलो को मामूली टाइपोस के एक जोड़े, यह अच्छा है। अपने मतलब के करीब कुछ के रूप में विस्तार किया है अक्सर बेहतर काम करता है। मैं असममित परिणामों के प्रकाश में उच्च क्रम अभिसरण को देखकर आश्चर्यचकित नहीं हूं। अब, आप देख सकते हैं एक समान जैसे ऊपरी बाध्य, कि साबित होता है है subexponential Vershynin की शब्दावली है, जो उपाय एकाग्रता के बारे में कई निहितार्थ हैं में। (Tnlogn)/n
कार्डिनल

1
तर्क सीधे ऊपरी सीमा पर सामान्यीकरण नहीं करता है। का आदान प्रदान के लिए (और लिए ), एक समान चरणों की गणना की बात करने के अनुसरण कर सकते हैं । इस बिंदु पर, हालांकि, मैं जो सबसे अच्छा कर सकता हूं वह है , जो अभी भी और मैं डॉन 'इसके साथ क्या करना हैccssE[esS]ies/pi1spiez1zexp(z22(1z))
E[esS]e12s2ipi2(1s/pi)
डेविड

2
दिलचस्प रूप से पर्याप्त है, हालांकि, संपूर्ण तर्क (निचली सीमा के लिए) न केवल कूपन कलेक्टर समस्या के लिए काम करता है, बल्कि बाध्य चर के साथ गैर-समरूप, स्वतंत्र ज्यामितीय चर के किसी भी योग के लिए काम करता है। विशेष रूप से: , जहां प्रत्येक सफलता की संभावना साथ एक स्वतंत्र GV है , और जहां , तो T=iTiTipiipi2A<
Pr(TE[T]a)ea22A
डेविड

4

महत्वपूर्ण नोट : मैंने मूल रूप से इस उत्तर में दिए गए प्रमाण को हटाने का फैसला किया है। यह अब और अधिक कम्प्यूटेशनल था, बड़े हथौड़ों का इस्तेमाल किया, और मेरे द्वारा दिए गए अन्य प्रमाण की तुलना में एक कमजोर परिणाम साबित हुआ। चारों ओर, एक अवर दृष्टिकोण (मेरे विचार में)। यदि आप वास्तव में रुचि रखते हैं, तो मुझे लगता है कि आप संपादन देख सकते हैं।

Asymptotic परिणाम है कि मैं मूल रूप से उद्धृत किया और जो अभी भी इस जवाब में नीचे पाए जाते हैं शो करना है कि के रूप में हम थोड़ा बेहतर की तुलना में अन्य जवाब है, जिसके लिए रखती में साबित कर दिया बाध्य कर सकते हैं सबn n


निम्नलिखित स्पर्शोन्मुख परिणाम धारण करते हैं

P(T>nlogn+cn)1eec

तथा

P(Tnlogncn)eec.

निरंतर और सीमाएँ रूप में ली जाती हैं । ध्यान दें कि, हालांकि वे दो परिणामों में अलग हो गए हैं, वे बहुत ही समान परिणाम हैं क्योंकि किसी भी मामले में nonnegative होने के लिए विवश नहीं है।cRnc

उदाहरण के लिए, मोटवानी और राघवन, रैंडमाइज़्ड अल्गोरिथम, पीपी। 60--63 को प्रमाण के लिए देखें।


इसके अलावा : डेविड कृपया इस उत्तर के लिए टिप्पणियों में अपनी कथित ऊपरी बाध्यता के लिए एक प्रमाण प्रदान करता है।


हां, यह प्रत्येक निश्चित । उदाहरण के लिए लेविन, पेरेस और विल्मर की पुस्तक मार्कोव चेन और मिक्सिंग टाइम्स, प्रोपोज़ल 2.4 में एक (बहुत ही सरल) प्रमाण पाया जा सकता है। हालांकि सबूत निचले बाउंड के लिए काम नहीं करता है। n
डेविड

1
वास्तव में, मैं यहां प्रमाण भी लिख सकता : " ऐसी घटना है कि -th [कूपन] प्रकार पहले कूपन के बीच नहीं आता है । पहले उस निरीक्षण करें। । चूंकि प्रत्येक परीक्षण में प्रायिकता है न कि कूपन और ट्रायल स्वतंत्र हैं। दाहिने हाथ की ओर ऊपर , साबित करना (2.7)। " Aiinlogn+cnP(τ>nlogn+cn)=P(iAi)iP(Ai)1n1ii(11/n)nlogn+cnnexp(nlogn+cnn)=ec
डेविड

@ डेविड, यह काफी अच्छा और सरल है। मैं जल्दी से एक और शब्द द्वारा समावेश-बहिष्करण सूत्र का विस्तार करने के साथ खेला, लेकिन जल्दी से कहीं भी नहीं मिला और इसके आगे देखने का समय नहीं था। इवेंट घटना के बराबर है कि परीक्षणों के बाद कोई कूपन नहीं बचा है । उसके साथ एक मार्टिंगेल जुड़ा होना चाहिए। क्या आपने मार्टिंगेल से संबंधित (प्रकल्पित) पर हॉफिंग की असमानता की कोशिश की? स्पर्शोन्मुखी परिणाम मजबूत माप एकाग्रता का सुझाव देते हैं। {T<tn}tn
कार्डिनल

@ दाविद, आपके सबूत के ऊपर एक साइन फ्लिप है, लेकिन मुझे यकीन है कि यह अन्य पाठकों के लिए भी स्पष्ट है।
कार्डिनल

@ डेविड, कृपया मेरे दूसरे पोस्ट किए गए प्रश्न का उत्तर देखें। आपके द्वारा दिए गए ऊपरी बाउंड की तुलना में विधि भिन्न है, लेकिन नियोजित उपकरण लगभग मेरे द्वारा दिए गए उत्तर के विपरीत प्राथमिक हैं।
कार्डिनल

2

बेंजामिन डेरे देता है (अध्याय "रैंडमाइज़्ड सर्च हेयूरिस्टिक्स: टूल इन प्रोबेबिलिटी थ्योरी" पुस्तक में "रैंडमाइज्ड सर्च हेयूरिस्टिक्स का सिद्धांत", ऑनलाइन पीडीएफ के लिए लिंक देखें)

प्रोपोज़ल लेट कूपन संग्रह प्रक्रिया का रोक समय है। उसके बाद ।TPr[T(1ϵ)(n1)lnn]enϵ

यह वांछित asymptotics (@ कार्डिनल के दूसरे उत्तर से) देने के लिए लगता है, लेकिन सभी और लिए सही होने के लाभ के साथ ।nϵ

यहाँ एक प्रूफ स्केच है।

सबूत स्केच: Let घटना है कि हो सकता है मई के कूपन एकत्र किया जाता है में पहली खींचता है। इस प्रकार, । मुख्य तथ्य यह है कि नकारात्मक रूप से सहसंबद्ध है, किसी , । सहज रूप से, यह काफी स्पष्ट है, क्योंकि यह जानते हुए कि पहले ड्रॉ में -th कूपन यह संभावना कम कर देगा कि -th कूपन भी पहले ड्रॉ में खींचा गया है। मैं टी पीआर [ एक्स मैं = 1 ] = ( 1 - 1 / n ) टी एक्स मैं मैं [ एन ] पीआर [ मैं मैं , एक्स मैं = 1 ] Π मैं मैं पीआर [ एक्स मैं = 1 ]XiitPr[Xi=1]=(11/n)tXiI[n]Pr[iI,Xi=1]iIPr[Xi=1]टी जे टीitjt

एक दावे को साबित कर सकता है, लेकिन प्रत्येक चरण पर को 1 से बढ़ाकर । फिर यह उस में प्रदर्शित करने के लिए , । समान रूप से, औसत रूप से, यह । डॉयर केवल इसके लिए एक सहज तर्क देता है। एक सबूत के लिए एक एवेन्यू इस प्रकार है। एक देख सकते हैं कि करने के लिए सशर्त कूपन में कूपन के सभी के बाद आने वाले , कि से एक नया कूपन निकलने की संभावना ड्राइंग के बाद अब तक अब है , पिछले के बजायIPr[iI,Xi=1|Xj=1]Pr[iI,Xi=1]jIPr[iI,Xi=1|Xj=0]Pr[iI,Xi=1]jIIk|I|kn1|I|kn । ऐसे में उसके सड़ते हुए ज्यामितीय यादृच्छिक चर का एक राशि के रूप में सभी कूपन इकट्ठा करने के लिए, हम पर है कि कंडीशनिंग देख सकते हैं आने के बाद -coupon सफलता की संभावनाओं को बढ़ाता है, और इस तरह कंडीशनिंग केवल यह बनाता कर अधिक होने की संभावना पहले कूपन इकट्ठा करने के लिए ( स्टोचैस्टिक प्रभुत्व द्वारा: प्रत्येक ज्यामितीय यादृच्छिक चर को स्टोकेस्टिक के प्रभुत्व के संदर्भ में, कंडीशनिंग द्वारा बढ़ाया जाता है, और इस प्रभुत्व को फिर योग पर लागू किया जा सकता है)।jI

इस नकारात्मक सहसंबंध को देखते हुए, यह निम्न है कि , जो देता है के साथ बाध्य होना चाहिए ।Pr[T(1ϵ)(n1)lnn](1(11/n)t)nt=(1ϵ)(n1)lnn

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.