बॉल्स को बिन्स में फेंकने से इसकी संभावना कम होने का अनुमान है


14

यह एक होमवर्क नहीं है, हालांकि यह जैसा दिखता है। किसी भी संदर्भ का स्वागत है। :-)

परिदृश्य: हैं n अलग गेंदों और n अलग डिब्बे (1 से करने का लेबल लगा हुआ n , बाएं से दाएं)। प्रत्येक गेंद को स्वतंत्र रूप से और समान रूप से डिब्बे में फेंक दिया जाता है। आइए आई ~ वें बिन f(i)में गेंदों की संख्या हो । चलो मैं निम्न इवेंट को दर्शाते हैं।iEi

प्रत्येक के लिए ji , kjf(k)j1

यही कारण है, पहले j डिब्बे (सबसे बाएं j डिब्बे) की तुलना में कम होता है j प्रत्येक के लिए, गेंदों ji

प्रश्न: अनुमान i<nPr(Ei) , के मामले में n ? जब n अनंत जाता है। एक निम्नतर को प्राथमिकता दी जाती है। मुझे नहीं लगता कि आसानी से गणना की गई फॉर्मूला एक्सिसिट है।

limnPr(E1)=limn(n1n)n=1ePr(En)=0

मेरा अनुमान है: मुझे लगता है कि , जब अनंत जाता है। मैंने में पहले आइटम पर विचार किया ।n ln ni<nPr(Ei)=lnnnlnn


1
यह जन्मदिन की समस्या से एक सबकेस की तरह लग रहा है ..
गोपी

@ गोपी मैं खुद को समझा नहीं सकता कि मेरा सवाल एक जन्मदिन की समस्या है। क्या आप इसे स्पष्ट रूप से समझा सकते हैं? आपका बहुत बहुत धन्यवाद। नोट: बाधा पहले में गेंदों की राशि पर है , डिब्बे विशिष्ट बिन पर डिब्बे की संख्या पर नहीं। j
पेंग झांग

दरअसल, मेरा बुरा, जन्मदिन की समस्या पर विकिपीडिया लेख को फिर से पढ़ने के बाद मुझे एहसास हुआ कि मैं एक और समस्या पर विचार कर रहा था जिसे जन्मदिन की समस्या से अनुकूलित किया गया था।
गोपी

2
कुछ गलत विचार ... तो इस बारे में सोचें कि कैसे एक राज्य को एन्कोड किया जाए: पढ़ने के लिए डब्बे फॉर्म को बाएं से दाएं। यदि पहली बिन में आई बॉल्स हैं, तो मैं एक सीक्वेंस को आउटपुट करता हूं, उसके बाद 0. एक से बाएं से दाएं सभी डिब्बे के लिए ऐसा करें। आपको लगता है कि आपको लगता है कि इस बाइनरी स्ट्रिंग (जिसमें n शून्य और n वाले हैं) के लिए पहली बार कोड करने में रुचि है, इसमें शून्य से अधिक वाले शामिल हैं। अब, भाग्य की एक छलांग लगाने और 0 और 1 को समान संभावना उत्पन्न करने देता है । (यह पूरी बकवास हो सकती है)। यह समस्या कैटलन संख्या और डाइक शब्दों से संबंधित है। तथा...??? 1/2
सरील हर-पेलेड

4
मैं आपके बचाव में नहीं देखता कि यह क्यों मायने रखता है कि गेंदें अलग हैं। इसके अलावा, स्ट्रिंग की घुसपैठ इस तथ्य को ध्यान में रखती है कि डिब्बे अलग हैं।
सरियल हर-पेलेड

जवाबों:


11

संपादित करें: (2014-08-08) जैसा कि डगलस ज़ेरे टिप्पणियों में बताते हैं, नीचे तर्क, विशेष रूप से दो संभावनाओं के बीच 'पुल' गलत है। मैं इसे ठीक करने के लिए एक सीधा आगे रास्ता नहीं देखता। मैं इस सवाल का जवाब यहाँ छोड़ देंगे के रूप में मेरा मानना है कि यह अभी भी कुछ अंतर्ज्ञान प्रदान करता है, लेकिन पता है कि है नहीं सच सामान्य रूप में।

Pr(Em)l=1mPr(Fl)

यह एक पूर्ण उत्तर नहीं होगा, लेकिन उम्मीद है कि इसमें पर्याप्त सामग्री होगी जिसे आप या खुद से अधिक जानकार इसे खत्म कर सकते हैं।

पहली ( ) डिब्बे में गिरने वाली गेंदों की संभावना पर विचार करें :एल एनkln

(nk)(ln)k(nln)nk

इस संभावना को कॉल करें कि से कम गेंदें पहले डिब्बे में :lF lFl

Pr(Fl)=k=0l1(nk)(ln)k(nln)nk

घटना, , ऊपर होने की संभावना इस बात से कम है कि हमने प्रत्येक घटनाओं को स्वतंत्र रूप से और सभी को एक साथ माना । यह हमें दोनों के बीच एक पुल देता है:एफ एलElFl

Pr(Em)l=1mPr(Fl)=l=1m(k=1l1(nk)(lnk)(nln)nk)=l=1mF(l1;n,ln)

कहाँ है द्विपद वितरण के लिए संचयी बंटन फ़ंक्शन के साथ । विकिपीडिया पृष्ठ पर नीचे कुछ पंक्तियाँ पढ़ते हुए, और यह देखते हुए कि , हम पाने के लिए चेरोफ़ की असमानता का उपयोग कर सकते हैं :पी=एलF(l1;n,ln) (एल-1पीएन)p=ln(l1pn)

Pr(Em)l=1mexp[12l]=exp[12l=1m1l]=exp[12Hm]exp[12(12m+ln(m)+γ)]

कहाँ है 'वें हार्मोनिक संख्या , यूलर-Mascheroni निरंतर और के लिए असमानता है लिंक किए गए पृष्ठ Wolfram के मैथवर्ल्ड से लिया जाता है। मीटर γ एच मीटरHmmγHm

कारक के बारे में चिंता न करें , यह अंत में हमें देता है:e1/4m

Pr(Em)eγ/2m

नीचे फ़ंक्शन साथ एक फ़ंक्शन के रूप में लिए औसत 100,000 उदाहरणों का लॉग-लॉग प्लॉट भी संदर्भ के लिए प्लॉट किया गया है:मीटर - γ / 2n=2048meγ/2m

यहाँ छवि विवरण दर्ज करें

जबकि स्थिरांक बंद हैं, फ़ंक्शन का रूप सही प्रतीत होता है।

नीचे एक फ़ंक्शन के रूप में 100,000 बिंदुओं के औसत के साथ प्रत्येक बिंदु के साथ भिन्न करने के लिए लॉग-लॉग प्लॉट है :एमnm

यहाँ छवि विवरण दर्ज करें

अंत में, मूल प्रश्न के लिए जिसे आपने उत्तर दिया था, क्योंकि हम जानते हैं कि हमारे पास है:Pr(Em)1m

i<nPr(Ei)n

और संख्यात्मक सत्यापन के रूप में नीचे दिए गए योग, का एक लॉग-लॉग साजिश है , उदाहरण के आकार की तुलना में, । प्रत्येक बिंदु 100,000 उदाहरणों के योग का औसत दर्शाता है। फ़ंक्शन को संदर्भ के लिए प्लॉट किया गया है:एन एक्स 1 / 2Snx1/2

यहाँ छवि विवरण दर्ज करें

जबकि मुझे दोनों के बीच कोई सीधा संबंध नहीं दिखता है, इस समस्या के ट्रिक्स और अंतिम रूप में जन्मदिन की समस्या के साथ बहुत सी समानताएं हैं जैसा कि शुरुआत में टिप्पणियों में अनुमान लगाया गया था।


4
आपको कैसे मिलता है? उदाहरण के लिए, , मैं गणना करता हूं कियदि आपसे कहा जाए कि पहली बिन खाली है, तो क्या यह कम या ज्यादा संभावना है कि पहले दो डिब्बे सबसे अधिक गेंद पर पकड़ते हैं ? यह अधिक संभावना है, इसलिए एक कम है। Pr(E2)Pr(F1)×Pr(F2)n=100Pr(E2)=0.267946>0.14761=Pr(F1)Pr(F2).1Pr(F1)Pr(F2)
डगलस ज़रे

@ डगलसजारे, मैंने आपकी गणनाओं को सत्यापित किया है, आप सही हैं। अधिक कठोर नहीं होने के लिए मुझे सही काम करता है।
user834

15

उत्तर है ।Θ(n)

सबसे पहले, की गणना करें ।En1

मान लीजिए कि हम गेंदों को डिब्बे में फेंकते हैं , और इस संभावना को देखें कि एक बिन में वास्तव में गेंदें हैं। यह संभावना पोइसन डिस्ट्रीब्यूशन से आती है, और की संभावना के अनुसार को जाता है कि किसी दिए गए बिन में बिल्कुल बॉल्स हैं ।nnknk1e1k!

अब, आइए गेंदों को डिब्बे में वितरित करने का एक अलग तरीका देखें। हम प्रत्येक बिन प्वासों बंटन, और घटना देखते हैं कि पर हालत से चुना में गेंदों के एक नंबर फेंक गेंदों कुल। मेरा दावा है कि यह बिल्कुल उसी तरह का वितरण देता है जैसे गेंदों को डिब्बे में फेंकना । क्यों? यह देखना आसान है कि th bin में गेंदों के होने की संभावना दोनों में ।nnnkjjj=1n1kj!

तो चलो एक यादृच्छिक चाल पर विचार करें जहां प्रत्येक चरण पर, आप प्रायिकता साथ से । मैं दावा करता हूं कि अगर आप इस स्थिति पर ध्यान दें कि यह रैंडम वॉक स्टेप्स के बाद 0 पर लौटेगा , तो यह रैंडम हमेशा से ऊपर रहने की संभावना है, ओपी गणना करना चाहता है। क्यों? के बाद इस यादृच्छिक चलने के इस ऊंचाई कदम दूर है शून्य से पहले में गेंदों की संख्या डिब्बे।tt+1k1e1k!n0sss

यदि हमने प्रत्येक चरण पर या ऊपर या नीचे जाने की की संभावना के साथ एक यादृच्छिक चलना चुना है , तो यह शास्त्रीय मतपत्र समस्या होगी , जिसके लिए उत्तर । यह एक बैलट समस्या का एक प्रकार है जिसका अध्ययन किया गया है ( इस पेपर को देखें ), और उत्तर अभी भी । मुझे नहीं पता कि इस मामले के लिए लिए स्थिरांक की गणना करने का एक आसान तरीका है या नहीं ।12112(n1)Θ(1n)Θ(1n)

एक ही पेपर से पता चलता है कि जब रैंडम वॉक को ऊंचाई पर समाप्त होने के लिए वातानुकूलित किया जाता है , तो हमेशा सकारात्मक रहने की संभावना जब तक कि । यह तथ्य हमें किसी भी लिए अनुमान लगाने ।kΘ(k/n)k=O(n)Ess

मैं अपने उत्तर के बाकी हिस्सों के लिए थोड़ा सा काम करने जा रहा हूं, लेकिन इस कठोर बनाने के लिए मानक संभाव्यता तकनीकों का उपयोग किया जा सकता है।

हम जानते हैं कि जैसे ही जाता है , यह रैंडम वॉक ब्राउनियन ब्रिज में परिवर्तित हो जाता है, यानी ब्राउनियन मोशन पर शुरू और समाप्त होने के लिए वातानुकूलित होता है । सामान्य प्रायिकता प्रमेयों से, , रैंडम वॉक -axis से दूर मोटे तौर पर है । मामले में यह ऊंचाई है , संभावना है कि यह ऊपर बनी रही पूरे समय के लिए पहले है । चूँकि होने की संभावना है, जब , हमारे पासn0ϵn<s<(1ϵ)nΘ(n)xt>00sΘ(t/s)tΘ(n)s=Θ(n)EsΘ(1/n)


4

[संपादित करें २०१४-० :-१३: पीटर शोर की एक टिप्पणी के लिए धन्यवाद, मैंने इस श्रृंखला की विषम विकास दर के अपने अनुमान को बदल दिया है।]

मेरा विश्वास है कि रूप में बढ़ता है । मेरे पास कोई सबूत नहीं है लेकिन मुझे लगता है कि मेरे पास एक ठोस तर्क है।limni<nPr(Ei)n

आज्ञा देना एक यादृच्छिक चर है जो बिन में गेंदों की संख्या देता है । चलो एक यादृच्छिक चर कि डिब्बे में गेंदों की कुल संख्या देता हो के माध्यम से समावेशी।Bi=f(i)iBi,j=k=ijBkij

अब आप किसी भी के लिए उस अंत तक, आइए फ़ंक्शन और का परिचय ।Pr(Ei)=b<jPr(EjB1,j=b)Pr(EiEjB1,j=b)j<iπgi

π(j,k,b)=Pr(Bj=kB1,j1=b)=(nbk)(1nj+1)k(njnj+1)nbk

gi(j,k,b)=Pr(EiBj,ikEj1B1,j1=b)={0k<01k>=0j>il=0jb1π(j,l,b)gi(j+1,kl,b+l)otherwise

हम लिख सकते हैं के मामले में :Pr(Ei)gi

Pr(Ei)=gi(1,i1,0)

अब, यह की परिभाषा से स्पष्ट हैgi

Pr(Ei)=(ni)ni+1nnhi(n)

जहां डिग्री में एक बहुपद है । यह कुछ सहज ज्ञान युक्त भी बनाता है; कम से कम गेंदों को th bins (जिनमें से ) के माध्यम से वें में से एक में डालना होगा ।hi(n)ni1ni+1(i+1)nni

चूँकि हम केवल बारे में बात कर रहे हैं जब , का केवल मुख्य गुणांक प्रासंगिक है; चलो इस गुणांक । फिरPr(Ei)nhi(n)ai

limnPr(Ei)=aiei

हम गणना कैसे करते हैं ? खैर, यह वह जगह है जहाँ मैं थोड़ा हाथ मिलाने का काम करूँगा। यदि आप पहले कुछ काम करते हैं , तो आप देखेंगे कि इस गुणांक की गणना में एक पैटर्न उभरता है। आप इसे लिख सकते हैंaiEi

ai=μi(1,i1,0)
जहां
μi(j,k,b)={0k<01k>=0i>jl=0jb11l!μi(j+1,kl,b+l)otherwise

अब, मैं एक -फॉर्म को सीधे प्राप्त करने में सक्षम नहीं था, लेकिन मैंने के पहले 20 मूल्यों की गणना की :Pr(Ei)

N       a_i/e^i
1       0.367879
2       0.270671
3       0.224042
4       0.195367
5       0.175467
6       0.160623
7       0.149003
8       0.139587
9       0.131756
10      0.12511
11      0.119378
12      0.114368
13      0.10994
14      0.105989
15      0.102436
16      0.0992175
17      0.0962846
18      0.0935973
19      0.0911231
20      0.0888353

अब, यह पता चला है कि

Pr(Ei)=iii!ei=Pois(i;i)

जहां संभावना एक यादृच्छिक चर है कि महत्व है जब यह मतलब के साथ एक प्वासों बंटन से तैयार है । इस प्रकार हम अपनी राशि को लिख सकते हैंPois(i;λ)Xiλ

limni=1nPr(Ei)=x=1xxx!ex

वोल्फ्राम अल्फा मुझे इस श्रृंखला के डायवर्जेस बताता है । पीटर शोर एक टिप्पणी में बताते हैं कि स्टर्लिंग का अनुमान हमें का अनुमान लगाने की अनुमति देता है :Pr(Ei)

limnPr(Ex)=xxx!ex12πx

चलो

ϕ(x)=12πx

जबसे

  • limxϕ(x)ϕ(x+1)=1
  • ϕ(x) घट रहा है
  • 1nϕ(x)dx के रूप मेंn

हमारी श्रृंखला (उदाहरण के लिए प्रमेय 2 देखें रूप में बढ़ती है । अर्थात्,1nϕ(x)dx

i=1nPr(Ei)=Θ(n)

1
वोल्फ्रम अल्फा गलत है। स्टर्लिंग के सूत्र का उपयोग करें । यह कहता है कि, । xx/(x!ex)1/2πx
पीटर शोर

@PeterShor धन्यवाद! मैंने आपकी जानकारी के लिए निष्कर्ष को अपडेट किया है, और अब मैं अन्य दो उत्तरों के साथ समझौता कर रहा हूं। यह मेरे लिए दिलचस्प है कि इस समस्या के लिए 3 बिल्कुल अलग दृष्टिकोण देखें।
Ruds

4

पहले कुछ शब्दों (सभी n ^ n मामलों की जांच करके) और थोड़ी-बहुत खोज देखने से पता चलता है कि उत्तर https://oeis.org/A036276 / । इसका मतलब है कि उत्तर । ~ n 1nnn12π2

अधिक सटीक रूप से, उत्तर है: और कोई भी बंद-रूप नहीं है जवाब।

n!2nnk=0n2nkk!

Oeis बहुत बढ़िया है
थॉमस अहले
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.