स्टोकेस्टिक प्रक्रिया की तरह हिमस्खलन

निम्नलिखित प्रक्रिया पर विचार करें:

ऊपर से नीचे तक व्यवस्थित किए गए डिब्बे हैं । प्रारंभ में, प्रत्येक बिन में एक गेंद होती है। हर कदम में हम $n$

यादृच्छिक और समान रूप से एक गेंद उठाओ $b$

बिन से सभी गेंदों को से नीचे बिन तक ले जाएं। यदि यह पहले से ही सबसे कम बिन था, तो हम गेंदों को प्रक्रिया से हटा देते हैं। $b$

जब तक प्रक्रिया समाप्त नहीं हो जाती, तब तक अपेक्षा के कितने चरण होते हैं, जब तक कि सभी $n$ गेंदों को प्रक्रिया से हटा नहीं दिया जाता? क्या इससे पहले इसका अध्ययन किया गया है? क्या इसका उत्तर ज्ञात तकनीकों से आसानी से है?

सबसे अच्छे मामले में, प्रक्रिया $n$ चरणों के बाद समाप्त हो सकती है । सबसे खराब स्थिति में यह $\Theta(n^2)$ कदम उठा सकता है। दोनों मामलों में बहुत ही संभावना नहीं होनी चाहिए। मेरे अनुमान है कि यह लेता है $\Theta(n\log n)$ कदम और मैं कुछ प्रयोग जो किया लगते हैं यह पुष्टि करने के लिए।

(ध्यान दें कि यादृच्छिक रूप से बिन को समान रूप से चुनना एक बहुत भिन्न प्रक्रिया है जो स्पष्ट रूप से समाप्त होने के लिए कदम उठाएगी।) $\Theta(n^2)$

pr.probability markov-chains stochastic-process

— मथायस
स्रोत

सवाल दिलचस्प लग रहा है (हालांकि मुझे जवाब नहीं पता है)। यह गैर-अखंडता के कारण मुश्किल लगता है; यदि सभी n बॉल्स शीर्ष बिन में हैं, तो प्रक्रिया बिल्कुल n चरणों में स्पष्ट रूप से समाप्त हो जाती है।

— त्सुयोशी इतो

जवाबों:

वास्तव में एक उत्तर नहीं है, लेकिन एन्ड्रेस के उत्तर पर एक विस्तारित टिप्पणी है।

आंद्रस के जवाब में एक अच्छा अंतर्ज्ञान है, हालांकि मुझे विश्वास नहीं है कि यह अपेक्षित चरणों की कठोर गणना है। मुझे लगता है कि यह शायद एक उत्तर के लिए एक अच्छा सन्निकटन है, लेकिन यह उन मामलों से ठीक से नहीं लगता है जहां उच्चतम कब्जा किए गए बिन के नीचे का बिन खाली हो जाता है इससे पहले कि ऊपरी बिन नीचे की ओर खाली हो जाता है। फिर भी, यह बनाने के लिए एक उचित अनुमान हो सकता है (मुझे यकीन नहीं है)।

उनकी गणना में एक त्रुटि है जो स्केलिंग को प्रभावित करती है। मैं बिल्कुल वही प्रारंभिक बिंदु लेने जा रहा हूं, और गणना को फिर से बढ़ाता हूं।

यह समन के अंदर p के एक कारक को याद करता है, क्योंकि बेतरतीब ढंग से सही बिन चुनने की संभावना बजाय । परिणामस्वरूप हमारे पास है $\frac{p}{n}$ $\frac{1}{n}$

$\begin{eqnarray*} n + \sum_{p=1}^n \sum_{k=0}^{\infty} (k+1) \frac{p}{n} \left(\frac{n-p}{n}\right)^k & = & n + \sum_{p=1}^{n} \frac{p}{n} \sum_{k=0}^{\infty} (k+1) \left(\frac{n-p}{n}\right)^k \\\\& = & n + \sum_{p=1}^{n} \frac{p}{n} \cdot \frac{n^2}{p^2} \\\\& = & n + n\sum_{p=1}^{n} 1/p \\\\& = & n (1+H_n) \end{eqnarray*}$

जहां n हैथोनिक संख्या है । को अनुमानित करने के लिए हम केवल एक अभिन्न के साथ योग को बदल सकते हैं: । इस प्रकार स्केलिंग या लगभग । हालांकि यह स्केलिंग समस्या के स्केलिंग से बिल्कुल मेल नहीं खाती है (नीचे सिमुलेशन देखें) यह लगभग पूर्ण रूप से का कारक है । $H_n = \sum_{p=1}^{n} 1/p$ $H_n$ $H_n \approx \int_{1}^{n+1} \frac{1}{x} dx = \log(n+1)$ $n (1+\log(n+1))$ $n \log(n+1)$ $\log(2)$

सिमुलेशन बनाम सिद्धांत

लाल घेरे: 10k रन से अधिक की प्रक्रिया के सिमुलेशन से डेटा अंक। हरा: । नीला: । $n \log_2(n+1)$ $n \log(n+1)$

— जो फिट्जिमोंस
स्रोत

@ जो: अच्छा काम! यह अब दिलचस्प होगा कि कैसे अंतराल के निर्माण से कारक आता है।

\ln 2

$\ln 2$

— एंड्रू सलामोन

@ András: मैं वास्तव में यह महसूस करने के लिए अच्छा नहीं है कि यह एक ध्वनि सन्निकटन है या नहीं। @ पीटर के झुंडों को बनाने का विचार जो शिफ्ट हो जाता है, ऐसा लगता है कि यह सही अभिव्यक्ति देना चाहिए कि ये किसी भी बिन में समान रूप से बनने की संभावना है।

— जो फिट्जसिमों ने

@ जो: शीर्ष अधिकांश गेंद लगभग 1/3 मामलों में अलग-थलग रहेगी। शीर्ष 3 गेंदों पर विचार करें। यदि बीच वाले को पहले (उन 3 में से) चुना जाता है, तो वह तीसरे में शामिल हो जाएगा। तब से ये दो वसीयत, शीर्ष गेंद के रूप में दो बार तेज चलती हैं। उनके और शीर्ष गेंद के बीच की दूरी एक भारी पक्षपातपूर्ण यादृच्छिक चलना है और शीर्ष गेंद को पकड़ने की संभावना एक छोटे (ish) निरंतर (मोटे अनुमान 15%) से बंधी है। लेकिन अच्छी खबर यह है कि शीर्ष लॉग एन गेंदों वास्तव में कोई बात नहीं होनी चाहिए। यदि n \ log n चरणों में और सब कुछ साफ़ हो जाता है, तो वे केवल अतिरिक्त n \ log n चरण जोड़ेंगे।

— मथायस

यहां दो प्लॉट हैं। दोनों द्वारा विभाजित चरणों की संख्या दिखाते हैं , जब तक कि सब कुछ गेंदों को साफ़ नहीं किया जाता। पहले एक के लिए, सिस्टम से बाहर जाने वाली गेंदों को अभी भी उठाया जा सकता है (जैसे कि एन्ड्रेस ने इसे प्रस्तावित किया है): tinyurl.com/2wg7a9y । दूसरे के लिए, सिस्टम से बाहर जाने वाली गेंदें अब नहीं ली जाती हैं: smallurl.com/33b63pq । जैसा कि आप देख सकते हैं, पहली प्रक्रिया जो सीमा दे सकती है वह शायद बहुत कमजोर है। हो सकता है कि इसे चरणों पर विचार करके ट्यून किया जा सकता है (जैसे पीटर ने कहीं लिखा था) जिसमें हम हमेशा सिस्टम में गेंदों की संख्या को आधा कर देते हैं?

n

$n$

\log n

$\log n$

— मथियास

@ मैथियास: पीटर के अंतर्ज्ञान को सही मानते हुए अपेक्षित समय का विश्लेषण करना सड़क अवरोध नहीं है (कम से कम मेरे नजरिए से)। मेरे लिए यह साबित करना कि यह अंतर्ज्ञान वास्तव में होता है, जो पहले होता है, का एक उचित प्रतिबिंब है, हालांकि मुझे संदेह है कि यह एक अच्छा सन्निकटन है।

— जो फिट्जसिमंस

संपादित करें: मैं इस उत्तर को (अभी के लिए) प्रमेय साबित करने की गन्दी प्रक्रिया को स्पष्ट करने के लिए छोड़ रहा हूँ, कुछ ऐसा जो प्रकाशित पत्रों से बचा हुआ है। यहां मुख्य अंतर्ज्ञान यह है कि यह शीर्ष गेंद पर ध्यान केंद्रित करने के लिए पर्याप्त है, क्योंकि यह इसके नीचे सभी को स्वीप करता है। कृपया टिप्पणियों को देखें (विशेष रूप से @Michael की ओर इशारा करते हुए कि अंतराल हो सकता है) और @ जो बाद में त्रुटियों की पहचान और सुधार के लिए उत्तर था। मुझे विशेष रूप से जो के प्रयोगों के दोहरे जांचने के प्रयोग पसंद हैं कि सूत्र समझदार थे।

निचला बाउंड जैसा कि आप इंगित करते हैं, लेकिन कुछ हद तक आश्चर्यजनक लगता है कि अपेक्षित चरणों की संख्या के लिए ऊपरी । $n$ $(1 + \pi^2/6)n$

इसे प्राप्त करने के लिए, ध्यान दें कि गेंदों का एक क्रम सभी डिब्बे को ठीक से साफ कर देगा यदि इसमें बाद में जैसे कि , , , । अनुक्रम में अतिरिक्त शर्तें आवश्यक हैं ताकि गेंदों को चुना जा सके जो अब सिस्टम में नहीं हैं, लेकिन ऊपरी सीमा के प्रयोजनों के लिए, मान लें कि डिब्बे का एक अनंत घटता क्रम है (इसलिए बिन छोड़ने पर गेंद गायब नहीं होती है 1, लेकिन बिन 0 पर ले जाया जाता है, फिर बिन -1, और इसी तरह)। फिर बाद में देखे जाने वाले चरणों की अपेक्षित संख्या के देखे जाने से पहले चरणों की संख्या है, साथ ही से पहले चरणों की अपेक्षित संख्या $b_1b_2\cdots b_n$ $b_1 = n$ $b_2 \ge n-1$ $\dots$ $b_i \ge n-i+1$ $b_1$ $b_2$ देखा जाता है, और इतने पर (1 से नीचे, क्योंकि संख्या ) में से कोई भी हो सकता है । इन्हें एक के बाद एक अलग-अलग घटनाओं के रूप में देखा जा सकता है। अपेक्षित चरणों की संख्या तब है $b_n$ $1,2,\ldots,n$

$\begin{eqnarray*}n + \sum_{p=1}^n \sum_{k=0}^{\infty} \frac{k+1}{n} \left(\frac{n-p}{n}\right)^k & = & n + \sum_{p=1}^{n-1} \frac{1}{n-p} \sum_{k=1}^{\infty} k\left(\frac{n-p}{n}\right)^k \\& = & n + \sum_{p=1}^{n-1} \frac{1}{n-p} n(n-p)/p^2 \\& = & n + n\sum_{p=1}^{n-1} 1/p^2 \\& \le & (1 + \pi^2/6)n. \end{eqnarray*}$

— आंद्रस सलामन
स्रोत

@Andras @Joe: पवित्र विद्वान। अगर इस साइट पर सवाल पूछने वाले सभी लोगों ने उनके सवालों को गंभीरता से लिया जैसा कि आप उनका जवाब देते हैं, तो यह इंटरनेट पर सबसे खराब यूआरएल होगा।

— हारून स्टर्लिंग

@ एंड्रस: मैं आपके कथन को समझने की कोशिश कर रहा हूं "गेंदों का एक क्रम सभी डिब्बे को ठीक से साफ कर देगा यदि इसमें एक बाद में ..."। शायद मैंने कुछ गलत समझा है, लेकिन कहते हैं कि हमारे पास चार गेंदें हैं। यदि अनुक्रम 3,4,3,2,4 है, तो यह आपकी बाद की आवश्यकता को पूरा करता है, फिर भी सभी डिब्बे साफ नहीं किए गए हैं।

— माइकल

@ एंड्रस: यदि आप एक उचित ऊपरी सीमा दिखाना चाहते हैं, तो आपको इस तथ्य का उपयोग करना होगा कि गेंद प्रक्रिया से गायब हो जाती है और अब नहीं उठाया जाता है। अन्यथा, सबसे अधिक गेंद हमेशा संभावना 1 / n के साथ चुनी जाती है और एक अच्छा मौका है (शायद 1/2 से थोड़ा कम) कि यह गेंद पूरे समय अलग-थलग रहेगी। इस गेंद के लिए, आपको n ^ 2 चरणों की आवश्यकता होगी।

— मथियास

@ माइकल: मुझे लगता है कि आपने गलती को पहचान लिया है। मैं गलत तरीके से मान रहा हूं कि शीर्ष गेंद नीचे गिर जाएगी भले ही एक अंतर हो।

— एन्द्रिस सलामोन

O (n)

$O(n)$

O (n \log n)

$O(n \log n)$

n / 2

$n/2$

\log n

$\log n$