स्टोकेस्टिक प्रक्रिया की तरह हिमस्खलन


16

निम्नलिखित प्रक्रिया पर विचार करें:

ऊपर से नीचे तक व्यवस्थित किए गए डिब्बे हैं । प्रारंभ में, प्रत्येक बिन में एक गेंद होती है। हर कदम में हमn

  1. यादृच्छिक और समान रूप से एक गेंद उठाओb
  2. बिन से सभी गेंदों को से नीचे बिन तक ले जाएं। यदि यह पहले से ही सबसे कम बिन था, तो हम गेंदों को प्रक्रिया से हटा देते हैं।b

जब तक प्रक्रिया समाप्त नहीं हो जाती, तब तक अपेक्षा के कितने चरण होते हैं, जब तक कि सभी n गेंदों को प्रक्रिया से हटा नहीं दिया जाता? क्या इससे पहले इसका अध्ययन किया गया है? क्या इसका उत्तर ज्ञात तकनीकों से आसानी से है?

सबसे अच्छे मामले में, प्रक्रिया n चरणों के बाद समाप्त हो सकती है । सबसे खराब स्थिति में यह Θ(n2) कदम उठा सकता है। दोनों मामलों में बहुत ही संभावना नहीं होनी चाहिए। मेरे अनुमान है कि यह लेता है Θ(nlogn) कदम और मैं कुछ प्रयोग जो किया लगते हैं यह पुष्टि करने के लिए।

(ध्यान दें कि यादृच्छिक रूप से बिन को समान रूप से चुनना एक बहुत भिन्न प्रक्रिया है जो स्पष्ट रूप से समाप्त होने के लिए कदम उठाएगी।)Θ(n2)


सवाल दिलचस्प लग रहा है (हालांकि मुझे जवाब नहीं पता है)। यह गैर-अखंडता के कारण मुश्किल लगता है; यदि सभी n बॉल्स शीर्ष बिन में हैं, तो प्रक्रिया बिल्कुल n चरणों में स्पष्ट रूप से समाप्त हो जाती है।
त्सुयोशी इतो

जवाबों:


11

वास्तव में एक उत्तर नहीं है, लेकिन एन्ड्रेस के उत्तर पर एक विस्तारित टिप्पणी है।

आंद्रस के जवाब में एक अच्छा अंतर्ज्ञान है, हालांकि मुझे विश्वास नहीं है कि यह अपेक्षित चरणों की कठोर गणना है। मुझे लगता है कि यह शायद एक उत्तर के लिए एक अच्छा सन्निकटन है, लेकिन यह उन मामलों से ठीक से नहीं लगता है जहां उच्चतम कब्जा किए गए बिन के नीचे का बिन खाली हो जाता है इससे पहले कि ऊपरी बिन नीचे की ओर खाली हो जाता है। फिर भी, यह बनाने के लिए एक उचित अनुमान हो सकता है (मुझे यकीन नहीं है)।

उनकी गणना में एक त्रुटि है जो स्केलिंग को प्रभावित करती है। मैं बिल्कुल वही प्रारंभिक बिंदु लेने जा रहा हूं, और गणना को फिर से बढ़ाता हूं।

यह समन के अंदर p के एक कारक को याद करता है, क्योंकि बेतरतीब ढंग से सही बिन चुनने की संभावना बजाय । परिणामस्वरूप हमारे पास हैपीn1n

n+p=1nk=0(k+1)pn(npn)k=n+p=1npnk=0(k+1)(npn)k=n+p=1npnn2p2=n+np=1n1/p=n(1+Hn)

जहां n हैथोनिक संख्या है । को अनुमानित करने के लिए हम केवल एक अभिन्न के साथ योग को बदल सकते हैं: । इस प्रकार स्केलिंग या लगभग । हालांकि यह स्केलिंग समस्या के स्केलिंग से बिल्कुल मेल नहीं खाती है (नीचे सिमुलेशन देखें) यह लगभग पूर्ण रूप से का कारक है ।एच एन एच एनn + 1 1 1Hn=p=1n1/pHnn(1+लॉग(n+1))nलॉग(n+1)लॉग(2)Hn1n+11xdx=log(n+1)n(1+log(n+1))nlog(n+1)log(2)

सिमुलेशन बनाम सिद्धांत

लाल घेरे: 10k रन से अधिक की प्रक्रिया के सिमुलेशन से डेटा अंक। हरा: । नीला: ।एन लॉग ( एन + )nlog2(n+1)nlog(n+1)


@ जो: अच्छा काम! यह अब दिलचस्प होगा कि कैसे अंतराल के निर्माण से कारक आता है। ln2
एंड्रू सलामोन

@ András: मैं वास्तव में यह महसूस करने के लिए अच्छा नहीं है कि यह एक ध्वनि सन्निकटन है या नहीं। @ पीटर के झुंडों को बनाने का विचार जो शिफ्ट हो जाता है, ऐसा लगता है कि यह सही अभिव्यक्ति देना चाहिए कि ये किसी भी बिन में समान रूप से बनने की संभावना है।
जो फिट्जसिमों ने

@ जो: शीर्ष अधिकांश गेंद लगभग 1/3 मामलों में अलग-थलग रहेगी। शीर्ष 3 गेंदों पर विचार करें। यदि बीच वाले को पहले (उन 3 में से) चुना जाता है, तो वह तीसरे में शामिल हो जाएगा। तब से ये दो वसीयत, शीर्ष गेंद के रूप में दो बार तेज चलती हैं। उनके और शीर्ष गेंद के बीच की दूरी एक भारी पक्षपातपूर्ण यादृच्छिक चलना है और शीर्ष गेंद को पकड़ने की संभावना एक छोटे (ish) निरंतर (मोटे अनुमान 15%) से बंधी है। लेकिन अच्छी खबर यह है कि शीर्ष लॉग एन गेंदों वास्तव में कोई बात नहीं होनी चाहिए। यदि n \ log n चरणों में और सब कुछ साफ़ हो जाता है, तो वे केवल अतिरिक्त n \ log n चरण जोड़ेंगे।
मथायस

यहां दो प्लॉट हैं। दोनों द्वारा विभाजित चरणों की संख्या दिखाते हैं , जब तक कि सब कुछ गेंदों को साफ़ नहीं किया जाता। पहले एक के लिए, सिस्टम से बाहर जाने वाली गेंदों को अभी भी उठाया जा सकता है (जैसे कि एन्ड्रेस ने इसे प्रस्तावित किया है): tinyurl.com/2wg7a9y । दूसरे के लिए, सिस्टम से बाहर जाने वाली गेंदें अब नहीं ली जाती हैं: smallurl.com/33b63pq । जैसा कि आप देख सकते हैं, पहली प्रक्रिया जो सीमा दे सकती है वह शायद बहुत कमजोर है। हो सकता है कि इसे चरणों पर विचार करके ट्यून किया जा सकता है (जैसे पीटर ने कहीं लिखा था) जिसमें हम हमेशा सिस्टम में गेंदों की संख्या को आधा कर देते हैं? लॉग एनnlogn
मथियास

@ मैथियास: पीटर के अंतर्ज्ञान को सही मानते हुए अपेक्षित समय का विश्लेषण करना सड़क अवरोध नहीं है (कम से कम मेरे नजरिए से)। मेरे लिए यह साबित करना कि यह अंतर्ज्ञान वास्तव में होता है, जो पहले होता है, का एक उचित प्रतिबिंब है, हालांकि मुझे संदेह है कि यह एक अच्छा सन्निकटन है।
जो फिट्जसिमंस

9

संपादित करें: मैं इस उत्तर को (अभी के लिए) प्रमेय साबित करने की गन्दी प्रक्रिया को स्पष्ट करने के लिए छोड़ रहा हूँ, कुछ ऐसा जो प्रकाशित पत्रों से बचा हुआ है। यहां मुख्य अंतर्ज्ञान यह है कि यह शीर्ष गेंद पर ध्यान केंद्रित करने के लिए पर्याप्त है, क्योंकि यह इसके नीचे सभी को स्वीप करता है। कृपया टिप्पणियों को देखें (विशेष रूप से @Michael की ओर इशारा करते हुए कि अंतराल हो सकता है) और @ जो बाद में त्रुटियों की पहचान और सुधार के लिए उत्तर था। मुझे विशेष रूप से जो के प्रयोगों के दोहरे जांचने के प्रयोग पसंद हैं कि सूत्र समझदार थे।


निचला बाउंड जैसा कि आप इंगित करते हैं, लेकिन कुछ हद तक आश्चर्यजनक लगता है कि अपेक्षित चरणों की संख्या के लिए ऊपरी ।( 1 + π 2 / 6 ) nn(1+π2/6)n

इसे प्राप्त करने के लिए, ध्यान दें कि गेंदों का एक क्रम सभी डिब्बे को ठीक से साफ कर देगा यदि इसमें बाद में जैसे कि , , , । अनुक्रम में अतिरिक्त शर्तें आवश्यक हैं ताकि गेंदों को चुना जा सके जो अब सिस्टम में नहीं हैं, लेकिन ऊपरी सीमा के प्रयोजनों के लिए, मान लें कि डिब्बे का एक अनंत घटता क्रम है (इसलिए बिन छोड़ने पर गेंद गायब नहीं होती है 1, लेकिन बिन 0 पर ले जाया जाता है, फिर बिन -1, और इसी तरह)। फिर बाद में देखे जाने वाले चरणों की अपेक्षित संख्या के देखे जाने से पहले चरणों की संख्या है, साथ ही से पहले चरणों की अपेक्षित संख्या1 = n 2n - 1 ... मैंn - मैं + 1 1 2 n 1 , 2 , ... , nb1b2bnb1=nb2n1bini+1b1b2देखा जाता है, और इतने पर (1 से नीचे, क्योंकि संख्या ) में से कोई भी हो सकता है । इन्हें एक के बाद एक अलग-अलग घटनाओं के रूप में देखा जा सकता है। अपेक्षित चरणों की संख्या तब हैbn1,2,,n

n+p=1nk=0k+1n(npn)k=n+p=1n11npk=1k(npn)k=n+p=1n11npn(np)/p2=n+np=1n11/p2(1+π2/6)n.


3
@Andras @Joe: पवित्र विद्वान। अगर इस साइट पर सवाल पूछने वाले सभी लोगों ने उनके सवालों को गंभीरता से लिया जैसा कि आप उनका जवाब देते हैं, तो यह इंटरनेट पर सबसे खराब यूआरएल होगा।
हारून स्टर्लिंग

1
@ एंड्रस: मैं आपके कथन को समझने की कोशिश कर रहा हूं "गेंदों का एक क्रम सभी डिब्बे को ठीक से साफ कर देगा यदि इसमें एक बाद में ..."। शायद मैंने कुछ गलत समझा है, लेकिन कहते हैं कि हमारे पास चार गेंदें हैं। यदि अनुक्रम 3,4,3,2,4 है, तो यह आपकी बाद की आवश्यकता को पूरा करता है, फिर भी सभी डिब्बे साफ नहीं किए गए हैं।
माइकल

1
@ एंड्रस: यदि आप एक उचित ऊपरी सीमा दिखाना चाहते हैं, तो आपको इस तथ्य का उपयोग करना होगा कि गेंद प्रक्रिया से गायब हो जाती है और अब नहीं उठाया जाता है। अन्यथा, सबसे अधिक गेंद हमेशा संभावना 1 / n के साथ चुनी जाती है और एक अच्छा मौका है (शायद 1/2 से थोड़ा कम) कि यह गेंद पूरे समय अलग-थलग रहेगी। इस गेंद के लिए, आपको n ^ 2 चरणों की आवश्यकता होगी।
मथियास

1
@ माइकल: मुझे लगता है कि आपने गलती को पहचान लिया है। मैं गलत तरीके से मान रहा हूं कि शीर्ष गेंद नीचे गिर जाएगी भले ही एक अंतर हो।
एन्द्रिस सलामोन

2
O(n)हे(nलॉगn)n/2लॉगn
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.