मंझला चयन के लिए भंडारण की आवश्यकताएं (दो पास एल्गोरिदम)


18

एक क्लासिक पेपर में मुनरो और पैटर्सन इस समस्या का अध्ययन करते हैं कि एक एल्गोरिदम के लिए यादृच्छिक रूप से क्रमबद्ध सरणी में माध्यिका को खोजने के लिए कितना संग्रहण आवश्यक है। विशेष रूप से वे निम्नलिखित मॉडल पर ध्यान केंद्रित करते हैं:

इनपुट को कई बार P से बाएं से दाएं पढ़ा जाता है।

यह दिखाया गया है कि मेमोरी सेल पर्याप्त हैं, लेकिन संबंधित कम बाउंड केवल P = 1 के लिए जाना जाता है। मैंने P> 1 के लिए कोई परिणाम नहीं देखा है। क्या किसी को ऐसी निचली सीमा के बारे में पता है? हे(n12पी)

ध्यान दें कि यहां मुख्य कठिनाई यह है कि दूसरे पास पर इनपुट को बेतरतीब ढंग से ऑर्डर नहीं किया जाता है।

जवाबों:


14

चान द्वारा हाल के सोडा में इस पत्र का प्रयास करें: http://portal.acm.org/citation.cfm?id=1721842&dl=ACM

एक त्वरित Google खोज ने भी निम्नलिखित पेपर पाया जो संभवतः प्रासंगिक लगता है, लेकिन मैंने इसे नहीं पढ़ा है: http://portal.acm.org/citation.cfm?id=1374470


धन्यवाद, दूसरा प्रश्न मेरे प्रश्न का आंशिक उत्तर देता प्रतीत होता है। इस तरह का जवाब पहले के कागजात में मौजूद नहीं था जिसके बारे में मुझे पता था।
मास्सिमो लौरिया

18

1 से अधिक पास के लिए प्रमाण पत्र साबित करने वाला पहला पेपर, जयराम और अमित के साथ सोडा'08 का पेपर था। फिर वॉरेन द्वारा उल्लिखित कागज है, जो क्लीनर प्रूफ द्वारा सीमा में सुधार करता है।

संक्षेप में, हम निर्भरता को समझते हैं यदि आप पास की संख्या के सामने स्थिरांक की अनुमति देते हैं। बेशक, ये स्थिरांक घातांक में हैं, इसलिए आप एक सटीक समझ के लिए पूछ सकते हैं। मेरी मुख्य शिकायत यह है कि मल्टीप्रास स्ट्रीमिंग का मॉडल अच्छी तरह से प्रेरित नहीं है।

अधिक पेचीदा सवाल यह है कि क्या हम एक ब्रांचिंग कार्यक्रम को कमतर साबित कर सकते हैं। क्या ऐसा हो सकता है कि एक बाउंडेड स्पेस एल्गोरिथ्म के लिए भी जो मेमोरी को एक्सेस कर सकता है क्योंकि यह सबसे अच्छा है, सबसे अच्छी रणनीति यह है कि सिर्फ मल्टीप्रास स्ट्रीमिंग करें?

उत्तर सकारात्मक प्रतीत होता है, और इसे साबित करने की दिशा में हमारी कुछ आंशिक प्रगति है।


5
मुझे लगता है कि बहु स्ट्रीमिंग है प्रयोगों की तरह निम्नलिखित में एक प्राकृतिक मॉडल: आप सांख्यिकीय परीक्षण (जैसे, क्रमचय परीक्षण) करने के लिए यादृच्छिक नमूने का उपयोग करें। आप अरबों प्रयोग करते हैं; प्रत्येक प्रयोग PRNG से यादृच्छिक संख्याएँ प्राप्त करता है और कुछ आउटपुट मान पैदा करता है। फिर आप इन मूल्यों के मध्यस्थों, हिस्टोग्राम, आदि की गणना करना चाहते हैं। आपके पास आउटपुट की अपनी स्ट्रीम के लिए कुशल रैंडम एक्सेस नहीं है और आपके पास सब कुछ स्टोर करने के लिए मेमोरी नहीं है। हालाँकि, आप स्ट्रीम को फिर से खेल सकते हैं ; बस अपने PRNG को उसी बीज के साथ रीसेट करें और अपने एल्गोरिथ्म को फिर से चलाएँ।
जुका सुओमेला

2
हम सभी इस बात से सहमत हो सकते हैं कि सबसे बेहतर मल्टीप्रास स्ट्रीमिंग मॉडल में ऊपरी सीमाएं हैं और ब्रांचिंग कार्यक्रमों के कुछ प्रासंगिक परिवार के लिए निचले सीमाएं मेल खाती हैं।
मासिमलौरिया
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.