क्या ब्लूम के पारंपरिक विश्लेषण गलत हैं?


17

यह कागज दावा करता है कि ब्लूम फिल्टर में त्रुटि दर का पारंपरिक विश्लेषण गलत है, फिर वास्तविक त्रुटि दर का एक लंबा और nontrivial विश्लेषण प्रदान करता है। जुड़ा हुआ पेपर 2010 में प्रकाशित हुआ था, फिर भी मैंने देखा है कि ब्लूम फिल्टर के पारंपरिक विश्लेषण को विभिन्न एल्गोरिदम और डेटा संरचनाओं के पाठ्यक्रमों में पढ़ाया जाता रहा है।

क्या ब्लूम फ़िल्टर का पारंपरिक विश्लेषण वास्तव में गलत है?

धन्यवाद!

जवाबों:


36

पारंपरिक विश्लेषण ठीक है। "पारंपरिक" विश्लेषण है, अगर इसे सही ढंग से समझाया गया है, एक अनुमान; यह कोशिकाओं की अपेक्षित संख्या की गणना पर आधारित है जो 0/1 हैं जब आपके पास फ़िल्टर में कुंजी है, और फिर विश्लेषण करते हुए कि वह वास्तविक संख्या थी। मुद्दा यह है कि कोशिकाओं की संख्या 0 (या 1) कसकर उनकी अपेक्षा के आसपास केंद्रित है, इसलिए यह एक ठीक सन्निकटन है। यह अच्छी तरह से ज्ञात था, और पाया जा सकता है, मुझे लगता है, आंद्रेई ब्रोडर के साथ अपने सर्वेक्षण लेख में भी।

यह कागज कहता है कि वास्तव में ब्लूम फ़िल्टर का प्रदर्शन एक यादृच्छिक चर (0/1 प्रविष्टियों के वास्तविक अंश के अनुरूप) है, और यदि आप किसी कारण से उस प्रदर्शन की गणना करना चाहते हैं, तो आपको कॉम्बिनेटरिक्स करने की आवश्यकता है। छोटे फ़िल्टर के लिए, आपको यकीनन गैर-तुच्छ अंतर दिखाई देगा।

मैंने इस पत्र के लेखकों के साथ बात की है। उनका विश्लेषण सभी अच्छी तरह से और अच्छा है (हालांकि मैं तर्क दूंगा कि यह गहरा या नया नहीं है); उनकी प्रेरणा है कि "पारंपरिक विश्लेषण गलत है", मुझे लगता है, अतिरंजित।


15
आदेश अब ब्रह्मांड में बहाल कर दिया गया है :)। और cstheory, माइकल में आपका स्वागत है।
सुरेश वेंकट

12

मुझे माइकल के उत्तर में जोड़ते हैं कि ब्लूम फ़िल्टर को विभाजित करने के लिए , जहां हैश फ़ंक्शंस में असमानताएं हैं, पारंपरिक विश्लेषण वास्तव में सन्निकटन या किसी भी एकाग्रता सीमा के बिना सही है। ऐसा इसलिए है क्योंकि विभिन्न हैश कार्यों के लिए त्रुटि संभावनाएं सहसंबद्ध होने के बजाय स्वतंत्र हो जाती हैं। स्प्लिट ब्लूम फिल्टर के लिए स्पेस / एरर ट्रेड-ऑफ अनिवार्य रूप से पारंपरिक ब्लूम फिल्टर के लिए समान है, इसलिए मुझे लगता है कि यह शिक्षण के लिए एक अच्छा संस्करण है।


2
ऐसा लगता है कि ब्लूम-फिल्टर को छोड़कर काउंट-मिन स्केच जैसा ही विचार है।
templatetypedef
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.