आप जो खोज रहे हैं वह "लेवेनशेटिन / संपादन दूरी में पड़ोसी खोज के निकट" (ANNS) है। सैद्धांतिक दृष्टिकोण से, संपादित दूरी अब तक निकट-पड़ोसी खोजों, अफाक के लिए अपेक्षाकृत कठिन हो गई है। फिर भी, कई परिणाम हैं, इस ओस्ट्रोव्स्की और रबानी पेपर में संदर्भ देखें । यदि आप वैकल्पिक दूरी के मैट्रिक्स पर विचार करने के लिए तैयार हैं, जिसके लिए सरल और बेहतर समाधान हैं, तो अगले पैराग्राफ पर जाएं। संपादित दूरी में ANNs के लिए, वहाँ की वजह से एक परिणाम है Indyk , जो दिखाता है कि कैसे आकार के एक डेटा संरचना के निर्माण के लिए जो किसी भी प्रश्न का उत्तरO(d) में देता हैऔर एक स्ट्रिंग की रिपोर्ट करता है जो क्वेरी स्ट्रिंग के निकटतम स्ट्रिंग की तुलना में तीन गुना अधिक होती है (यहnO(dϵ)और सन्निकटन31/ϵ) का आकार देता है। यहाँnस्ट्रिंग्स की संख्या है औरdकिसी भी स्ट्रिंग की अधिकतम लंबाई है। ऊपर दिए गए ओस्ट्रोव्स्की और रबानी पेपर ने इस परिणाम को वैक्टरों के लिए तार को मैप करके बेहतर बनाया ताकिRab1nO(d√)O(d)nO(dϵ)31/ϵndℓ1-वैक्टर (वैक्टर के बीच यूक्लिडियन दूरी के समान एक प्रकार की प्राकृतिक ज्यामितीय दूरी) इसी तार के बीच संपादित दूरी का अनुमान लगाता है (इसे "कम विरूपण विरूपण" कहा जाता है)। एक बार ऐसा हो रहा है, के लिए एक ANNs डेटा संरचना इस्तेमाल किया जा सकता है, और इन अधिक कुशल होने का बाहर कर देते हैं (अगले पैराग्राफ को देखें)।ℓ1
यदि आप अन्य दूरियों पर विचार करने के इच्छुक हैं, तो स्थानीय संवेदनशील हैशिंग (एलएसएच) बहुत अच्छा काम करता है। स्थानीय संवेदनशील हैशिंग एएनएनएस की समस्या को हल करने के लिए इंडीके और मोटवानी द्वारा अग्रणी तकनीक है, जहां ऐसे बिंदु हैं जो एक उच्च-आयामी स्थान में रहते हैं (लंबे वैक्टर, लंबे तार, आदि) को कम संख्या में बाल्टियों में हैशड किया जाता है जो कि बिंदु एक दूसरे के समीप एक ही बिन में अच्छे संभावना के साथ मैप किया जाता है और एक दूसरे से दूर होने वाले बिंदुओं को अलग-अलग डिब्बे में मैप किया जाता है, वह भी अच्छी संभावना के साथ। CACM में Indyk और Andoni द्वारा एक महान और बहुत ही सुलभ सर्वेक्षण लेख है । यह तकनीक सरल और तेज है, और इसमें छोटे स्थान की आवश्यकताएं हैं; वहाँ भी कोड है (मुझे लगता है कि लेख कोड के लिंक)। यह हेमिंग दूरी (और कुछ शासन में) जैसी चीजों के लिए अच्छी तरह से काम करता है दूरी) और यूक्लिडियन दूरी, कोसाइन दूरी। इसके अलावा,मुथु और सहिनालपएलएसएच योजनाओं को संपादित दूरी की एक बहुत ही सामान्य सामान्यीकरण के लिए डिज़ाइन करते हैं,ब्लॉक एडिट दूरी(जहां कुछ संपादन ऑपरेशन प्रतीकों के एक ब्लॉक पर काम कर सकते हैं)।ℓ1
इस तरह का सवाल cstheory.SE के लिए एक अच्छा फिट है । वहाँ एक संबंधित सवाल है , लेकिन यह पड़ोसी के पास सटीक पूछने के लिए लगता है।