मैं एक ऐसे अनुप्रयोग पर काम कर रहा हूँ जिसके लिए एक बड़े पाठ कोष में मौजूद n-gr के एक बहुत बड़े डेटाबेस को बनाने की आवश्यकता है।
मुझे तीन कुशल संचालन प्रकारों की आवश्यकता है: लुकअप और प्रविष्टि को n-gram द्वारा अनुक्रमित किया गया है, और उन सभी n-ग्रामों के लिए क्वेरी करना जिनमें उप-n-ग्राम शामिल हैं।
यह मुझे लगता है कि डेटाबेस को एक विशाल दस्तावेज़ पेड़ होना चाहिए, और दस्तावेज़ डेटाबेस, जैसे कि मोंगो, को अच्छी तरह से काम करने में सक्षम होना चाहिए, लेकिन मैंने कभी भी उन पैमाने का उपयोग नहीं किया है।
स्टैक एक्सचेंज प्रश्न प्रारूप को जानने के बाद, मैं स्पष्ट करना चाहूंगा कि मैं विशिष्ट प्रौद्योगिकियों पर सुझाव नहीं मांग रहा हूं, बल्कि एक प्रकार का डेटाबेस जिसे मैं कुछ इस तरह लागू करने के लिए देख रहा हूं।