क्या एक अच्छी प्राकृतिक भाषा प्रसंस्करण लाइब्रेरी है [बंद]


90

मुझे अपने वर्तमान मॉड्यूल में कुछ एनएलपी लागू करने की आवश्यकता है। मैं कुछ अच्छे पुस्तकालय की तलाश कर रहा हूं जो यहां मेरी मदद कर सकें। मैं 'लिंगपाइप' भर में आया था, लेकिन इसका उपयोग कैसे करना है, इसका पूरी तरह से पालन नहीं कर सका।
मूल रूप से, हमें एक ऐसी सुविधा लागू करने की आवश्यकता है, जहाँ एप्लिकेशन ग्राहक निर्देशों (वितरण निर्देशों) को अंग्रेजी में टाइप कर सके। उदाहरण के लिए:

  • कल दोपहर 12:00 बजे उठाएगा
  • 10 जून के बाद अनुरोध वितरण
  • कृपया बुधवार से पहले न भेजें
  • आदेश में XYZ की 10 और इकाइयाँ जोड़ें

जवाबों:


78

LingPipe बहुत अच्छा और अच्छी तरह से प्रलेखित है। आप भी देख सकते हैं:

पिछले एक विशेष रूप से आप के लिए ब्याज की हो सकती है, हालांकि मुझे नहीं पता कि क्या कोई आसानी से उपलब्ध जावा कार्यान्वयन हैं (और शायद यह आपकी समस्या के लिए एक बंदूक से भी बड़ा है :-)

एक DSL का उपयोग करने का पॉल का विचार शायद लागू करने के लिए आसान और तेज़ है, और अपने ग्राहकों के लिए उपयोग करने के लिए अधिक विश्वसनीय है। मैं भी पहले उस पर गौर करने की सलाह दूंगा।


1
मैंने इस मंच और अन्य स्थानों से एकत्रित किए गए इनपुट के आधार पर अपनी रिपोर्ट प्रस्तुत की। मैंने आपके द्वारा सुझाए गए अन्य विकल्पों का भी सुझाव दिया और बिज़ ने इसे होल्ड पर रखने का फैसला किया (अब आरएंडडी शुरू करता है सबसे अच्छा पैसा खोजने के लिए)।
विनी

1
यदि आप लिंगपाइप और अन्य की तुलना करते हैं जो आपने सूचीबद्ध किया है तो आप किसे पसंद करेंगे? मैं यह केवल @ विनी के प्रश्न के लिए नहीं पूछता, मैं इसे सामान्य उद्देश्य के लिए पूछता हूं।
कामसी

1
MALLET देखें: mallet.cs.umass.edu
Samik R

11

मुझे लगता है कि आप एनएलपी का उपयोग करना चाहते हैं या नहीं, यह आपके सिस्टम के लिए विशिष्ट आवश्यकताओं पर निर्भर हो सकता है। क्या यह एक आवश्यकता है कि मुफ्त-फॉर्म अंग्रेजी को स्वीकार किया जाना चाहिए, या केवल निर्देशों का एक निश्चित सेट स्वीकार किया जाएगा? एक डोमेन विशिष्ट भाषा का निर्माण करना आसान हो सकता है जो आपके उपयोगकर्ताओं को मुफ्त-फॉर्म टेक्स्ट के पूर्ण-शब्दार्थिक विश्लेषण करने की तुलना में जो कुछ भी बताने की आवश्यकता है उसका समर्थन करता है।

Java स्पेस में, Groovy को DSLs के निर्माण के लिए कुछ सहायता मिली है


यहाँ आवश्यकता दस्तावेज़ से कुछ पंक्तियाँ हैं: '.. और उपयोगकर्ता को सादे अंग्रेजी में एक नोट या एक विशेष निर्देश दर्ज करने में सक्षम होना चाहिए। तब सिस्टम को उपयोगकर्ता के निर्देश को पार्स करना चाहिए और सही मानों के साथ संबंधित फ़ील्ड (यदि कोई हो) का आदेश देना चाहिए। "
विनी

10
यह एक बहुत अस्पष्ट आवश्यकता है। उदाहरण के लिए, क्या नोट को व्याकरणिक रूप से सही होना चाहिए? मुझे यकीन नहीं है कि जो पार्टियां आवश्यकताओं के साथ आई हैं वे एनएलपी की स्थिति से परिचित हैं, लेकिन उन्होंने जो समस्या बताई है वह अनिवार्य रूप से समझ, या प्राकृतिक भाषा की समझ है, जो कि 'पवित्र' के रूप में वर्णित समस्याओं में से एक है। ग्रिल 'एनएलपी की। यह मेरे लिए संदेहास्पद है कि आपको एक ऐसा पैकेज मिलेगा जो आपके लिए बस 'ऐसा' कर सकता है - यह संभवतः उपयोगकर्ता को यूआई देने के लिए कहीं अधिक यथार्थवादी है जहां वे सीमित संख्या में विशेष निर्देशों को निर्दिष्ट कर सकते हैं।
पॉल मोरी

8

अन्य JVM भाषाओं के लिए देखें


महाकाव्य एनएलपी का एनएलपी हिस्सा जिसे एपिक कहा जाता है, हालांकि अभी भी जल्द ही आ रहा है।
एरिक कपलुन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.