R के लिए टेक्स्ट-माइनिंग पैकेज क्या हैं और क्या अन्य ओपन सोर्स टेक्स्ट-माइनिंग प्रोग्राम हैं?


12

क्या आप R में एक टेक्स्ट माइनिंग पैकेज की सिफारिश कर सकते हैं जिसका उपयोग डेटा के बड़े संस्करणों के खिलाफ किया जा सकता है?
दूसरे, क्या आर में पाठ खनन पैकेज के लिए कोई जीयूआई उपलब्ध है?
तीसरा, क्या कोई अन्य ओपन सोर्स टेक्स्ट माइनिंग प्रोग्राम है जो प्रयोग करने में आसान और सहज है?


@mbq: "जीयूआई के साथ एक खुला स्रोत पाठ खनन पैकेज है?" शायद सभी तीन सवालों को अच्छी तरह से कवर करेगा, यह पहले से ही एक तरह का सवाल है ...
n

जवाबों:




4

यहां दो और एकीकृत परियोजनाएं हैं:

  • अजगर प्राकृतिक भाषा टूलकिट (आसान स्थापना, अच्छा प्रलेखन)
  • Java MALLET (इसके साथ कोई अनुभव नहीं है, लेकिन आशाजनक लगता है, @Nick द्वारा दिए गए लिंक में शामिल है)

दोनों ओपन-सोर्स सॉफ्टवेयर हैं।


3

पाठ खनन विस्तार के साथ ज़रूर, RapidMiner।

कई वीडियो हैं जो दिखाते हैं कि यह कैसे किया जाता है।


2
यहाँ एक 5-भाग वीडियो श्रृंखला है: vancouverdata.blogspot.com/2010/11/…
नील मैकग्यूगन

1

गेट बहुत व्यापक है। यह आपको विभिन्न भाषाओं के साथ काम करने की अनुमति देता है और एक ऑन्कोलॉजी संपादक है।


0

एंड्रयू मैकलम (UMass) के पास अपने वेबपेज पर एनएलपी से संबंधित कुछ सॉफ्टवेयर परियोजनाएं उपलब्ध हैं । ये सभी जावा में हैं (मुझे लगता है) स्रोत कोड उपलब्ध हैं।


हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.