मैं असंरचित पाठ से एक अवधारणा मानचित्र बनाना चाहता हूं। उदाहरण के लिए
Desired input: find "/" -name "*.txt"
Desired output: concepts-graph.dot
दूसरे शब्दों में, मैं अपनी पाठ फ़ाइलों को माइन करना चाहता हूं और मुख्य शब्दों / अवधारणाओं के कुछ प्रकार के संरचित प्रतिनिधित्व बनाना चाहता हूं। एक गरीब-आदमी का Google पाठ विश्लेषक।
क्या कोई ओपन सोर्स टूल / एपीआई है जो एक प्लेनटेक्स्ट फ़ाइल में शर्तों के बीच संबंध पा सकता है?