मैंने हाल ही में स्टैनफोर्ड के CoreNLP का उपयोग करके प्राकृतिक भाषा प्रसंस्करण (एनएलपी) के साथ प्रयोग करना शुरू किया है , और मैं सोच रहा हूं कि एनएलपी पार्स किए गए डेटा को टेक्स्ट माइनिंग एप्लिकेशन जैसी किसी चीज़ के लिए स्टोर करने के मानक तरीके क्या हैं?
एक तरीका मुझे लगा कि दिलचस्प हो सकता है कि बच्चों को आसन्न सूची के रूप में संग्रहीत किया जाए और पुनरावर्ती प्रश्नों का अच्छा उपयोग किया जाए (पोस्टग्रैज इसका समर्थन करता है और मैंने पाया है कि यह वास्तव में अच्छी तरह से काम करता है)।
लेकिन मुझे लगता है कि इस तरह के विश्लेषण के आधार पर ऐसा करने के लिए कई मानक तरीके हैं जो वर्षों से क्षेत्र में काम कर रहे लोगों द्वारा अपनाया गया है। तो एनएलपी के पार्स किए गए डेटा के लिए मानक दृढ़ता रणनीतियों क्या हैं और उनका उपयोग कैसे किया जाता है?