क्या पाठ के उस हिस्से को निकालने के बारे में कोई लेख या चर्चा है जो वर्तमान दस्तावेज़ के बारे में सबसे अधिक जानकारी रखता है।
उदाहरण के लिए, मेरे पास एक ही डोमेन से दस्तावेजों का एक बड़ा कोष है। पाठ के कुछ हिस्से हैं जो महत्वपूर्ण जानकारी रखते हैं कि एकल दस्तावेज़ किस बारे में बात करता है। मैं उनमें से कुछ हिस्सों को निकालना चाहता हूं और उन्हें पाठ के सारांश के रूप में उपयोग करना चाहता हूं। क्या इस तरह से कुछ हासिल करने के बारे में कोई उपयोगी दस्तावेज है।
यह वास्तव में मददगार होगा अगर कोई मुझे सही दिशा में इंगित कर सकता है कि मुझे क्या खोज करनी चाहिए या काम में कुछ अंतर्दृष्टि प्राप्त करने के लिए पढ़ना चाहिए जो कि प्राकृतिक भाषा प्रसंस्करण के इस क्षेत्र में पहले से ही हो सकता है।