मैं सोच रहा हूँ कि कैसे (टैग) वाक्यों / अनुच्छेदों / दस्तावेजों को dens2vec के साथ gensim में लेबल किया जाए - एक व्यावहारिक दृष्टिकोण से।
क्या आपको अपने स्वयं के अनूठे लेबल (उदाहरण के लिए "Sent_123") के साथ प्रत्येक वाक्य / पैराग्राफ / दस्तावेज़ की आवश्यकता है? यह उपयोगी लगता है यदि आप कहना चाहते हैं "क्या शब्द या वाक्य" सेंट_123 "लेबल वाले एक विशेष वाक्य के समान हैं।
क्या आपके पास सामग्री के आधार पर लेबल दोहराया जा सकता है? उदाहरण के लिए यदि प्रत्येक वाक्य / पैराग्राफ / दस्तावेज़ एक निश्चित उत्पाद आइटम के बारे में है (और दिए गए उत्पाद आइटम के लिए कई वाक्य / अनुच्छेद / दस्तावेज़ हैं) तो क्या आप आइटम के आधार पर वाक्यों को लेबल कर सकते हैं और फिर एक शब्द या एक के बीच समानता की गणना कर सकते हैं वाक्य और यह लेबल (जो मुझे लगता है कि उन सभी वाक्यों का औसत होगा जो उत्पाद आइटम के साथ करना था)?