मैं कहूंगा कि word2vec एल्गोरिदम दोनों पर आधारित हैं।
जब लोग कहते हैं distributional representation, वे आमतौर पर भाषाई पहलू का अर्थ करते हैं: अर्थ संदर्भ है, शब्द को इसकी कंपनी और अन्य प्रसिद्ध उद्धरणों से जानते हैं।
लेकिन जब लोग कहते हैं distributed representation, इसका ज्यादातर भाषाविज्ञान से कोई लेना-देना नहीं है। यह कंप्यूटर विज्ञान के पहलू के बारे में अधिक है। यदि मैं मिकोलोव और अन्य को सही ढंग से समझता हूं, तो distributedउनके पत्रों में शब्द
का अर्थ है कि वेक्टर प्रतिनिधित्व के प्रत्येक एकल घटक का अपना कोई मतलब नहीं है। व्याख्या करने योग्य विशेषताएं (उदाहरण के लिए, word2vec के मामले में शब्द संदर्भ) छिपे हुए हैं और निर्विवाद distributedवेक्टर घटकों में से हैं: प्रत्येक घटक कई व्याख्यात्मक सुविधाओं के लिए जिम्मेदार है, और प्रत्येक व्याख्यात्मक विशेषता कई घटकों के लिए बाध्य है।
तो, शब्द 2vec (और doc2vec) लेक्सिकल शब्दार्थ का प्रतिनिधित्व करने के तरीके के रूप में तकनीकी रूप से वितरित प्रतिनिधित्व का उपयोग करता है। और साथ ही यह वैचारिक रूप से वितरण संबंधी परिकल्पना पर आधारित है: यह केवल इसलिए काम करता है क्योंकि वितरण की परिकल्पना सत्य है (शब्द का अर्थ अपने विशिष्ट संदर्भों के साथ सहसंबंधी है)।
लेकिन निश्चित रूप से अक्सर शब्दों का उपयोग किया जाता है distributedऔर distributionalपरस्पर उपयोग किया जाता है, गलतफहमी बढ़ जाती है :)