मैं कहूंगा कि word2vec एल्गोरिदम दोनों पर आधारित हैं।
जब लोग कहते हैं distributional representation
, वे आमतौर पर भाषाई पहलू का अर्थ करते हैं: अर्थ संदर्भ है, शब्द को इसकी कंपनी और अन्य प्रसिद्ध उद्धरणों से जानते हैं।
लेकिन जब लोग कहते हैं distributed representation
, इसका ज्यादातर भाषाविज्ञान से कोई लेना-देना नहीं है। यह कंप्यूटर विज्ञान के पहलू के बारे में अधिक है। यदि मैं मिकोलोव और अन्य को सही ढंग से समझता हूं, तो distributed
उनके पत्रों में शब्द
का अर्थ है कि वेक्टर प्रतिनिधित्व के प्रत्येक एकल घटक का अपना कोई मतलब नहीं है। व्याख्या करने योग्य विशेषताएं (उदाहरण के लिए, word2vec के मामले में शब्द संदर्भ) छिपे हुए हैं और निर्विवाद distributed
वेक्टर घटकों में से हैं: प्रत्येक घटक कई व्याख्यात्मक सुविधाओं के लिए जिम्मेदार है, और प्रत्येक व्याख्यात्मक विशेषता कई घटकों के लिए बाध्य है।
तो, शब्द 2vec (और doc2vec) लेक्सिकल शब्दार्थ का प्रतिनिधित्व करने के तरीके के रूप में तकनीकी रूप से वितरित प्रतिनिधित्व का उपयोग करता है। और साथ ही यह वैचारिक रूप से वितरण संबंधी परिकल्पना पर आधारित है: यह केवल इसलिए काम करता है क्योंकि वितरण की परिकल्पना सत्य है (शब्द का अर्थ अपने विशिष्ट संदर्भों के साथ सहसंबंधी है)।
लेकिन निश्चित रूप से अक्सर शब्दों का उपयोग किया जाता है distributed
और distributional
परस्पर उपयोग किया जाता है, गलतफहमी बढ़ जाती है :)