अव्यक्त अर्थ विश्लेषण (एलएसए), अव्यक्त अर्थ इंडेक्सिंग (एलएसआई), और एकवचन मूल्य अपघटन (एसवीडी) के बीच अंतर क्या हैं?


15

इन शब्दों को एक साथ बहुत फेंक दिया जाता है, लेकिन मैं यह जानना चाहूंगा कि आप क्या सोचते हैं कि अंतर क्या है, यदि कोई हो।

धन्यवाद

जवाबों:


12

एलएसए और एलएसआई को ज्यादातर समानार्थी रूप से उपयोग किया जाता है, सूचना पुनर्प्राप्ति समुदाय के साथ आमतौर पर इसे एलएसआई के रूप में संदर्भित किया जाता है। एलएसए / एलएसआई एसवीडी का उपयोग टर्म-डॉक्यूमेंट मैट्रिक्स ए को टर्म-कॉन्सेप्ट मैट्रिक्स यू, एक विलक्षण मूल्य मैट्रिक्स एस, और एक कॉन्सेप्ट-डॉक्यूमेंट मैट्रिक्स वी के रूप में: ए = यूएसवी 'के रूप में विघटित करने के लिए करता है। विकिपीडिया पृष्ठ में अव्यक्त शब्दार्थ अनुक्रमण का विस्तृत वर्णन है ।


8

उल्लेखनीय रूप से एलएसए और एलएसआई एसवीडी का उपयोग अपने जादू को करने के लिए करते हैं, लेकिन एचएएल (हाइपर्सस्पेस एनलॉग टू लैंग्वेज) नामक एक कम्प्यूटेशनल और कॉन्सेप्टिव सिंपल विधि है जो पाठ के माध्यम से पूर्ववर्ती और बाद के संदर्भों पर नज़र रखता है। इन (अक्सर भारित) सह-घटना वाले मेट्रिक्स से वैक्टर निकाले जाते हैं और सिमेंटिक स्पेस को इंडेक्स करने के लिए विशिष्ट शब्दों का चयन किया जाता है। कई मायनों में मुझे यह समझने के लिए दिया गया है कि यह एसवीडी के गणितीय / वैचारिक रूप से जटिल कदम की आवश्यकता के बिना एलएसए के साथ-साथ प्रदर्शन करता है। विवरण के लिए लंड और बर्गेस, 1996 देखें।


4
... फ़िन्च और चेटर (1992, 1994), शूत्ज़ (1993), और अन्य द्वारा पूर्व के काम को पुन: व्यवस्थित करना। एचएएल, एलएसए और अन्य पूर्ववर्ती कला कृतियों में उनके प्रासंगिक समानता की गणना करके शब्दों के लिए एक समानता माप उत्पन्न करते हैं। (यह शेफर्ड की 'दूसरी ऑर्डर' समानता है: 'फर्स्ट ऑर्डर' समानता तब होती है जब शब्द बी के पास होता है; 'दूसरे ऑर्डर' की समानता यह है कि शब्द उसी तरह के शब्दों के पास होता है जैसे शब्द बी करता है)।
संयुक्ताक्षरी

3
तुलना और विषम: एलएसए के लिए संदर्भ पूर्ण दस्तावेज है। एचएएल और अन्य के लिए यह एक शाब्दिक विंडो है जो लक्ष्य शब्द के आसपास है। एलएसए एसवीडी / पीसीए के माध्यम से निकाले गए एक रैखिक उप-स्थान में दूरी को मापता है, और आसपास के शब्द गणना के मूल स्थान में दूरी के साथ अन्य सौदा।
कंजगेटपायर

6

एनएमएफ और एसवीडी दोनों मैट्रिक्स फैक्टराइजेशन एल्गोरिदम हैं। विकिपीडिया पर NMF की कुछ प्रासंगिक जानकारी है

AA=AA

अन्य उत्तरदाताओं ने LSI / LSA ...


यह covariance मैट्रिक्स होना चाहिए, है ना? सहसंबंध मैट्रिक्स नहीं है।
राफेल

हां, जब तक आप पहले अपने चरों को केंद्र में नहीं रखते हैं।
एम्रे

चर के सामान्यीकरण के बाद, यह सहसंबंध मैट्रिक्स बन जाता है?
राफेल

सामान्यीकरण स्केलिंग के साथ केंद्रित है, इसलिए यह अलग है।
एम्रे
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.