मेरा सवाल एक मूर्खतापूर्ण हो सकता है। इसलिए मैं पहले ही माफी मांग लूंगा।
मैं स्टैनफोर्ड एनएलपी समूह ( लिंक ) द्वारा पहले से प्रशिक्षित GLOVE मॉडल का उपयोग करने की कोशिश कर रहा था । हालांकि, मैंने देखा कि मेरे समानता के परिणामों ने कुछ नकारात्मक संख्याएँ दिखाईं।
इसने मुझे तुरंत शब्द-वेक्टर डेटा फ़ाइल को देखने के लिए प्रेरित किया। जाहिर है, वैक्टर शब्द में मूल्यों को नकारात्मक होने की अनुमति दी गई थी। यह बताया कि क्यों मैंने नकारात्मक कोसाइन समानताएं देखीं।
मैं आवृत्ति वैक्टर के कोसाइन समानता की अवधारणा के लिए उपयोग किया जाता हूं, जिनके मूल्य [0, 1] में बंधे हैं। मैं एक तथ्य के लिए जानता हूं कि वेक्टर के बीच के कोण के आधार पर डॉट उत्पाद और कोज़ाइन फ़ंक्शन सकारात्मक या नकारात्मक हो सकते हैं। लेकिन मुझे वास्तव में एक कठिन समय है और इस नकारात्मक कोसाइन समानता की व्याख्या करना।
उदाहरण के लिए, यदि मेरे पास -0.1 की समानता देने वाले शब्दों की एक जोड़ी है, तो क्या वे किसी अन्य जोड़ी से कम समान हैं जिनकी समानता 0.05 है? -0.9 से 0.8 की समानता की तुलना कैसे करें?
या मैं बस से कम से कम कोण अंतर का पूर्ण मान पर गौर करना चाहिए ? अंकों का पूर्ण मूल्य?
बहुत बहुत शुक्रिया।
An angular-type similarity coefficient between two vectors. It is like correlation, only without centering the vectors.
दोनों के बीच एकमात्र अंतर यह है कि सहसंबंध विचलन (क्षणों) में - जो क्रॉस-गुणा किए जा रहे हैं - मतलब से हैं, जबकि कॉशन विचलन मूल 0 से हैं - अर्थात वे मान हैं जैसे वे हैं ।