यूक्लिडियन दूरी स्कोर और समानता


13

मैं सिर्फ कलेक्टिव इंटेलिजेंस (टोबी सेगरान की किताब) के साथ काम कर रहा हूं और यूक्लिडियन दूरी के स्कोर पर आया हूं। पुस्तक में लेखक दिखाता है कि दो अनुशंसा सरणियों (यानी बीच समानता की गणना कैसे करें ।person×moviescore)

वह दो व्यक्तियों के लिए यूक्लिडियन दूरी की गणना करता है और द्वारा पी 2 डी ( पी 1 , पी 2 ) = p1p2

d(p1,p2)=i  item(sp1sp2)2

यह मेरे लिए पूरी तरह से समझ में आता है। मुझे वास्तव में समझ में नहीं आता है कि वह "दूरी आधारित समानता" पाने के लिए आखिर में गणना क्यों करता है:

11+d(p1,p2)

इसलिए, मुझे लगता है कि यह एक दूरी से समानता (दाएं?) में रूपांतरण होना चाहिए। लेकिन फॉर्मूला ऐसा क्यों दिखता है? कोई समझा सकता है कि?


असमानताओं और समानताओं को एक-दूसरे में बदलने के कई तरीके हो सकते हैं - विशिष्ट सूत्र इस बात पर निर्भर करता है कि आपके और भविष्य के विश्लेषण के लिए क्या अर्थ है। उस पाठ्यपुस्तक में लेखक ने किसी कारण से आपके द्वारा दिखाए गए फॉर्मूले को प्राथमिकता दी; किसी अन्य स्थिति में कोई अन्य सूत्र चुन सकता है। यूक्लिडियन दूरी को समानता में परिवर्तित करने का सबसे ज्यामितीय सही तरीका डेटा-केंद्रित स्थिति के तहत कोसाइन प्रमेय से होगा और बराबर में यहां वर्णित है । 1.
ttnphns

ठीक है! लेकिन अगर मैं सही समझूं तो आप यूक्लिडियन दूरी को एक समानता में नहीं बदलते हैं, लेकिन आप एक अलग फ़ंक्शन का उपयोग करते हैं जो आपको 0 और 1 के भीतर मान लौटाता है (क्योंकि कॉशन के कारण), है ना? मेरा मतलब है कि यह मुझे सभी दूरियों की गणना करने और फिर उन्हें छोटी और सबसे बड़ी दूरी के बीच प्रक्षेपित करके एक समानता में परिवर्तित करने की तुलना में अलग लगता है। सही?
नेविज

यदि आपके पास स्क्वेयर यूक्लिडियन दूरी का एक वर्ग सममित मैट्रिक्स है और आप उस पर "डबल सेंटरिंग" ऑपरेशन करते हैं, तो आपको स्केलर उत्पादों के मैट्रिक्स मिलते हैं जो तब दिखाई देते हैं जब आप ओरिजिनल स्पेस को अपने कॉन्फ़िगरेशन के केंद्र में ओड यूक्लिडियन स्पेस डालते हैं। वस्तुओं। ये अदिश उत्पादों हैं कोण प्रकार समानताएं हैं। वे कोवरियों की तरह हैं । वे 0-1 की सीमा के भीतर नहीं हैं, वे नकारात्मक, सकारात्मक हो सकते हैं, और विकर्ण तत्व आवश्यक नहीं हैं 1. फिर भी, वे समानताएं हैं।
ttnphns 13:23

जवाबों:


12

व्युत्क्रम को दूरी से समानता में बदलना है।

हर में 1 को बनाना है ताकि अधिकतम मूल्य 1 हो (यदि दूरी 0 है)।

वर्गमूल - मुझे यकीन नहीं है। यदि दूरी आमतौर पर 1 से बड़ी है, तो रूट बड़ी दूरी को कम महत्वपूर्ण बना देगा; यदि दूरी 1 से कम है, तो यह बड़ी दूरी को और अधिक महत्वपूर्ण बना देगा।


माफ़ करना! वर्गमूल गलत था। लेखक ने वास्तव में इसे दूसरे सूत्र में रखा, लेकिन पहले में इसे छोड़ दिया। तो यह वहाँ नहीं होना चाहिए
नौसेना

हां, लेकिन 1 को अधिकतम मान सेट करने के साथ आपका संकेत समझ में आता है! धन्यवाद!
नेविज

4

दूरी और समानता (सिमेंटिक अर्थ में) को मापने के लिए जाँच करने के लिए पहली बात यह है कि क्या आप यूक्लिडियन स्पेस में जा रहे हैं या नहीं। इसे सत्यापित करने का एक अनुभवजन्य तरीका एक जोड़ी मूल्यों की दूरी का अनुमान लगाना है जिसके लिए आप अर्थ जानते हैं।


1

जैसा कि आपने उल्लेख किया है कि आप यूक्लिडेंस दूरी की गणना जानते हैं इसलिए मैं दूसरा सूत्र बता रहा हूं।

यूक्लिडियन सूत्र दूरी की गणना करता है, जो उन लोगों या वस्तुओं के लिए छोटा होगा जो अधिक समान हैं। जैसे अगर वे समान हैं तो दूरी 0 है और पूरी तरह से अलग है तो 0 से अधिक है।

हालाँकि हमें एक ऐसे फंक्शन की आवश्यकता होती है जो अधिक मूल्य देता हो वे समान हैं। यह फ़ंक्शन में 1 जोड़कर किया जा सकता है (इसलिए आपको एक विभाजन-बाय-ज़ीरो त्रुटि नहीं मिलती है) और इसे इन्वर्ट कर रहा है। जैसे अगर डिस्ट्रेस 0 और समानता स्कोर 1/1 = 1 हो


मुझे यह उत्तर समझ में नहीं आता है।
माइकल आर। चेरिक

ठीक है मान लें कि आइटम 1 और आइटम 2 के बीच यूक्लिडियन दूरी 4 है और आइटम 1 और आइटम 3 के बीच 0 है (इसका मतलब है कि वे 100% समान हैं)। ये एक वर्चुअल स्पेस में वस्तुओं की दूरी हैं। दूरी का मान छोटा होने का मतलब है कि वे एक-दूसरे के निकट हैं, समान होने की अधिक संभावना है। अब हम संख्यात्मक मान चाहते हैं कि यह अधिक संख्या देता है यदि वे समान हैं। तो हम दूरी मान को उलटा कर सकते हैं। लेकिन क्या होगा अगर हमारे पास दूरी 0 है, इसलिए हम हर में 1 जोड़ते हैं। इसलिए आइटम 1 और 2 के लिए समानता स्कोर 1 / (1 + 4) = 0.2 है और आइटम 1 और आइटम 3 के लिए 1 / (1 + 0) = 0
user10009133

हो सकता है कि आप किसी प्रकार के दूरी के बारे में बात कर रहे हों, लेकिन यूक्लिडियन दूरी एक वेक्टर स्थान के संबंध में एक विशिष्ट सूत्र का अनुसरण करती है।
माइकल आर। चेरिक

1/1+d(p1,p2)
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.