मैं दूरी (यूक्लिडियन) को समानता स्कोर में कैसे बदल सकता हूं


13

मैं उपयोग कर रहा हूँ अर्थ है क्लस्टर स्पीकर की आवाज़ों का क्लस्टरिंग। जब मैं क्लस्टर किए गए स्पीकर डेटा के साथ एक उच्चारण की तुलना करता हूं जो मुझे मिलता है (यूक्लिडियन दूरी-आधारित) औसत विरूपण। यह दूरी सीमा में हो सकती है । मैं इस दूरी को समानता स्कोर में परिवर्तित करना चाहता हूं । कृपया मुझे मार्गदर्शन करें कि मैं इसे कैसे प्राप्त कर सकता हूं।k[0,][0,1]

जवाबों:


16

यदि बिंदु से इयूक्लिडियन दूरी का प्रतिनिधित्व करता है बात करने के लिए ,d(p1,p2)p1p2

11+d(p1,p2)

आमतौर पर उपयोग किया जाता है।


कृपया गलत होने पर मुझे सही करें, अगर हमारे पास और जहाँ प्रत्येक और आयाम के हैं। । फिर हम समानता, जैसे कि को परिभाषित कर सकते हैं । वाई = ( Y 1 , वाई 2 , वाई 3 , , वाई एन ) x y डी एस मैं हूँ मैं एल एक आर मैं टी = X=(x1,x2,x3,...,xt)Y=(Y1,Y2,Y3,...,Yn)xyD
Similarity=1ti=1t11+minDistance(xi,Y)
मुहम्मद

मैं समझता हूं कि भाजक में प्लस 1 शून्य त्रुटि से विभाजित होने से बचने के लिए है। लेकिन मैंने पाया है कि प्लस वन वैल्यू असमान रूप से डी (पी 1, पी 2) मूल्यों को प्रभावित करता है जो 1 से अधिक हैं और अंततः समानता स्कोर को काफी कम कर देता है। क्या इसे करने का और कोई तरीका है? शायद s = 1-d (p1, P2)
aamir23

9

आप यह भी उपयोग कर सकते हैं: जहां आपका वांछित दूरी फ़ंक्शन है।1edistdist


क्या आप इस समीकरण से संबंधित कोई संदर्भ पुस्तक / प्रलेखन दे सकते हैं जिसमें आपने इसे पाया है? @ डगल
जस्ट लाइफ

@AnimeshKumarPaul मैंने यह उत्तर नहीं लिखा, बस इसके स्वरूपण में सुधार किया। लेकिन इसे अक्सर "सामान्यीकृत आरबीएफ कर्नेल" जैसे संस्करण के रूप में उपयोग किया जाता है; जैसे देखने के लिए यहाँ । यह सवाल चिंतित करता है कि क्या उत्पादन एक सकारात्मक निश्चित कर्नेल है; यदि आप इस बारे में परवाह नहीं करते हैं, हालांकि, यह कम से कम समानता की एक सहज धारणा को संतुष्ट करता है कि अधिक दूर के बिंदु कम समान हैं।
डगल

@Justlife: इसके लिए Google "दूरियों का विश्वकोश" और परिणाम पीडीएफ दस्तावेज़ के साथ चुनें।
अनहेल्दी अपवाद

7

ऐसा लगता है कि आप कुछ समानता को समेटना चाहते हैं, जो कि इकाई अंतराल में अपने आप में एक समानता स्कोर है। वास्तव में, यूक्लिडियन दूरी और कोज़ाइन समानता के बीच एक सीधा संबंध मौजूद है!

||xx||2=(xx)T(xx)=||x||+||x||2||xx||.

f(x,x)=xTx||x||||x||=cos(θ)
θxx

||x||=||x||=1,

||xx||2=2(1f(x,x))
f(x,x)=xTx,

इसलिए

1||xx||22=f(x,x)=cos(θ)

एक कम्प्यूटेशनल दृष्टिकोण से, यह यूक्लिडियन दूरी के बजाय केवल कोसाइन की गणना करने के लिए अधिक कुशल हो सकता है, और फिर परिवर्तन का प्रदर्शन कर सकता है।


3

कैसे एक गाऊसी गिरी के बारे में ?

K(x,x)=exp(xx22σ2)

दूरीघातांक में प्रयोग किया जाता है। कर्नेल मान रेंज । एक ट्यूनिंग पैरामीटर । मूल रूप से अगर अधिक है, किसी भी लिए 1 के करीब होगा । यदि कम है, से एक मामूली दूरी के लिए को बढ़ावा मिलेगा 0 के करीब जा रहा है।[ 0 , 1 ] σ σ कश्मीर ( एक्स , एक्स ' ) एक्स , एक्स ' σ एक्स एक्स ' कश्मीर ( एक्स , एक्स ' )xx[0,1]σσK(x,x)x,xσxxK(x,x)


1
ध्यान दें कि यह उत्तर और @ अनचाहे अपवाद बहुत संबंधित हैं: यह Gamma , जहां एक [स्केलिंग फैक्टर शुरू करने वाला] is , मेट्रिक के रूप में साथ एक गाऊसी कर्नेल । यह अभी भी एक वैध कर्नेल होगा , हालांकि ओपी को इस बात की कोई परवाह नहीं है। exp ( - γ ( एक्स , एक्स ' ) ) exp(γd(x,x)2)exp(γd(x,x))d
डगल

0

यदि आप किसी दूरी की मीट्रिक का उपयोग कर रहे हैं जो स्वाभाविक रूप से 0 और 1 के बीच है, तो हेलिंगर दूरी की तरह। फिर आप समानता प्राप्त करने के लिए 1 - दूरी का उपयोग कर सकते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.