एक रेखीय परिवर्तन के बाद कोसाइन समानता कैसे बदलती है?


9

क्या इसके बीच गणितीय संबंध है:

  • cosine समानता सिम(,बी)sim(A,B) दो वैक्टर के A तथा बीB, तथा
  • cosine समानता सिम(,बी)sim(MA,MB) का Aऔर , एक समान मैट्रिक्स माध्यम से गैर-समान रूप से बढ़ाया गया ? यहां एक दिया गया विकर्ण मैट्रिक्स है जो विकर्ण पर असमान तत्वों के साथ है।बीBMM

मैंने गणनाओं पर जाने का प्रयास किया, लेकिन एक सरल / दिलचस्प लिंक (अभिव्यक्ति) तक नहीं पहुंच सका। मुझे आश्चर्य है कि अगर वहाँ एक है।


उदा। गैर-समान स्केलिंग में कोणों को संरक्षित नहीं किया जाता है, लेकिन मूल कोण और गैर-समान स्केलिंग के बाद क्या संबंध है? वैक्टर S1 के एक सेट और वैक्टर S2 के दूसरे सेट के बीच के लिंक के बारे में क्या कहा जा सकता है - जहां S2 गैर-समान रूप से स्केलिंग S1 द्वारा प्राप्त किया जाता है?


@ शुभंकर, धन्यवाद! हां, एम एक दिया गया मैट्रिक्स है (स्केलिंग मैट्रिक्स - इस प्रकार एक विकर्ण मैट्रिक्स, कोई अन्य प्रतिबंध नहीं)। एक अर्थ में, मैं यह जानना चाहता था कि क्या होता है (वैक्टर के किसी भी जोड़े के लिए कोसाइन समानता के संदर्भ में) एक वेक्टर स्थान जो एक गैर-रेखीय स्केलिंग से ग्रस्त है।
हल्दस-मेरुला

2
यह ध्यान देने योग्य हो सकता है कि यदि सभी पैमाने कारक गैर-नकारात्मक हैं (जैसा कि कोई स्वाभाविक रूप से ग्रहण करेगा), तो सभी सममित सकारात्मक-निश्चित मैट्रिक्स को "स्केलिंग" मेट्रिक्स माना जा सकता है। आपके द्वारा चाहा गया संबंध बड़े पैमाने पर, अन्य बातों के साथ , मानचित्र अनुमानों में विकृति के अध्ययन और वर्णन में उपयोग किया जाता है। वहां, पृथ्वी की सतह पर अधिकतम और न्यूनतम कोणों में रुचि केंद्र, जो मानचित्र पर दो लंबवत दिशाओं से जुड़े होंगे । इन कोणों और दो पैमाने के कारकों के अनुपात के बीच सीधा संबंध है।
whuber

जवाबों:


8

चूंकि काफी सामान्य है, और ब्रह्मांड समानता में परिवर्तन विशेष पर निर्भर करता है तथा बीबी और उनके संबंध , कोई निश्चित सूत्र संभव नहीं है। हालांकि, व्यावहारिक रूप से कम्प्यूटेशनल सीमाएं हैं कि कॉस्मिक समानता कितनी बदल सकती है । के बीच के कोण को बढ़ाकर उन्हें पाया जा सकता है तथा बीबी यह देखते हुए कि कोसाइन के बीच समानता है तथा बीबी एक निर्दिष्ट मान है, कहते हैं क्योंकि(2φ)क्योंकि( 2 ϕ ) (कहाँ पे 2φ2 ϕ के बीच का कोण है तथा बीबी)। जवाब हमें बताता है कि कोई भी कोण कितना है2φ2 ϕ संभवतया परिवर्तन द्वारा झुक सकता है

गणना गड़बड़ होने का खतरा है। अंकन के कुछ चतुर विकल्प, कुछ प्रारंभिक सरलीकरण के साथ, प्रयास को कम करते हैं। यह पता चला है कि दो आयामों में समाधान से पता चलता है कि हमें क्या चाहिए। यह एक ट्रैक्टेबल समस्या है, जो केवल एक वास्तविक चर पर निर्भर करता हैθθ, जो कैलकुलस तकनीकों का उपयोग करके आसानी से हल किया जाता है। एक सरल ज्यामितीय तर्क इस समाधान को किसी भी संख्या में आयाम तक बढ़ाता हैnn

गणितीय पूर्वाग्रहों

परिभाषा के अनुसार, किन्हीं दो वैक्टरों के बीच का कोण A तथा बीBउन्हें यूनिट की लंबाई को सामान्य करने और उनके उत्पाद लेने के द्वारा प्राप्त किया जाता है। इस प्रकार,

'बी(')(बी'बी)=क्योंकि(2φ)

AB(AA)(BB)=cos(2ϕ)

और, लेखन Σ='Σ=MMकी छवियों के बीच कोण के कोसाइन A तथा बीB परिवर्तन के तहत M है

()'(बी)(()'())((बी)'(बी))='Σबी('Σ)(बी'Σबी)

( एम)'( एमबी )( ( एम))'( एमएक ) )( ( एम)बी)'( एमबी ) )-----------------------='Σ बी('Σ ) (बी'Σ बी )------------(1)

ध्यान दें कि केवल ΣΣविश्लेषण में मायने रखता है, नहींअपने आप। इसलिए हम सिंगुलर वैल्यू डीकम्पोजिशन (SVD) का फायदा उठा सकते हैंसमस्या को आसान बनाने के लिए। स्मरण करो कि यह व्यक्त करता है एक ऑर्थोगोनल मैट्रिक्स के उत्पाद (दाएं से बाएं) के रूप में वी'वी', एक विकर्ण मैट्रिक्स डीडी, और एक अन्य ऑर्थोगोनल मैट्रिक्स यूयू:

=यूडीवी'

= यूडीवी'

दूसरे शब्दों में, विशेषाधिकार प्राप्त वैक्टर का एक आधार है 1,...,n1, ,n (के कॉलम वीवी) जिस पर प्रत्येक rescaling द्वारा कार्य करता है मैंमैं द्वारा अलग से मैंवेंमैंवें का विकर्ण प्रवेश डीडी (जिसे मैं फोन करूंगा मैंमैं) और बाद में एक रोटेशन (या विरोधी रोटेशन) यूयूपरिणाम के लिए। वह अंतिम रोटेशन किसी भी लंबाई या कोण को नहीं बदलेगा और इसलिए प्रभावित नहीं होना चाहिएΣΣ। आप इसे औपचारिक रूप से गणना के साथ देख सकते हैं

Σ='=(यूडीवी')'(यूडीवी')=वीडी(यू'यू)डीवी'=वीडी2वी'

Σ ='= ( यूडीवी')'( यूडीवी') = वीडी (यू'यू) डीवी'= वीडी2वी'

नतीजतन, अध्ययन करने के लिए ΣΣ हम स्वतंत्र रूप से बदल सकते हैं किसी भी अन्य मैट्रिक्स द्वारा जो समान मूल्यों का उत्पादन करता है (1)( 1 )। आदेश देकरमैंमैं ताकि मैंमैं आकार में कमी (और ग्रहण करना पहचान शून्य नहीं है), का एक अच्छा विकल्प है

=11डीवी'

=11डीवी'

के विकर्ण तत्व (1/1)डी( 1 /)1) डी कर रहे हैं

1=1/1λ2=2/1λ3=3/1λn=n/10।

1=d1/d1λ2=d2/d1λ3=d3/d1λn=dn/d10.

विशेष रूप से, का प्रभाव M (whether in its original or changed form) on all angles is completely determined by the fact that

Mei=λiei.

Mei=λiei.

Analysis of a special case

Let n=2n=2. Because changing the lengths of vectors does not change the angle between them, we may assume AA and BB are unit vectors. In the plane all such vectors may be designated by the angle they make with e1e1, allowing us to write

A=cos(θϕ)e1+sin(θϕ)e2.

A=cos(θϕ)e1+sin(θϕ)e2.

Therefore

B=cos(θ+ϕ)e1+sin(θ+ϕ)e2.

B=cos(θ+ϕ)e1+sin(θ+ϕ)e2.

(See the figure below.)

Applying MM is simple: it fixes the first coordinates of AA and BB and multiplies their second coordinates by λ2λ2. Therefore the angle from MAMA to MBMB is

f(θ)=arctan(λ2tan(θ+ϕ))arctan(λ2tan(θϕ)).

f(θ)=arctan(λ2tan(θ+ϕ))arctan(λ2tan(θϕ)).

Because MM is a continuous function, this difference of angles is a continuous function of θθ. In fact, it is differentiable. This allows us to find the extreme angles by inspecting the zeros of the derivative f(θ)f(θ). That derivative is straightforward to compute: it is a ratio of trigonometric functions. The zeros can occur only among the zeros of its numerator, so let's not bother to compute the denominator. We obtain

f(θ)=λ2(1λ2)(λ2+1)sin(2θ)sin(2ϕ).

f(θ)=λ2(1λ2)(λ2+1)sin(2θ)sin(2ϕ).

The special cases of λ2=0λ2=0, λ2=1λ2=1,and ϕ=0ϕ=0 are easily understood: they correspond to the situations where MM is of reduced rank (and so squashes all vectors onto a line); where MM is a multiple of the identity matrix; and where AA and BB are parallel (whence the angle between them cannot change, regardless of θθ). The case λ2=1λ2=1 is precluded by the condition λ20λ20.

Apart from these special cases, the zeros occur only where sin(2θ)=0sin(2θ)=0: that is, θ=0θ=0 or θ=π/2θ=π/2. This means that the line determined by e1e1 bisects the angle ABAB. We now know that the extreme values of the angle between MAMA and MBMB must lie among the values of f(θ)f(θ), so let's compute them:

f(0)=arctan(λ2tan(ϕ))arctan(λ2tan(ϕ))=2arctan(λ2tan(ϕ));f(π/2)=arctan(λ2tan(π/2+ϕ))arctan(λ2tan(π/2ϕ))=2arctan(λ2cot(ϕ)).

f(0)f(π/2)=arctan(λ2tan(ϕ))arctan(λ2tan(ϕ))=2arctan(λ2tan(ϕ));=arctan(λ2tan(π/2+ϕ))arctan(λ2tan(π/2ϕ))=2arctan(λ2cot(ϕ)).

The corresponding cosines are

cos(f(0))=1λ22tan(ϕ)21+λ22tan(ϕ)2

cos(f(0))=1λ22tan(ϕ)21+λ22tan(ϕ)2(2)

and

cos(f(π/2))=1λ22cot(ϕ)21+λ22cot(ϕ)2=tan(ϕ)2λ22tan(ϕ)2+λ22.

cos(f(π/2))=1λ22cot(ϕ)21+λ22cot(ϕ)2=tan(ϕ)2λ22tan(ϕ)2+λ22.(3)

Often it's sufficient to understand how MM distorts right angles. In this case, 2ϕ=π/22ϕ=π/2, leading to tan(ϕ)=cot(ϕ)=1tan(ϕ)=cot(ϕ)=1, which you may plug into the preceding formulas.

Note that the smaller λ2λ2 becomes, the more extreme these angles become and the greater is the distortion.

Figure showing four configurations

This figure shows four configurations of vectors AA and BB separated by an angle of 2ϕ=π/32ϕ=π/3. The unit circle and its elliptical image under MM are shaded for reference (with the action of MM uniformly rescaled to make λ1=1λ1=1). The figure headings indicate the value of θθ, the midpoint of AA and BB. The closest any such AA and BB can come when transformed by MM is a configuration like the one at the left with θ=0θ=0. The furthest apart they can be is a configuration like the one at the right with θ=π/2θ=π/2. Two intermediate possibilities are shown.

Solution for all dimensions

We have seen how MM acts by expanding each dimension ii by a factor λiλi. This will distort the unit sphere {A|AA=1}{A|AA=1} into an ellipsoid. The eiei determine its principal axes. The λiλi are the distances from the origin, along these axes, to the ellipsoid. Consequently the smallest one, λnλn, is the shortest distance (in any direction) from the origin to the ellipsoid and the largest one, λ1λ1, is the furthest distance (in any direction) from the origin to the ellipsoid.

In higher dimensions n>2n>2, AA and BB are part of a two-dimensional subspace. MM maps the unit circle in this subspace into the intersection of the ellipsoid with a plane containing MAMA and MBMB. This intersection, being a linear distortion of a circle, is an ellipse. Obviously the furthest distance to this ellipse is no more than λ1=1λ1=1 and the shortest distance is no less than λnλn.

As we observed at the end of the preceding section, the most extreme possibility is when AA and BB are situated in a plane containing two of the eiei for which the ratio of the corresponding λiλi is as small as possible. This will happen in the e1,ene1,en plane. We already have the solution for that case.

Conclusions

The extremes of cosine similarity attainable by applying MM to two vectors having cosine similarity cos(2ϕ)cos(2ϕ) are given by (2)(2) and (3)(3). They are attained by situating AA and BB at equal angles to a direction in which Σ=MMΣ=MM maximally lengthens any vector (such as the e1e1 direction) and separating them in a direction in which ΣΣ minimally lengthens any vector (such as the enen direction).

These extremes can be computed in terms of the SVD of MM.


This is a fantastic answer! Thank you very much for this detailed discussion! I believe that you have a sign mistake in eqn (3) where you should just have an overall minus sign.
LFH

I'm interested in the case where the angle 2ϕ2ϕ approaches zero and I would like to get an inequality between 2ϕ2ϕ and ff. Is it true that based on your computation, I just need to find the most extreme (that is smallest) λnλn and in this case, the asymptotic inequality is given by 2λnϕf2λ1nϕ2λnϕf2λ1nϕ as ϕ0ϕ0?
LFH

6

You are probably interested in:

(MA,MB)=AT(MTM)B,

(MA,MB)=AT(MTM)B,

You can diagonalize MTM=UΣUTMTM=UΣUT (or as you folks call it, PCA), which tells you that the similarity of A,BA,B under transformation MM behaves by projecting A,BA,B onto your principal components, and subsequently calculating similarity in this new space. To flesh this out a bit more, let the principal components be uiui with eigenvalues λiλi. Then

UB=i(ui,bi)ui, UA=i(ui,ai)ui,

UB=i(ui,bi)ui, UA=i(ui,ai)ui,

which gives you:

(MA,MB)=ni=1(ui,ai)(ui,bi)λi.

(MA,MB)=i=1n(ui,ai)(ui,bi)λi.

Notice that there is a scaling going on here: the λiλi are stretching/shrinking. When A,BA,B are unit vectors and if every λi=1λi=1, then MM corresponds to a rotation, and you get: sim(MA,MB)=sim(A,B)sim(MA,MB)=sim(A,B), which is equivalent to saying that inner products are invariant under rotations. In general, the angle stays the same when MM is a conformal transformation, which in this case requires that MM is invertible and the polar decomposition of MM satisfies M=OPM=OP with P=aIP=aI, i.e. MTM=a2IMTM=a2I.


1
Your initial statement of the problem neglects the normalization of the vectors AA, BB, MAMA, and MBMB required to compute the cosine similarity. It does not appear that the subsequent analysis addresses this normalization, either. Note, in particular, that the cosine similarities are preserved even when all the eigenvalues are equal to some (positive) value that differs from 1. That demonstrates, even in this simple case, that much more can be said.
whuber

@whuber: cosine similarity is preserved exactly when M is a conformal transformation, which in this case is equivalent to requiring M to be invertible and MTM=a2I, a multiple of the identity. Said another way, the polar decomposition of M satisfies M=OP, where P=aI. You're right about normalization but, it seems silly to talk about cosine similarity with non-normalized vectors A,B.
Alex R.

2
Not silly at all! Since this "similarity" is given by the cosine of the angle between the vectors, it makes sense for any two non-zero vectors. What I meant by "much more can be said" is that effective bounds on the angle between the images of A and B can be obtained in terms of the angle between A and B and the eigenvalues of M.
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.