चूंकि मम काफी सामान्य है, और ब्रह्मांड समानता में परिवर्तन विशेष पर निर्भर करता है एए तथा बीबी और उनके संबंध मम, कोई निश्चित सूत्र संभव नहीं है। हालांकि, व्यावहारिक रूप से कम्प्यूटेशनल सीमाएं हैं कि कॉस्मिक समानता कितनी बदल सकती है । के बीच के कोण को बढ़ाकर उन्हें पाया जा सकता हैमएमए तथा मबीमबी यह देखते हुए कि कोसाइन के बीच समानता है एए तथा बीबी एक निर्दिष्ट मान है, कहते हैं क्योंकि(2φ)क्योंकि( 2 ϕ ) (कहाँ पे 2φ2 ϕ के बीच का कोण है एए तथा बीबी)। जवाब हमें बताता है कि कोई भी कोण कितना है2φ2 ϕ संभवतया परिवर्तन द्वारा झुक सकता है मम।
गणना गड़बड़ होने का खतरा है। अंकन के कुछ चतुर विकल्प, कुछ प्रारंभिक सरलीकरण के साथ, प्रयास को कम करते हैं। यह पता चला है कि दो आयामों में समाधान से पता चलता है कि हमें क्या चाहिए। यह एक ट्रैक्टेबल समस्या है, जो केवल एक वास्तविक चर पर निर्भर करता हैθθ, जो कैलकुलस तकनीकों का उपयोग करके आसानी से हल किया जाता है। एक सरल ज्यामितीय तर्क इस समाधान को किसी भी संख्या में आयाम तक बढ़ाता हैnn।
गणितीय पूर्वाग्रहों
परिभाषा के अनुसार, किन्हीं दो वैक्टरों के बीच का कोण एA तथा बीBउन्हें यूनिट की लंबाई को सामान्य करने और उनके उत्पाद लेने के द्वारा प्राप्त किया जाता है। इस प्रकार,
ए'बी√(ए'ए)(बी'बी)=क्योंकि(2φ)
A′B(A′A)(B′B)−−−−−−−−−−√=cos(2ϕ)
और, लेखन Σ=म'मΣ=M′Mकी छवियों के बीच कोण के कोसाइन एA तथा बीB परिवर्तन के तहत मM है
(मए)'(मबी)√((मए)'(मए))((मबी)'(मबी))=ए'Σबी√(ए'Σए)(बी'Σबी)।
( एमए)'( एमबी )( ( एम)ए)'( एमएक ) )( ( एम)बी)'( एमबी ) )-----------------------√=ए'Σ बी(ए'Σ ए ) (बी'Σ बी )------------√।(1)
ध्यान दें कि केवल ΣΣविश्लेषण में मायने रखता है, नहींममअपने आप। इसलिए हम सिंगुलर वैल्यू डीकम्पोजिशन (SVD) का फायदा उठा सकते हैंममसमस्या को आसान बनाने के लिए। स्मरण करो कि यह व्यक्त करता हैमम एक ऑर्थोगोनल मैट्रिक्स के उत्पाद (दाएं से बाएं) के रूप में वी'वी', एक विकर्ण मैट्रिक्स डीडी, और एक अन्य ऑर्थोगोनल मैट्रिक्स यूयू:
म=यूडीवी'।
म= यूडीवी'।
दूसरे शब्दों में, विशेषाधिकार प्राप्त वैक्टर का एक आधार है इ1,...,इnइ1, … ,इn (के कॉलम वीवी) जिस पर मम प्रत्येक rescaling द्वारा कार्य करता है इमैंइमैं द्वारा अलग से मैंवेंमैंवें का विकर्ण प्रवेश डीडी (जिसे मैं फोन करूंगा घमैंघमैं) और बाद में एक रोटेशन (या विरोधी रोटेशन) यूयूपरिणाम के लिए। वह अंतिम रोटेशन किसी भी लंबाई या कोण को नहीं बदलेगा और इसलिए प्रभावित नहीं होना चाहिएΣΣ। आप इसे औपचारिक रूप से गणना के साथ देख सकते हैं
Σ=म'म=(यूडीवी')'(यूडीवी')=वीडी(यू'यू)डीवी'=वीडी2वी'।
Σ =म'म= ( यूडीवी')'( यूडीवी') = वीडी (यू'यू) डीवी'= वीडी2वी'।
नतीजतन, अध्ययन करने के लिए ΣΣ हम स्वतंत्र रूप से बदल सकते हैं मम किसी भी अन्य मैट्रिक्स द्वारा जो समान मूल्यों का उत्पादन करता है (1)( 1 )। आदेश देकरइमैंइमैं ताकि घमैंघमैं आकार में कमी (और ग्रहण करना मम पहचान शून्य नहीं है), का एक अच्छा विकल्प मम है
म=1घ1डीवी'।
म=1घ1डीवी'।
के विकर्ण तत्व (1/घ1)डी( 1 /)घ1) डी कर रहे हैं
1=घ1/घ1≥λ2=घ2/घ1≥λ3=घ3/घ1≥⋯≥λn=घn/घ1≥0।
1=d1/d1≥λ2=d2/d1≥λ3=d3/d1≥⋯≥λn=dn/d1≥0.
विशेष रूप से, का प्रभाव मM (whether in its original or changed form) on all angles is completely determined by the fact that
Mei=λiei.
Mei=λiei.
Analysis of a special case
Let n=2n=2. Because changing the lengths of vectors does not change the angle between them, we may assume AA and BB are unit vectors. In the plane all such vectors may be designated by the angle they make with e1e1, allowing us to write
A=cos(θ−ϕ)e1+sin(θ−ϕ)e2.
A=cos(θ−ϕ)e1+sin(θ−ϕ)e2.
Therefore
B=cos(θ+ϕ)e1+sin(θ+ϕ)e2.
B=cos(θ+ϕ)e1+sin(θ+ϕ)e2.
(See the figure below.)
Applying MM is simple: it fixes the first coordinates of AA and BB and multiplies their second coordinates by λ2λ2. Therefore the angle from MAMA to MBMB is
f(θ)=arctan(λ2tan(θ+ϕ))−arctan(λ2tan(θ−ϕ)).
f(θ)=arctan(λ2tan(θ+ϕ))−arctan(λ2tan(θ−ϕ)).
Because MM is a continuous function, this difference of angles is a continuous function of θθ. In fact, it is differentiable. This allows us to find the extreme angles by inspecting the zeros of the derivative f′(θ)f′(θ). That derivative is straightforward to compute: it is a ratio of trigonometric functions. The zeros can occur only among the zeros of its numerator, so let's not bother to compute the denominator. We obtain
f′(θ)=λ2(1−λ2)(λ2+1)sin(2θ)sin(2ϕ)∗.
f′(θ)=λ2(1−λ2)(λ2+1)sin(2θ)sin(2ϕ)∗.
The special cases of λ2=0λ2=0, λ2=1λ2=1,and ϕ=0ϕ=0 are easily understood: they correspond to the situations where MM is of reduced rank (and so squashes all vectors onto a line); where MM is a multiple of the identity matrix; and where AA and BB are parallel (whence the angle between them cannot change, regardless of θθ). The case λ2=−1λ2=−1 is precluded by the condition λ2≥0λ2≥0.
Apart from these special cases, the zeros occur only where sin(2θ)=0sin(2θ)=0: that is, θ=0θ=0 or θ=π/2θ=π/2. This means that the line determined by e1e1 bisects the angle ABAB. We now know that the extreme values of the angle between MAMA and MBMB must lie among the values of f(θ)f(θ), so let's compute them:
f(0)=arctan(λ2tan(ϕ))−arctan(λ2tan(−ϕ))=2arctan(λ2tan(ϕ));f(π/2)=arctan(λ2tan(π/2+ϕ))−arctan(λ2tan(π/2−ϕ))=2arctan(λ2cot(−ϕ)).
f(0)f(π/2)=arctan(λ2tan(ϕ))−arctan(λ2tan(−ϕ))=2arctan(λ2tan(ϕ));=arctan(λ2tan(π/2+ϕ))−arctan(λ2tan(π/2−ϕ))=2arctan(λ2cot(−ϕ)).
The corresponding cosines are
cos(f(0))=1−λ22tan(ϕ)21+λ22tan(ϕ)2
cos(f(0))=1−λ22tan(ϕ)21+λ22tan(ϕ)2(2)
and
cos(f(π/2))=1−λ22cot(ϕ)21+λ22cot(ϕ)2=tan(ϕ)2−λ22tan(ϕ)2+λ22.
cos(f(π/2))=1−λ22cot(ϕ)21+λ22cot(ϕ)2=tan(ϕ)2−λ22tan(ϕ)2+λ22.(3)
Often it's sufficient to understand how MM distorts right angles. In this case, 2ϕ=π/22ϕ=π/2, leading to tan(ϕ)=cot(ϕ)=1tan(ϕ)=cot(ϕ)=1, which you may plug into the preceding formulas.
Note that the smaller λ2λ2 becomes, the more extreme these angles become and the greater is the distortion.
This figure shows four configurations of vectors AA and BB separated by an angle of 2ϕ=π/32ϕ=π/3. The unit circle and its elliptical image under MM are shaded for reference (with the action of MM uniformly rescaled to make λ1=1λ1=1). The figure headings indicate the value of θθ, the midpoint of AA and BB. The closest any such AA and BB can come when transformed by MM is a configuration like the one at the left with θ=0θ=0. The furthest apart they can be is a configuration like the one at the right with θ=π/2θ=π/2. Two intermediate possibilities are shown.
Solution for all dimensions
We have seen how MM acts by expanding each dimension ii by a factor λiλi. This will distort the unit sphere {A|A′A=1}{A|A′A=1} into an ellipsoid. The eiei determine its principal axes. The λiλi are the distances from the origin, along these axes, to the ellipsoid. Consequently the smallest one, λnλn, is the shortest distance (in any direction) from the origin to the ellipsoid and the largest one, λ1λ1, is the furthest distance (in any direction) from the origin to the ellipsoid.
In higher dimensions n>2n>2, AA and BB are part of a two-dimensional subspace. MM maps the unit circle in this subspace into the intersection of the ellipsoid with a plane containing MAMA and MBMB. This intersection, being a linear distortion of a circle, is an ellipse. Obviously the furthest distance to this ellipse is no more than λ1=1λ1=1 and the shortest distance is no less than λnλn.
As we observed at the end of the preceding section, the most extreme possibility is when AA and BB are situated in a plane containing two of the eiei for which the ratio of the corresponding λiλi is as small as possible. This will happen in the e1,ene1,en plane. We already have the solution for that case.
Conclusions
The extremes of cosine similarity attainable by applying MM to two vectors having cosine similarity cos(2ϕ)cos(2ϕ) are given by (2)(2) and (3)(3). They are attained by situating AA and BB at equal angles to a direction in which Σ=M′MΣ=M′M maximally lengthens any vector (such as the e1e1 direction) and separating them in a direction in which ΣΣ minimally lengthens any vector (such as the enen direction).
These extremes can be computed in terms of the SVD of MM.