दूरी सहसंयोजक / सहसंबंध (= ब्राउनियन सहवास / सहसंबंध) की गणना निम्नलिखित चरणों में की जाती है:
N
चर द्वारा मामलों के बीच यूक्लिडियन दूरी की मैट्रिक्स की गणना , और चर Y द्वारा इसी तरह की एक और मैट्रिक्स । दो मात्रात्मक विशेषताओं में से कोई, एक्स या वाई , बहुभिन्नरूपी हो सकती है, न कि केवल अविभाज्य।XYXY
- प्रत्येक मैट्रिक्स का दोहरा केंद्रित करना। देखें कि आमतौर पर डबल सेंटरिंग कैसे की जाती है। हालांकि, हमारे मामले में, जब यह है कर नहीं वर्ग दूरी शुरू में और से विभाजित नहीं है अंत में। पंक्ति, स्तंभ का अर्थ और तत्वों का समग्र मतलब शून्य हो जाता है।−2
- दो परिणामी मेट्रिसेस को तत्व रूप से गुणा करें और योग की गणना करें; या समतुल्य, मेट्रिसेस को दो कॉलम वैक्टर में खोलना और उनके सममित क्रॉस-उत्पाद की गणना करना।
- औसत,, तत्वों की संख्या से विभाजित
N^2
।
- वर्गाकार जड़ लें। इसका परिणाम X और Y के बीच की दूरी का कोविरेंस है ।XY
- दूरी भिन्नताएं की दूरी के सहसंयोजक हैं , स्वयं के साथ वाई के, आप उन्हें इसी तरह से इंगित करते हैं, अंक 3-4-5।XY
- दूरी सहसंबंध को तीन संख्याओं से समान रूप से प्राप्त किया जाता है कि पियर्सन सहसंबंध सामान्य सहसंयोजक से कैसे प्राप्त किया जाता है और variances की जोड़ी: दो variances के उत्पाद के वर्गमूल द्वारा सहसंयोजक को विभाजित करते हैं।
दूरी सहप्रसरण (और सहसंबंध) है नहीं सहप्रसरण (या सहसंबंध) दूरी आपस में। यह विशेष स्केलर उत्पादों (डॉट उत्पादों ) के बीच सहसंयोजक (सहसंबंध) है जिसमें "डबल केंद्रित" मैट्रीस शामिल हैं।
यूक्लिडियन अंतरिक्ष में, एक स्केलर उत्पाद समान दूरी के साथ असमान रूप से बंधा हुआ समानता है । यदि आपके पास दो बिंदु (वेक्टर) हैं तो आप बिना जानकारी खोए उनकी दूरी के बजाय स्केलर उत्पाद के रूप में उनकी निकटता व्यक्त कर सकते हैं।
हालांकि, एक स्केलर उत्पाद की गणना करने के लिए आपको अंतरिक्ष के मूल बिंदु का उल्लेख करना होगा (वैक्टर मूल से आते हैं)। आम तौर पर, कोई भी उस जगह को पसंद कर सकता है जहां वह पसंद करता है, लेकिन अक्सर और सुविधाजनक यह होता है कि वह अंकों के बादल के ज्यामितीय मध्य पर, मतलब है। क्योंकि माध्य उसी स्थान से संबंधित है क्योंकि बादल द्वारा छेड़े गए आयाम से प्रफुल्लित नहीं होगा।
अब, दूरी मैट्रिक्स (बादल के बिंदुओं के बीच) का सामान्य दोहरा केंद्र उस ज्यामितीय मध्य पर मूल को रखते हुए स्केलर उत्पादों के लिए दूरी को परिवर्तित करने का संचालन है। ऐसा करने में, दूरी के "नेटवर्क" को मूल रूप से विशिष्ट लंबाई और जोड़ीदार कोणों के वैक्टर के "फट" से बदल दिया जाता है:
[मेरे उदाहरण के चित्र पर नक्षत्र ग्रह है जो "चर" को दूर करता है, कहते हैं कि यह था , उत्पन्न होने से यह द्वि-आयामी था। जब X एकल-स्तंभ चर होता है, तो सभी बिंदु एक पंक्ति में, निश्चित रूप से झूठ बोलते हैं।]XX
डबल केंद्र संचालन के बारे में बस थोड़ा औपचारिक रूप से। दिखाया है n points x p dimensions
डेटा (univariate मामले में, )। आज्ञा देना अंक के बीच डी यूक्लिडियन दूरी के मैट्रिक्स हो । C को अपने कॉलम के साथ X होने दें । फिर एस = डबल केंद्रित डी 2 के बराबर है सी सी ' , अंक के बादल के बाद पंक्तियों के बीच अदिश उत्पादों केन्द्रित था। दोहरे केंद्र की मुख्य संपत्ति यह है कि 1Xp=1
Dn x n
n
CXS=double-centered D2CC′, और इस राशि का नकार राशि के बराबर होती हैबंदका -diagonal तत्वोंएस।12n∑D2=trace(S)=trace(C′C)S
दूरी सहसंबंध पर लौटें। जब हम दूरी सहसंयोजक की गणना करते हैं तो हम क्या कर रहे हैं? हमने दोनों जालों की दूरी को उनके संबंधित वैक्टरों में बदल दिया है। और फिर हम दो बंचों के संगत मानों के बीच सहसंबंध (और बाद में सहसंबंध) की गणना करते हैं: एक विन्यास के प्रत्येक स्केलर उत्पाद मूल्य (पूर्व दूरी मूल्य) को इसके दूसरे कॉन्फ़िगरेशन के संबंधित गुणक से गुणा किया जा रहा है। यह देखा जा सकता है (जैसा कि बिंदु 3 में कहा गया था) दो चर के बीच सामान्य सहसंयोजक की गणना करते हुए, उन "चर" में दो वृत्तों को वेक्टरकृत करने के बाद।
इस प्रकार, हम समानता के दो सेटों (स्केलर उत्पादों, जो कि परिवर्तित दूरी हैं) का सहसंयोजन कर रहे हैं। किसी भी प्रकार का सहसंयोजक क्षणों का क्रॉस-प्रोडक्ट है: आपको उन क्षणों की गणना करनी है, माध्य से विचलन, पहले - और डबल सेंट्रिंग वह अभिकलन था। यह आपके प्रश्न का उत्तर है: एक सहसंयोजक को क्षणों पर आधारित होने की आवश्यकता है लेकिन दूरी क्षण नहीं हैं।
(बिंदु 5) के बाद वर्गमूल का अतिरिक्त लेना तर्कसंगत लगता है क्योंकि हमारे मामले में पल पहले से ही एक प्रकार का सहसंयोजक था (एक अदिश उत्पाद और एक सहसंयोजक संरचनात्मक रूप से संकलित होता है) और इसलिए यह आया कि आप दो बार एक तरह के बहुउद्देशीय सहसंयोजक होते हैं। इसलिए मूल डेटा के मूल्यों के स्तर पर वापस आने के लिए (और सहसंबंध मूल्य की गणना करने में सक्षम होने के लिए) किसी को मूल को बाद में लेना होगा।
(0,2)12