एक सहसंयोजक मैट्रिक्स बनाने वाले चर के बीच की दूरी क्या है?


11

मेरे पास एक covariance मैट्रिक्स है और पदानुक्रमिक क्लस्टरिंग (उदाहरण के लिए, एक covariance मैट्रिक्स को सॉर्ट करने के लिए) का उपयोग करके समूहों में चर को विभाजित करना चाहते हैं ।kn×nk

क्या चर (यानी स्तंभों के बीच / वर्ग सहसंयोजक मैट्रिक्स की पंक्तियों) के बीच एक विशिष्ट दूरी समारोह है?

या यदि अधिक हैं, तो क्या विषय पर एक अच्छा संदर्भ है?


आप चर पर पदानुक्रमिक क्लस्टरिंग का उपयोग क्यों करना चाहेंगे? आम तौर पर, हम एक डेटा मैट्रिक्स बारे में सोचते हैं , पंक्तियों में कॉलम और टिप्पणियों में डब्ल्यू / चर। यदि आप अव्यक्त समूहों की तलाश करना चाहते हैं, तो आप कोशिश कर सकते हैं, जैसे, पंक्तियों / टिप्पणियों पर पदानुक्रमिक क्लस्टरिंग , या, उदाहरण के लिए, स्तंभों / चर पर कारक विश्लेषणX
गूँग - मोनिका

@ पॉट्र, हाँ, सहसंयोजक (या सहसंबंध या कोसाइन) को आसानी से और स्वाभाविक रूप से यूक्लिडियन दूरी में परिवर्तित किया जा सकता है, क्योंकि यह एक अदिश उत्पाद (= कोणीय प्रकार की समानता) है। दो चरों के साथ-साथ उनके बीच जानने का तात्पर्य है कि चर के बीच d जानने से स्वतः पता चलता है : । d2=σ12+σ222cov
ttnphns

ध्यान दें कि इस सूत्र का अर्थ है कि एक नकारात्मक सहसंयोजक सकारात्मक सहसंयोजक की तुलना में अधिक दूरी है (और यह वास्तव में ज्यामितीय दृष्टिकोण से मामला है)। अगर आप कोविरेंस के साइन को रोल नहीं करना चाहते हैं, तो नेगेटिव साइन को खत्म कर दें।
ttnphns

@ गंग यह एक सममित मैट्रिक्स है, इसलिए पंक्तियों ~ कॉलम। मेरे लिए इसे चर के सेट में विभाजित करना महत्वपूर्ण है, कारक विश्लेषण के साथ उन्हें 'घुमाने' के लिए नहीं (वास्तव में, मैं एक मानक कोव मैट्रिक्स के साथ काम नहीं कर रहा हूं, लेकिन एक जटिल एक (क्वांटम यांत्रिकी में घनत्व मैट्रिक्स)।
पियोट्र मिगदल

@ttnphns धन्यवाद जो चीज मुझे परेशान करती है वह यह है कि मैं असंबद्ध चर को अलग करना चाहता हूं - नकारात्मक सहसंबंध मेरे लिए (लगभग) उतना ही अच्छा है जितना कि सकारात्मक।
पायोत्र मिगदल

जवाबों:


13

dij2=σi2+σj22covijdij2सामान्य वर्ग के साथ सीधे आनुपातिक दूरी के समानुपाती है : यदि आप रकम और वर्गों के स्थान पर सम-वर्ग और सम-विषम का उपयोग करते हैं तो आप बाद में प्राप्त करेंगे। दोनों चर निश्चित रूप से शुरू में केंद्रित होने चाहिए: "सहसंयोजकों" का बोलना हटाए गए साधनों के साथ डेटा के बारे में सोचने के लिए अन्य नाम है।)

ध्यान दें, इस सूत्र का अर्थ है कि एक नकारात्मक सहसंयोजक सकारात्मक सहसंयोजक की तुलना में अधिक दूरी है (और यह वास्तव में ज्यामितीय बिंदु से मामला है, अर्थात जब चर को विषय स्थान में वैक्टर के रूप में देखा जाता है )। अगर आप कोविरेंस के साइन को रोल नहीं करना चाहते हैं, तो नेगेटिव साइन को खत्म कर दें। नकारात्मक संकेत को अनदेखा करना "हाथ से पैचिंग" ऑपरेशन नहीं है और इसकी आवश्यकता पड़ने पर वारंट किया जाता है : यदि कोव मैट्रिक्स सकारात्मक निश्चित है, तो एब्स (कोव) मैट्रिक्स सकारात्मक निश्चित भी होगा; और इसलिए उपरोक्त सूत्र द्वारा प्राप्त की गई दूरी सही यूक्लिडियन दूरी होगी (यूक्लिडियन दूरी एक विशेष प्रकार की मीट्रिक दूरी है)।

यूक्लिडियन दूरियां पदानुक्रमिक क्लस्टरिंग के संबंध में सार्वभौमिक हैं : इस तरह के क्लस्टरिंग की कोई भी विधि यूक्लिडियन या स्क्वेरेड यूक्लिडियन डी के साथ मान्य है । लेकिन कुछ तरीकों, जैसे औसत लिंकेज या पूर्ण लिंकेज, किसी भी असमानता या समानता (न केवल मीट्रिक दूरी) के साथ उपयोग किया जा सकता है। तो आप सीधे कोव या एब्स (कोव) मैट्रिक्स के साथ इस तरह के तरीकों का उपयोग कर सकते हैं या - उदाहरण के लिए - अधिकतम (एब्स (कोव)) - एब्स (कोव) दूरी मैट्रिक्स के साथ। बेशक, क्लस्टरिंग परिणाम संभावित रूप से उपयोग किए गए (डिस) समानता की सटीक प्रकृति पर निर्भर करते हैं।


dij2dij2

@HelloGoodbye, हाँ, मैं दो वैरिएबल (वैक्टर) समान साधनों के साथ लगाता हूँ - वास्तव में, पहले निकाले गए साधनों के साथ।
ttnphns

3

क्लस्टरिंग करने के लिए सहसंबंध मैट्रिक्स का उपयोग क्यों नहीं किया जाता है? मान लें कि आपके यादृच्छिक चर केंद्रित हैं, तो चर के बीच सहसंबंध की गणना करके आप कॉशन समानता दूरी की गणना कर रहे हैं । यह दूरी आपके लिंक में भी वर्णित है। इस दूरी का उपयोग पदानुक्रमिक क्लस्टरिंग के लिए किया जा सकता है। छोटी 1 - | कोसाइन समानता, आपके समान रूप से अधिक समान हैं।


d(i,j)=1Aij2/(AiiAjj)

3
आह, गलतफहमी के लिए खेद है। सबसे अच्छा स्रोत मुझे पता है कि यह है । वे पदानुक्रमित क्लस्टरिंग के साथ कई मैट्रिक्स (जो सहसंबंध का उपयोग करते हैं) की गुणवत्ता का अध्ययन करते हैं। पदानुक्रमिक क्लस्टरिंग के लिए मैं सामान्य रूप से कई मीट्रिक आज़माता हूं और देखता हूं कि मेरे विशेष लक्ष्य और डेटा के लिए सबसे अच्छा काम करता है।
जॉर्ज बान्यूलोस

लिंक अब काम नहीं करता है?
मतिफॉ
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.