विषम दूरी के उपायों के साथ क्लस्टरिंग


9

आप एक विषम दूरी माप के साथ एक सुविधा को कैसे क्लस्टर करते हैं?

उदाहरण के लिए, मान लें कि आप सप्ताह के दिनों के साथ एक सुविधा के रूप में किसी डेटासेट को क्लस्टर कर रहे हैं - सोमवार से शुक्रवार की दूरी शुक्रवार से सोमवार तक की दूरी के समान नहीं है।

आप इसे क्लस्टरिंग एल्गोरिथ्म की दूरी माप में कैसे शामिल करते हैं?

जवाबों:


3

यदि एमएफ दूरी असममित है क्योंकि भविष्य अतीत से अलग है, तो एक वास्तविक असममित क्लस्टरिंग कहा जाता है। सबसे पहले, एक असममित दूरी फ़ंक्शन को परिभाषित किया जाना चाहिए।

असममित क्लस्टरिंग का एक तरीका, एक दूरी फ़ंक्शन को देखते हुए, मूल डेटा को एक नए समन्वयित स्थान में एम्बेड करना है। Naohito Chino और Kenichi Shiraiwa, Behaviormetrika, 1992 ( pdf ) द्वारा "असममित MDS के लिए कुछ गैर-दूरी मॉडल की ज्यामितीय संरचनाएं" देखें ( पीडीएफ )। इसे HCM (हर्मिटियन कैन्यिकल मॉडल) कहा जाता है।

एक हर्मिटियन मैट्रिक्स का पता लगाएं एच, कहाँ पे

एचमैंजे=12[(एक्समैं,एक्सजे)+(एक्सजे,एक्समैं)]+मैं12[(एक्समैं,एक्सजे)-(एक्सजे,एक्समैं)]
Eigenvalues ​​और eigenvectors खोजें, फिर प्रत्येक eigenvector को इसके संबंधित eigenvalue के वर्गमूल द्वारा स्केल करें।

यह डेटा को जटिल संख्याओं के एक स्थान में बदल देता है। एक बार डेटा एम्बेड होने के बाद, ऑब्जेक्ट x और y के बीच की दूरी x * y है, जहां * conjugate ट्रांज़ोज़ है। इस बिंदु पर आप जटिल वैक्टर पर k- साधन चला सकते हैं।

स्पेक्ट्रल असममित क्लस्टरिंग भी किया गया है, स्टीफन एमिलोव एटेव द्वारा थीसिस को देखें, "यूनिवर्सिटी ऑफ़ मिनेसोटा के स्पेक्ट्रल क्लस्टरिंग में असममितता का उपयोग करते हुए," मिनेसोटा विश्वविद्यालय, 2011, जो एक विशेष एल्गोरिथ्म के लिए MATLAB कोड है।


1

आप किसी प्रकार का अर्थ ले सकते हैं (जैसे अंकगणित माध्य या, प्रायिकता वितरण के लिए, जेनसेन-शैनन विचलन का वर्गमूल।)


1

आपके पास परिपत्र आँकड़ों पर एक नज़र होनी चाहिए (यदि आप "एक ट्यूनिंग सप्ताह के भीतर" काम करना चाहते हैं)


1

यदि आपकी दूरी फ़ंक्शन एक मान्य मर्सर कर्नेल नहीं है, तो एक्सएक्सटी, कहाँ पे एक्सग्राम मैट्रिक्स है। इस मामले में सह-क्लस्टरिंग चाहते हैं, जिसे द्वि-क्लस्टरिंग भी कहा जाता है। इस वर्ग के एल्गोरिदम पंक्तियों और स्तंभों के लिए एक साथ क्लस्टर संकेतक पैदा करते हैं।

आपके द्वारा दिया गया उदाहरण एक खराब चुनी गई दूरी मीट्रिक का परिणाम है। एक बेहतर दूरी मीट्रिक होगी|दिनों के अलावा|

आम तौर पर आपकी दूरी का कार्य एक मान्य मर्सर कर्नेल होना चाहिए। एक मान्य मर्सर कर्नेल किसी भी फ़ंक्शन को दो अवलोकन ले रहा है जो निरंतर, सममित है और एक सकारात्मक निश्चित सहसंयोजक मैट्रिक्स हैएक्सडी

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.