क्या इस पर मान्य होने के लिए एक पदानुक्रमित क्लस्टरिंग के लिए दूरी "मीट्रिक" होनी चाहिए?


9

हम कहते हैं कि हम एक दूरी को परिभाषित करते हैं , जो एन आइटम के बीच एक मीट्रिक नहीं है ।

इस दूरी के आधार पर हम एक एग्लोमेरेटिव पदानुक्रमित क्लस्टरिंग का उपयोग करते हैं ।

क्या हम सार्थक परिणामों को प्राप्त करने के लिए प्रत्येक ज्ञात एल्गोरिथ्म (एकल / अधिकतम / एवरेज लिंकेज आदि) का उपयोग कर सकते हैं? या अलग से डालें, यदि दूरी मीट्रिक नहीं है तो उनका उपयोग करने में क्या समस्या है?


आपके मामले में "आइटम" क्या हैं? (मैं पूछ रहा हूं कि इसका मनोचिकित्सा से कोई लेना-देना है क्योंकि अगर ऐसा है, तो मैं आइटम क्लस्टरिंग या रेवेल, डब्ल्यू। श्रेणीबद्ध क्लस्टर विश्लेषण और परीक्षणों की आंतरिक संरचना , एमबीआर (1979) 14 पर एक नज़र रखने की सलाह दूंगा। : 57।)
chl

जवाबों:


7

दूरी के लिए आवश्यकताएं पदानुक्रमित क्लस्टरिंग की विधि पर निर्भर करती हैं। एकल, पूर्ण, औसत तरीकों को दूर-नकारात्मक और सममित होने के लिए दूरी की आवश्यकता होती है। वार्ड, केन्द्रक, मध्ययुगीन विधियों को ज्यामितीय रूप से अर्थपूर्ण परिणाम उत्पन्न करने के लिए यूक्लिडियन (जो कि मीट्रिक की तुलना में संकरी परिभाषा है) की आवश्यकता होती है।

(एक जांच कर सकता है कि क्या उसकी / उसकी दूरी मैट्रिक्स दोगुनी है, इसे [मेरे जवाब यहाँ देखें ] और eigenvalues ​​को देखते हुए यूक्लिडियन है ; यदि कोई नकारात्मक eigenvalues ​​नहीं मिला है, तो दूरी यूक्लिडियन स्थान में परिवर्तित हो जाती हैं।)


धन्यवाद। आगे प्रश्न: क्या एकल, पूर्ण, औसत विधियों के लिए त्रिभुज असमानता को धारण करना पड़ता है? और अगर कुछ दूरी है (उदाहरण के लिए) सममित नहीं है, तो इन तरीकों से क्या समस्या है? (धन्यवाद!)
२०:०२ पर ताल गैली

1
शास्त्रीय पदानुक्रमिक क्लस्टरिंग विधियाँ कुछ भी नहीं बल्कि सममित मैट्रिक्स ले सकती हैं : ए से बी = ए से बी तक की दूरी। अस्मितिकल (आप Google हो सकता है) से निपटने के लिए अन्य विशेष तरीके मौजूद हैं। त्रिकोणीय असमानता के लिए - आपके द्वारा उल्लिखित तरीकों के लिए यह आवश्यक शर्त नहीं है। (हालांकि, सामान्य ज्ञान असमानता के साथ "दूरी" के बारे में सोचता है, इसलिए यदि यह गायब है तो इसे लागू करने पर विचार करने के लायक है। ऐसा करने के लिए, पुनरावृत्तियाँ दूरियों और जांच के लिए छोटे निरंतर जोड़ते हैं। और यदि आप तक पहुँचने के लिए जोड़ना जारी रखते हैं। तब आप जल्द ही यूक्लिडियन दूरी पर पहुंचेंगे)
ttnphns

5

नहीं, दूरी का मीट्रिक होना जरूरी नहीं है। उदाहरण के लिए, यह एक अल्ट्रामेट्रिक हो सकता है:

d(A,B)max(d(A,C),d(B,C))

क्लस्टरिंग एल्गोरिथ्म में क्रमिक चरणों से प्राप्त अल्ट्रामेट्रिक दूरियों को डेंड्रोग्राम्स का उपयोग करके दर्शाया जा सकता है, जिसे आपने इस संदर्भ में देखा होगा।


धन्यवाद हाँग। मुझे याद है कि कुछ वस्तुओं को hclust में बदलने की विधियाँ मांगती हैं कि डेंड्रोग्राम अल्ट्रामेट्रिक है - अगर यह आपने लिखा है तो मुझे इससे कोई लेना-देना नहीं है। किसी भी घटना में, उत्तर के लिए धन्यवाद।
ताल गैलिली
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.