मान लें कि हमारे पास दो तत्वों ई, ईजे । ई के बीच तत्वों ई और एक समानता ( दूरी नहीं ) फ़ंक्शन सिम (ईआई, ईजे) का एक सेट है ।
कैसे हम (कुशलता से) ई के तत्वों को सिम का उपयोग कर सकते हैं ?
k -means, उदाहरण के लिए, किसी दिए गए k की आवश्यकता होती है , कैनोपी क्लस्टरिंग को दो सीमा मानों की आवश्यकता होती है। अगर हम ऐसे पूर्वनिर्धारित मापदंडों को नहीं चाहते हैं तो क्या होगा?
ध्यान दें, कि सिम नेक्स्टली मेट्रिक नहीं है (अर्थात त्रिकोण असमानता पकड़ सकती है या नहीं हो सकती है)। इसके अलावा, इससे कोई फर्क नहीं पड़ता कि क्लस्टर असंतुष्ट हैं ( ई के विभाजन )।
1-sim(ei, ej) = Distance
। दूरी मीट्रिक के साथ आप उदाहरण के लिए पदानुक्रमिक क्लस्टरिंग लागू कर सकते हैं। जड़ से नीचे जाने पर आप देखेंगे कि किस स्तर पर दानेदार गुच्छे आपकी विशेष समस्या के लिए समझ में आएंगे।