मेरे पास कई वितरण हैं (नीचे दिए गए आंकड़े में 10 वितरण)।
वास्तव में ये हिस्टोग्राम होते हैं: x- अक्ष पर 70 मान होते हैं जो किसी विलयन में कुछ कणों के आकार होते हैं और x के प्रत्येक मान के लिए y का संबंधित मान उन कणों का अनुपात होता है जिनका आकार x के मान के आसपास होता है।
मैं इन वितरणों को क्लस्टर करना चाहूंगा। वर्तमान में मैं यूक्लिडियन दूरी के साथ एक पदानुक्रमित क्लस्टरिंग का उपयोग करता हूं उदाहरण के लिए। मैं दूरी की पसंद से संतुष्ट नहीं हूं। मैंने कुल्लब-लिबलर जैसे सूचना-सिद्धांत की दूरी की कोशिश की है, लेकिन डेटा में कई शून्य हैं और यह कठिनाइयों का कारण बनता है। क्या आपके पास उचित दूरी और / या अन्य क्लस्टरिंग विधि का प्रस्ताव है?