आप गलत सवाल पूछ रहे हैं।
"क्या एल्गोरिथ्म" पूछने के बजाय, आपको " आपके आवेदन में एक सार्थक श्रेणी / क्लस्टर " होना चाहिए ।
मुझे आश्चर्य नहीं है कि ऊपर एल्गोरिदम काम नहीं करते थे - वे बहुत अलग उपयोग के मामलों के लिए डिज़ाइन किए गए हैं। k- साधन मनमानी अन्य दूरी के साथ काम नहीं करता है । हैमिंग दूरी के साथ इसका इस्तेमाल न करें। ऐसा कारण है कि इसे k- साधन कहा जाता है , यह केवल तब उपयोग करने के लिए समझ में आता है जब अंकगणित का अर्थ सार्थक होता है (जो कि द्विआधारी डेटा के लिए नहीं है)।
आप इसके बजाय k- मोड्स आज़माना चाह सकते हैं, IIRC यह एक वैरिएंट है जो वास्तव में श्रेणीबद्ध डेटा के साथ उपयोग करने के लिए है, और बाइनरी डेटा कुछ हद तक श्रेणीबद्ध है (लेकिन स्पार्सिटी अभी भी आपको मार सकती है)।
लेकिन सबसे पहले, क्या आपने अपने डेटा को सरल बनाने के लिए डुप्लिकेट हटा दिए हैं , और उदाहरण के लिए अद्वितीय / खाली कॉलम हटा दिए हैं?
शायद APRIORI या इसी तरह के दृष्टिकोण भी आपकी समस्या के लिए अधिक सार्थक हैं।
किसी भी तरह से, पहले पता लगाएँ कि आपको क्या चाहिए, फिर कौन सा एल्गोरिथ्म इस चुनौती को हल कर सकता है। काम डेटा-संचालित , यादृच्छिक एल्गोरिदम की कोशिश करके नहीं।