मैं सोच रहा हूं कि क्या कोई सुझाव दे सकता है कि सामुदायिक शुरुआत / ग्राफ़ विभाजन / भारित , अप्रत्यक्ष किनारों वाले ग्राफ़ पर क्लस्टरिंग / क्लस्टरिंग का प्रदर्शन करने के लिए अच्छे शुरुआती बिंदु क्या हैं । प्रश्न में ग्राफ में लगभग 3 मिलियन किनारों हैं और प्रत्येक किनारे इसे जोड़ने वाले दो कोने के बीच समानता की डिग्री व्यक्त करता है। विशेष रूप से, इस डेटासेट में किनारे व्यक्ति हैं और कोने उनके देखे गए व्यवहार की समानता का एक उपाय हैं।
पिछले दिनों मैंने एक सुझाव का पालन किया था, जो मैंने सांख्यिकी.स्टैकएक्सचेंज डॉट कॉम पर प्राप्त किया था और इसमें न्यूमैन के प्रतिरूपकता क्लस्टरिंग के इग्राफ के कार्यान्वयन का उपयोग किया था और परिणामों से संतुष्ट था, लेकिन यह एक अनवीट किए गए डेटासेट पर था।
क्या कोई विशिष्ट एल्गोरिदम है जिसे मुझे देखना चाहिए?