यहां कई क्लस्टरिंग एल्गोरिदम का सारांश है जो प्रश्न का उत्तर देने में मदद कर सकता है
"किस क्लस्टरिंग तकनीक का मुझे उपयोग करना चाहिए?"
कोई उद्देश्यपूर्ण "सही" क्लस्टरिंग एल्गोरिदम रेफ नहीं है
क्लस्टरिंग एल्गोरिदम को उनके "क्लस्टर मॉडल" के आधार पर वर्गीकृत किया जा सकता है। एक विशेष प्रकार के मॉडल के लिए डिज़ाइन किया गया एल्गोरिथ्म आमतौर पर एक अलग तरह के मॉडल पर विफल हो जाएगा। उदाहरण के लिए, k- साधन गैर-उत्तल समूहों को नहीं पा सकते हैं, यह केवल गोलाकार आकार के समूहों को पा सकते हैं।
इसलिए, इन "क्लस्टर मॉडल" को समझना यह समझने की कुंजी बन जाता है कि विभिन्न क्लस्टरिंग एल्गोरिदम / विधियों में से कैसे चुनें। विशिष्ट क्लस्टर मॉडल में शामिल हैं:
[१] कनेक्टिविटी मॉडल: दूरी कनेक्टिविटी के आधार पर मॉडल बनाता है। उदा। श्रेणीबद्ध क्लस्टरिंग। पेड़ों की कटाई की ऊँचाई के आधार पर हमें अलग-अलग विभाजन की आवश्यकता होती है। आर समारोह: आँकड़े पैकेज में hclust।
[२] सेंट्रोइड मॉडल: एकल मीन वेक्टर द्वारा प्रत्येक क्लस्टर का प्रतिनिधित्व करके मॉडल बनाता है। इसका उपयोग तब किया जाता है जब हमें कुरकुरा विभाजन की आवश्यकता होती है (जैसा कि बाद में वर्णित फजी क्लस्टरिंग के विपरीत है)। आर समारोह: सांख्यिकी पैकेज में kmeans।
[३] वितरण मॉडल: सांख्यिकीय वितरण पर आधारित मॉडल का निर्माण करता है जैसे कि बहुभिन्नरूपी सामान्य वितरण अपेक्षा-अधिकतमकरण एल्गोरिदम द्वारा उपयोग किया जाता है। जब क्लस्टर आकार k- साधनों के विपरीत मनमाना हो सकता है जो परिपत्र समूहों को मानता है। आर फ़ंक्शन: एमक्लस्टर पैकेज में एमक्लस्टर।
[४] घनत्व मॉडल: डेटा स्पेस में जुड़े घने क्षेत्रों के रूप में क्लस्टर के आधार पर मॉडल बनाता है। जैसे DBSCAN और प्रकाशिकी। उपयोग किया जाता है जब क्लस्टर आकार k- साधनों के विपरीत मनमाना हो सकता है जो परिपत्र समूहों को मानता है .. R फ़ंक्शन dbscan in पैकेज dbscan।
[५] सबस्पेस मॉडल: क्लस्टर सदस्यों और प्रासंगिक विशेषताओं दोनों के आधार पर मॉडल बनाता है। उदाहरण के लिए (जिसे सह-क्लस्टरिंग या टू-मोड-क्लस्टरिंग के रूप में भी जाना जाता है)। एक साथ पंक्ति और स्तंभ क्लस्टरिंग की आवश्यकता होने पर उपयोग किया जाता है। बिकलस्ट पैकेज में आर फंक्शन बाइक्लस्ट।
[६] समूह मॉडल: समूह जानकारी के आधार पर मॉडल बनाता है। उदाहरण के लिए सहयोगी फ़िल्टरिंग (अनुशंसित एल्गोरिथम)। सिफारिशकर्ता पैकेज में आर फ़ंक्शन अनुशंसाकर्ता।
[Based] ग्राफ-आधारित मॉडल: प्रतिरूप पर आधारित मॉडल बनाता है। सामुदायिक संरचना का पता लगाने वाले एल्गोरिदम निर्देशित या अप्रत्यक्ष ग्राफ़ में घने उपसमूह खोजने की कोशिश करते हैं। आईजी आर पैकेज में एग आर फ़ंक्शन क्लस्टर_वॉकट्रैप।
[[] कोहेनन सेल्फ-ऑर्गनाइजिंग फ़ीचर मैप: न्यूरल नेटवर्क पर आधारित मॉडल बनाता है। कोहेनन पैकेज में आर फ़ंक्शन सोम।
[९] स्पेक्ट्रल क्लस्टरिंग: गैर-उत्तल क्लस्टर संरचना के आधार पर मॉडल बनाता है, या जब केंद्र का एक माप पूर्ण क्लस्टर का उपयुक्त विवरण नहीं होता है। समारोह kernlab पैकेज में स्पेक।
[१०] उप-क्लस्टर क्लस्टरिंग: उच्च-आयामी डेटा के लिए, दूरी के कार्य समस्याग्रस्त हो सकते हैं। क्लस्टर मॉडल में क्लस्टर के लिए प्रासंगिक विशेषताएँ शामिल हैं। जैसे, आर पैकेज एचडीक्लासिफ में एचडीडीसी फ़ंक्शन।
[११] अनुक्रम क्लस्टरिंग: समूह अनुक्रम जो संबंधित हैं। rBlast पैकेज।
[१२] आत्मीयता का प्रसार: डेटा बिंदुओं के बीच संदेश के आधार पर मॉडल बनाता है। यह एल्गोरिथ्म चलाने से पहले समूहों की संख्या निर्धारित करने की आवश्यकता नहीं है। यह कुछ कंप्यूटर दृष्टि और कम्प्यूटेशनल जीव विज्ञान कार्यों के लिए बेहतर है, उदाहरण के लिए मानव चेहरे के चित्रों का क्लस्टरिंग और विनियमित साधनों की पहचान, k- साधन, Ref Rpackage APCluster की तुलना में।
[१३] स्ट्रीम क्लस्टरिंग: डेटा पर आधारित मॉडल बनाता है जो लगातार टेलीफोन रिकॉर्ड, वित्तीय लेनदेन आदि जैसे पहुंचते हैं। जैसे R पैकेज BIRCH [ https://cran.r-project.org/src/contrib/Archive/birch/]
[१४] दस्तावेज़ क्लस्टरिंग (या टेक्स्ट क्लस्टरिंग): एसवीडी पर आधारित मॉडल बनाता है। इसका उपयोग विषय निष्कर्षण में किया गया है। Eg Carrot [ http://search.carrot2.org] एक खुला स्रोत खोज परिणाम क्लस्टरिंग इंजन है जो विषयगत श्रेणियों में दस्तावेजों को क्लस्टर कर सकता है।
[१५] अव्यक्त वर्ग मॉडल: यह अव्यक्त चर के एक सेट के लिए बहुभिन्नरूपी चर से संबंधित है। LCA सहयोगी फ़िल्टरिंग में उपयोग किया जा सकता है। रिकमेंडरलैब पैकेज में आर फंक्शनल अटेंडर के पास सहयोगी फ़िल्टरिंग कार्यक्षमता है।
[१६] बाइकलिस्टिंग: एक साथ दो-मोड डेटा की पंक्तियों और स्तंभों का उपयोग किया जाता है। एग आर फंक्शन बाइक्लस्ट इन पैकेज बिकल।
[१ust] सॉफ्ट क्लस्टरिंग (फजी क्लस्टरिंग): प्रत्येक ऑब्जेक्ट प्रत्येक क्लस्टर के एक निश्चित डिग्री के अंतर्गत आता है। फेकल पैकेज में ईजी आर फक्स्टल फ़ंक्शन।