एक तरीका यह है कि आपके समूह में सदस्यों को मैन्युअल रूप से निरीक्षण करने के लिए एक विशिष्ट कश्मीर के लिए यह देखने के लिए कि क्या समूह समझ में आता है (क्या यह अंतर है?)। यह आकस्मिक तालिकाओं और सशर्त साधनों के माध्यम से किया जा सकता है। इसे विभिन्न प्रकार के k के लिए करें और आप यह निर्धारित कर सकते हैं कि क्या मूल्य उचित है।
सिल्हूट मान का उपयोग करने के लिए एक कम व्यक्तिपरक तरीका है:
/programming/18285434/how-do-i-choose-k-when-using-k-means-clustering-with-silhouette-function
यह आपके पसंदीदा सॉफ्टवेयर पैकेज के साथ गणना की जा सकती है। लिंक से:
यह विधि सिर्फ इंट्रा-ग्रुप समानता की निकटतम समूह समानता से तुलना करती है। यदि किसी डेटा क्लस्टर के अन्य सदस्यों की औसत दूरी कुछ अन्य क्लस्टर सदस्यों से औसत दूरी से अधिक है, तो यह मान ऋणात्मक है और क्लस्टरिंग सफल नहीं है। दूसरी ओर, 1 के करीब सिल्हूट मान एक सफल क्लस्टरिंग ऑपरेशन को इंगित करता है। 0.5 क्लस्टरिंग के लिए एक सटीक उपाय नहीं है।