कुल ss और ss के बीच k- साधन क्लस्टरिंग में क्या मतलब है?


10

मैं क्लस्टर विश्लेषण के लिए बहुत नया हूं। मैं आर का उपयोग कर रहा हूँ k- साधन क्लस्टरिंग के लिए और मुझे आश्चर्य है कि वे चीजें क्या हैं। और अगर उनका अनुपात छोटा या बड़ा है तो क्या बेहतर है?

जवाबों:


12

यह मूल रूप से वर्गीकरण के-साधनों की अच्छाई का एक उपाय है जो मिल गया है। एस एस जाहिर तौर पर वर्गों के योग के लिए खड़ा है, इसलिए यह "बीच में" और भक्ति "भीतर" में भटकाव का सामान्य विघटन है। आदर्श रूप से आप एक क्लस्टरिंग चाहते हैं जिसमें आंतरिक सामंजस्य और बाहरी पृथक्करण के गुण हैं, अर्थात बीएसएस / टीएसएस अनुपात 1 का दृष्टिकोण होना चाहिए।

उदाहरण के लिए, R में:

data(iris)
km <- kmeans(iris[,1:4], 3)

88.4% (0.884) का बीएसएस / टीएसएस अनुपात एक अच्छा फिट दर्शाता है। आपको कठिन सावधान रहना चाहिए, और आमतौर पर क्लस्टर की संख्या के खिलाफ डब्ल्यूएसएस की साजिश करना एक अच्छा विचार है, क्योंकि इस संख्या को पहले से निर्दिष्ट किया जाना है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.