जीएमएम ओवरलैपिंग पहाड़ियों का उपयोग करता है जो अनंत तक फैलते हैं (लेकिन व्यावहारिक रूप से केवल 3 सिग्मा के लिए गणना)। प्रत्येक बिंदु को सभी पहाड़ियों की संभावना स्कोर मिलते हैं। इसके अलावा, पहाड़ियों को "अंडे के आकार का" [ठीक है, वे सममित रूप से ग्रहण करते हैं ] और, पूर्ण सहसंयोजक मैट्रिक्स का उपयोग करते हुए, झुका जा सकता है ।
कश्मीर का मतलब कड़ी मेहनत से प्रदान करती है एक करने के लिए एक बिंदु एक क्लस्टर है, तो अन्य क्लस्टर केन्द्रों के स्कोर पर ध्यान नहीं दिया हो (परोक्ष / शून्य पर रीसेट कर रहे हैं परवाह नहीं है)। पहाड़ियाँ गोलाकार साबुन के बुलबुले हैं। जहाँ दो साबुन के बुलबुले स्पर्श करते हैं, उनके बीच की सीमा समतल (हाइपर) प्लेन बन जाती है। जिस तरह जब आप कई साबुन के बुलबुले के झाग को उड़ाते हैं, तो अंदर के बुलबुले सपाट नहीं होते हैं, बल्कि पेटी होते हैं, इसलिए कई (हाइपर-) क्षेत्रों के बीच की सीमा वास्तव में अंतरिक्ष के वोरोनोई विभाजन का निर्माण करती है। 2 डी में, यह हेक्सागोनल क्लोज-पैकिंग की तरह अस्पष्ट दिखता है, एक मधुमक्खी का छत्ता लगता है (हालांकि वोरोनोई कोशिकाओं को हेक्सागोन होने की गारंटी नहीं है)। K- साधन पहाड़ी गोल है और झुका हुआ नहीं है, इसलिए इसमें प्रतिनिधित्व शक्ति कम है; लेकिन यह गणना करने के लिए बहुत तेज है, विशेष रूप से उच्च आयामों में।
क्योंकि K- साधन यूक्लिडियन दूरी मीट्रिक का उपयोग करता है, यह मानता है कि आयाम तुलनीय हैं और समान वजन के हैं। इसलिए यदि आयाम X में प्रति घंटे मील की इकाइयाँ होती हैं, तो 0 से 80 तक बदलती हैं, और आयाम Y में पाउंड की इकाइयाँ होती हैं, 0 से 400 तक बदलती हैं, और आप इस XY स्थान में मंडलियों को फिट कर रहे हैं, फिर एक आयाम (और इसका प्रसार) अन्य आयामों की तुलना में अधिक शक्तिशाली होने जा रहा है और परिणामों की निगरानी करेगा। यही कारण है कि K- साधन लेते समय डेटा को सामान्य करने के लिए यह प्रथागत है।
दोनों जीएमएम और कश्मीर साधन मॉडल क्या दिया है करने के लिए सबसे अच्छा अनुमान ढाले से डेटा। GMM झुके हुए अंडे, और K- साधन फिट बैठता है जब तक कि गोलाकार न हो। लेकिन अंतर्निहित डेटा को कुछ भी आकार दिया जा सकता है, यह एक सर्पिल या पिकासो पेंटिंग हो सकता है, और प्रत्येक एल्गोरिथ्म अभी भी चलेगा, और अपना सर्वश्रेष्ठ शॉट लेगा। क्या परिणामी मॉडल कुछ भी दिखता है जैसे वास्तविक डेटा डेटा बनाने वाली अंतर्निहित भौतिक प्रक्रिया पर निर्भर करता है। (उदाहरण के लिए, समय की देरी के माप एकतरफा हैं; एक गाऊसी एक अच्छा फिट है? शायद।)
Rn
इस प्रकार आपकी 8x8 द्विआधारी छवि को पहले हाइपरक्वाड्रेंट में 64-आयामी हाइपरक्यूब के रूप में माना जा रहा है। एल्गोरिदम तब क्लस्टर खोजने के लिए ज्यामितीय उपमाओं का उपयोग करता है। K- साधनों के साथ दूरी, 64-आयामी अंतरिक्ष में यूक्लिडियन दूरी के रूप में दिखाई देती है। इसे करने का एक तरीका है।