यहाँ एक उदाहरण है, अगर मैं यह अधिशेष में कर रहा था, जो सहायक हो सकता है और अधिक व्यापक उत्तरों की प्रशंसा कर सकता है:
मान लें कि मेरे पास 3 निरंतर चर हैं और इन के आधार पर समूहों की पहचान करना चाहते हैं। मैं एक मिश्रण मॉडल (इस मामले में अधिक स्पष्ट रूप से, एक अव्यक्त प्रोफ़ाइल मॉडल) निर्दिष्ट करूंगा, सशर्त स्वतंत्रता (मान ली गई चर स्वतंत्र हैं, क्लस्टर सदस्यता दी गई) के रूप में:
Model:
%Overall%
v1* v2* v3*; ! Freely estimated variances
[v1 v2 v3]; ! Freely estimated means
मैं इस मॉडल को कई बार चलाऊंगा, हर बार अलग-अलग संख्या के समूहों को निर्दिष्ट करता हूं, और मुझे जो समाधान सबसे अधिक पसंद है (ऐसा करने के लिए यह अपने आप में एक विशाल विषय है) चुनें।
फिर k- साधन चलाने के लिए, मैं निम्नलिखित मॉडल निर्दिष्ट करूंगा:
Model:
%Overall%
v1@0 v2@0 v3@0; ! Variances constrained as zero
[v1 v2 v3]; ! Freely estimated means
इसलिए कक्षा सदस्यता केवल चर चर के साधनों से दूरी पर आधारित है। जैसा कि अन्य प्रतिक्रियाओं में कहा गया है, वैरिएन्स का इससे कोई लेना-देना नहीं है।
अधिशेष में ऐसा करने के बारे में अच्छी बात यह है कि ये नेस्टेड मॉडल हैं, और इसलिए आप सीधे परीक्षण कर सकते हैं कि क्या अड़चनों का परिणाम खराब है या नहीं, इसके अलावा दो तरीकों के बीच वर्गीकरण में भेदभाव की तुलना करने में सक्षम है। इन दोनों मॉडलों, वैसे, एक ईएम एल्गोरिथ्म का उपयोग करके अनुमान लगाया जा सकता है, इसलिए अंतर वास्तव में मॉडल के बारे में अधिक है।
यदि आप 3-डी स्पेस में सोचते हैं, तो 3 का मतलब एक बिंदु है ... और उस बिंदु के माध्यम से चलने वाले एक दीर्घवृत्त के तीन अक्षों को बदलता है। यदि सभी तीन संस्करण समान हैं, तो आपको एक क्षेत्र मिलेगा।