मैं अलग-अलग क्लस्टरिंग विधियों की तुलना करने के लिए एक त्वरित सिमुलेशन चला रहा हूं, और वर्तमान में क्लस्टर समाधान का मूल्यांकन करने की कोशिश कर रहा एक रोड़ा मारा।
मैं विभिन्न सत्यापन मेट्रिक्स ( आर में क्लस्टर (कई ) में पाया जाता है ) के बारे में जानता हूं, लेकिन मुझे लगता है कि यदि क्लस्टर की अनुमानित संख्या वास्तव में क्लस्टर की सही संख्या के बराबर है, तो उनका सबसे अच्छा उपयोग किया जाता है। मैं यह मापने की क्षमता बनाए रखना चाहता हूं कि जब कोई मूल क्लस्टर में सही संख्या में क्लस्टर की सही संख्या निर्दिष्ट नहीं करता है तो क्लस्टरिंग समाधान कितना अच्छा प्रदर्शन करता है (यानी, 4 क्लस्टर के लिए सिम्युलेटेड तीन क्लस्टर समाधान मॉडल डेटा कितनी अच्छी तरह से करता है? समाधान)। बस आपकी जानकारी के लिए, समान कोवरियस मैट्रिसेस के पास क्लस्टर का अनुकरण किया जाता है।
मुझे लगा कि गाऊसी के दो मिश्रणों के बीच केएल विचलन लागू करने के लिए उपयोगी होगा, लेकिन कोई भी बंद फार्म समाधान मौजूद नहीं है ( हर्षे और ओल्सन (2007) ) और मोंटे कार्लो सिमुलेशन को लागू करना कम्प्यूटेशनल रूप से महंगा होने लगा है।
क्या कोई अन्य समाधान है जिसे लागू करना आसान हो सकता है (भले ही सिर्फ एक अनुमान हो)?