क्या यह निर्धारित करने का कोई तरीका है कि के-साधन क्लस्टर समाधान के भीतर डेटासेट की कौन सी विशेषताएं / चर सबसे महत्वपूर्ण / प्रभावी हैं?
क्या यह निर्धारित करने का कोई तरीका है कि के-साधन क्लस्टर समाधान के भीतर डेटासेट की कौन सी विशेषताएं / चर सबसे महत्वपूर्ण / प्रभावी हैं?
जवाबों:
पुस्तक बर्न्स, रॉबर्ट पी। और रिचर्ड बर्न्स की ओर से प्रत्येक सुविधा (= चर = आयाम) की उपयोगिता को निर्धारित करने का एक तरीका है । एसपीएसएस का उपयोग करके व्यावसायिक अनुसंधान के तरीके और आंकड़े। ऋषि, 2008. ( दर्पण ), क्लस्टर को बताने के लिए सुविधाओं की भेदभावपूर्ण शक्ति द्वारा परिभाषित की जा रही उपयोगिता।
हम आमतौर पर प्रत्येक क्लस्टर पर प्रत्येक क्लस्टर के साधनों की जांच करते हैं ताकि यह आकलन किया जा सके कि हमारे क्लस्टर कितने अलग हैं। आदर्श रूप में, हम विश्लेषण के लिए उपयोग किए जाने वाले सभी आयामों के लिए, यदि नहीं तो सभी के लिए अलग-अलग साधन प्राप्त करेंगे। प्रत्येक आयाम पर किए गए F मानों का परिमाण इस बात का संकेत है कि संबंधित आयाम समूहों के बीच कितना अच्छा भेदभाव करता है।
एक अन्य तरीका एक विशिष्ट सुविधा को हटाने और यह देखने के लिए होगा कि यह आंतरिक गुणवत्ता सूचकांकों को कैसे प्रभावित करता है । पहले समाधान के विपरीत, आपको प्रत्येक विशेषता (या सुविधाओं के सेट) के लिए क्लस्टरिंग को फिर से करना होगा जिसे आप विश्लेषण करना चाहते हैं।
जानकारी के लिए:
मैं दो अन्य संभावनाओं के बारे में सोच सकता हूं जो अधिक ध्यान केंद्रित करते हैं कि कौन से चर किन समूहों के लिए महत्वपूर्ण हैं।
बहु-श्रेणी वर्गीकरण। उन वस्तुओं पर विचार करें जो एक ही वर्ग (जैसे, कक्षा 1) के क्लस्टर एक्स सदस्यों से संबंधित हैं और दूसरी कक्षा के अन्य समूहों के सदस्यों से संबंधित वस्तुओं (जैसे, कक्षा 2)। कक्षा की सदस्यता की भविष्यवाणी करने के लिए एक क्लासिफायर ट्रेन करें (जैसे, कक्षा 1 बनाम कक्षा 2)। क्लासिफायर का चर गुणांक क्लस्टर x के लिए ऑब्जेक्ट को क्लस्टर करने में प्रत्येक चर के महत्व का अनुमान लगाने के लिए सेवा कर सकता है । अन्य सभी समूहों के लिए इस दृष्टिकोण को दोहराएं।
इंट्रा-क्लस्टर चर समानता। प्रत्येक चर के लिए, प्रत्येक वस्तु की औसत समानता की गणना उसके केन्द्रक पर करें। एक चर जिसमें एक केन्द्रक और उसकी वस्तुओं के बीच उच्च समानता है, एक चर की तुलना में क्लस्टरिंग प्रक्रिया के लिए अधिक महत्वपूर्ण है जिसमें कम समानता है। बेशक, समानता परिमाण सापेक्ष है, लेकिन अब चर को उस डिग्री से रैंक किया जा सकता है, जहां वे प्रत्येक क्लस्टर में वस्तुओं को क्लस्टर करने में मदद करते हैं।