बूलियन (यानी, दो वर्गों के साथ श्रेणीबद्ध) सुविधाओं के लिए, पीसीए का उपयोग करने का एक अच्छा विकल्प मल्टीपल कॉरेस्पॉन्डेंस एनालिसिस (एमसीए) का उपयोग करना है, जो कि पीसीए का विस्तार श्रेणीबद्ध चर (संबंधित धागा देखें ) के लिए है। एमसीए के बारे में कुछ पृष्ठभूमि के लिए, कागजात हसन एट अल हैं। (2010) , या अब्दी और वैलेंटाइन (2007) । MCA करने के लिए एक उत्कृष्ट R पैकेज FactoMineR है । यह आपको प्रमुख घटकों पर टिप्पणियों के भार के दो-आयामी मानचित्रों की साजिश करने के लिए उपकरण प्रदान करता है, जो बहुत ही व्यावहारिक है।
नीचे मेरे पिछले अनुसंधान परियोजनाओं में से दो मानचित्र उदाहरण हैं (ggplot2 के साथ प्लॉट किए गए)। मेरे पास केवल 60 अवलोकन थे और इसने अच्छे परिणाम दिए। पहला नक्शा स्पेस पीसी 1-पीसी 2 में टिप्पणियों का प्रतिनिधित्व करता है, दूसरा नक्शा स्पेस पीसी 3-पीसी 4 में ... चर को मैप में भी दर्शाया जाता है, जो आयामों के अर्थ की व्याख्या करने में मदद करता है। इन मानचित्रों में से कई से अंतर्दृष्टि एकत्रित करना आपके डेटा में क्या हो रहा है, इसकी एक बहुत अच्छी तस्वीर दे सकता है।
ऊपर दी गई वेबसाइट पर, आपको एक उपन्यास प्रक्रिया, एचसीपीसी के बारे में जानकारी मिलेगी, जो प्रमुख घटकों पर श्रेणीबद्ध क्लस्टरिंग के लिए है, और जो आपके लिए रुचि हो सकती है। मूल रूप से, यह विधि निम्नानुसार काम करती है:
- MCA करें,
- पहले को बनाए रखें क आयाम (कहां) k < p, साथ में पीआपकी सुविधाओं की मूल संख्या)। यह कदम इस मायने में उपयोगी है कि यह कुछ शोर को दूर करता है, और इसलिए अधिक स्थिर क्लस्टरिंग की अनुमति देता है,
- बनाए रखने वाले पीसी के स्थान पर एक एग्लोमेरेटिव (नीचे-ऊपर) पदानुक्रमित क्लस्टरिंग करते हैं। चूंकि आप पीसी स्पेस (वास्तविक संख्या) में टिप्पणियों के अनुमानों के निर्देशांक का उपयोग करते हैं, तो आप लिंकेज के लिए वार्ड की कसौटी (भीतर-क्लस्टर विचरण में न्यूनतम वृद्धि) के साथ यूक्लिडियन दूरी का उपयोग कर सकते हैं। आप अपनी पसंद की ऊंचाई पर डेंडोग्राम को काट सकते हैं या आर को काट सकते हैं यदि आप कुछ अनुमान के आधार पर,
- (वैकल्पिक) K- साधन क्लस्टरिंग करके क्लस्टर को स्थिर करते हैं। प्रारंभिक विन्यास पिछले चरण में पाए गए समूहों के केंद्रों द्वारा दिया जाता है।
फिर, आपके पास क्लस्टर (अधिकांश प्रतिनिधि सुविधाएँ, अधिकांश प्रतिनिधि व्यक्ति, आदि) की जांच करने के बहुत सारे तरीके हैं