मैं उच्च आदेश प्रणालियों की गतिशीलता को कम करना चाहता हूं और अधिकांश कोवरियन को अधिमानतः 2 आयामी या 1 आयामी क्षेत्र पर कब्जा करना चाहता हूं। मैं समझता हूं कि यह प्रमुख घटक विश्लेषण के माध्यम से किया जा सकता है, और मैंने कई परिदृश्यों में पीसीए का उपयोग किया है। हालांकि, मैंने इसे बूलियन डेटा प्रकारों के साथ उपयोग नहीं किया है, और मैं सोच रहा था कि क्या इस सेट के साथ पीसीए करना सार्थक है। उदाहरण के लिए, दिखावा करें कि मेरे पास गुणात्मक या वर्णनात्मक मीट्रिक हैं, और मैं "1" असाइन करता हूं यदि वह मीट्रिक उस आयाम के लिए मान्य है, और "0" यदि यह नहीं है (बाइनरी डेटा)। इसलिए, उदाहरण के लिए, आप स्नो व्हाइट में सात बौनों की तुलना करने की कोशिश कर रहे हैं। हमारे पास है:
Doc, Dopey, Bashful, Grumpy, Sneezy, Sleepy और Happy, और आप उन्हें गुणों के आधार पर व्यवस्थित करना चाहते हैं, और ऐसा किया है:
तो उदाहरण के लिए बैशफुल लैक्टोज असहिष्णु है और ए ऑनर रोल पर नहीं। यह एक विशुद्ध रूप से काल्पनिक मैट्रिक्स है, और मेरे वास्तविक मैट्रिक्स में कई अधिक वर्णनात्मक कॉलम होंगे। मेरा सवाल यह है कि क्या अब भी इस मैट्रिक्स पर पीसीए करना उचित होगा, जो व्यक्तियों के बीच समानता खोजने का एक साधन है?
a means of finding the similarity between individuals
। लेकिन यह कार्य एक क्लस्टर विश्लेषण के लिए है, पीसीए के लिए नहीं।