मैं एक डेटासेट पर एक पीसीए लागू करना चाहता हूं, जिसमें मिश्रित प्रकार के चर (निरंतर और बाइनरी) शामिल हैं। प्रक्रिया का वर्णन करने के लिए, मैं नीचे आर में एक न्यूनतम प्रतिलिपि प्रस्तुत करने योग्य उदाहरण पेस्ट करता हूं।
# Generate synthetic dataset
set.seed(12345)
n <- 100
x1 <- rnorm(n)
x2 <- runif(n, -2, 2)
x3 <- x1 + x2 + rnorm(n)
x4 <- rbinom(n, 1, 0.5)
x5 <- rbinom(n, 1, 0.6)
data <- data.frame(x1, x2, x3, x4, x5)
# Correlation matrix with appropriate coefficients
# Pearson product-moment: 2 continuous variables
# Point-biserial: 1 continuous and 1 binary variable
# Phi: 2 binary variables
# For testing purposes use hetcor function
library(polycor)
C <- as.matrix(hetcor(data=data))
# Run PCA
pca <- princomp(covmat=C)
L <- loadings(pca)
अब, मुझे आश्चर्य है कि घटक स्कोर (यानी, घटक लोडिंग द्वारा भारित कच्चे चर) की गणना कैसे की जाए। जब डेटासेट में निरंतर चर होते हैं, तो घटक स्कोर बस लोड किए गए मैट्रिक्स (एल ऊपर उदाहरण में एल) में संग्रहीत कच्चे डेटा और आइजनवेक्टर को गुणा (स्केल) करके प्राप्त किया जाता है। किसी भी प्वाइंटर की अत्यधिक सराहना की जाएगी।