लोडिंग (जो eigenvectors के साथ भ्रमित नहीं होना चाहिए ) में निम्नलिखित गुण हैं:
- प्रत्येक घटक के भीतर वर्गों के उनके योग प्रतिजन (घटक 'संस्करण) हैं।
- लोडिंग रेखीय संयोजन में गुणांक हैं (मानकीकृत) घटकों द्वारा एक चर की भविष्यवाणी करते हुए।
आपने 4 में से 2 पहले पीसी निकाले। लोडिंग के मैट्रिक्स और eigenvalues:A
A (loadings)
PC1 PC2
X1 .5000000000 .5000000000
X2 .5000000000 .5000000000
X3 .5000000000 -.5000000000
X4 .5000000000 -.5000000000
Eigenvalues:
1.0000000000 1.0000000000
इस उदाहरण में, दोनों eigenvalues समान हैं। यह वास्तविक दुनिया में एक दुर्लभ मामला है, यह कहता है कि PC1 और PC2 समान व्याख्यात्मक "ताकत" के हैं।
मान लीजिए कि आपने घटक मान, Nx2
मैट्रिक्स , और आपने z- मानकीकृत (मतलब = 0, st। Dev। = 1) उन्हें प्रत्येक कॉलम में दिया है। तब (जैसा कि ऊपर 2 बिंदु कहता है), । लेकिन, क्योंकि आप 4 में से केवल 2 पीसी छोड़ते हैं (आप में 2 और कॉलम कमी है ) पुनर्स्थापित डेटा मान सटीक नहीं हैं, - एक त्रुटि है (यदि eigenvalues 3, 4 नहीं है) शून्य)।एक्स = सी ए ' ए एक्सCX^=CA′AX^
ठीक। चर द्वारा घटकों की भविष्यवाणी करने के लिए गुणांक क्या हैं ? स्पष्ट रूप से, अगर भरे हुए थे , तो ये ।गैर-वर्ग लोडिंग मैट्रिक्स के साथ, हम उन्हें रूप में गणना कर सकते हैं , जहां इसके विकर्ण और प्रतिजन के साथ वर्ग विकर्ण मैट्रिक्स है, और सुपरस्क्रिप्ट को छद्म बिंदु के रूप में दर्शाया गया है। आपके मामले में:A4x4
B=(A−1)′B=A⋅diag(eigenvalues)−1=(A+)′diag(eigenvalues)
+
diag(eigenvalues):
1 0
0 1
B (coefficients to predict components by original variables):
PC1 PC2
X1 .5000000000 .5000000000
X2 .5000000000 .5000000000
X3 .5000000000 -.5000000000
X4 .5000000000 -.5000000000
इसलिए, अगर मूल केंद्रित चर (या मानकीकृत चर) का मैट्रिक्स है, यदि आप सहसंबंधों के बजाय सहसंबंधों के आधार पर पीसीए कर रहे हैं), तो ; मानकीकृत प्रमुख घटक स्कोर हैं। आपके उदाहरण में कौन सा है:XNx4
C=XBC
PC1 = 0.5 * X1 + 0.5 * X2 + 0.5 * X3 + 0.5 * X4 ~ (X1 + X2 + X3 + X4) / 4
"पहला घटक औसत स्कोर के समानुपाती है"
PC2 = 0.5 * X1 + 0.5 * X2 - 0.5 * X3 - 0.5 * X4 = (0.5 * X1 + 0.5 * X2) - (0.5 * X3 + 0.5 * X4)
"दूसरा घटक अंकों की पहली जोड़ी और अंकों की दूसरी जोड़ी के बीच अंतर को मापता है"
इस उदाहरण में यह दिखाई दिया कि , लेकिन सामान्य रूप से वे भिन्न हैं।B=A
नोट : गुणांक के घटक घटकों के स्कोर के लिए उपरोक्त सूत्र, , बराबर है , साथ। चर का सहसंयोजक (या सहसंबंध) मैट्रिक्स। उत्तरार्द्ध सूत्र सीधे रैखिक प्रतिगमन सिद्धांत से आता है। पीसीए के संदर्भ में दो सूत्र समान हैं। कारक विश्लेषण में, वे कारक स्कोर की गणना नहीं करते हैं (जो कि एफए में हमेशा अनुमानित होते हैं) एक को दूसरे सूत्र पर भरोसा करना चाहिए। बी = आर - 1 ए आरB=A⋅diag(eigenvalues)−1B=R−1AR
संबंधित जवाब मेरा:
लोडिंग बनाम आइगेनवेक्टरों के बारे में अधिक विस्तृत ।
कैसे प्रमुख घटक स्कोर और कारक स्कोर की गणना की जाती है ।