पीसीए के मामले में, "विचरण" का अर्थ है योगात्मक विचरण या बहुभिन्नरूपी परिवर्तनशीलता या समग्र परिवर्तनशीलता या कुल परिवर्तनशीलता । नीचे कुछ 3 चर का सहसंयोजक मैट्रिक्स है। उनके संस्करण विकर्ण पर हैं, और 3 मानों (3.448) का योग समग्र परिवर्तनशीलता है।
1.343730519 -.160152268 .186470243
-.160152268 .619205620 -.126684273
.186470243 -.126684273 1.485549631
अब, पीसीए मूल चर को नए चर के साथ बदल देता है, जिसे प्रमुख घटक कहा जाता है, जो कि ऑर्थोगोनल (अर्थात उनके पास शून्य संकेतन होते हैं) और घटते क्रम में variances (eigenvalues) होते हैं। तो, उपरोक्त डेटा से निकाले गए प्रमुख घटकों के बीच सहसंयोजक मैट्रिक्स यह है:
1.651354285 .000000000 .000000000
.000000000 1.220288343 .000000000
.000000000 .000000000 .576843142
ध्यान दें कि विकर्ण योग अभी भी 3.448 है, जो कहता है कि सभी 3 घटक सभी बहुभिन्नरूपी परिवर्तनशीलता के लिए खाते हैं। 1 मुख्य घटक के लिए या "बताते हैं" 1.651 / 3.448 = 47.9% की कुल परिवर्तनशीलता; दूसरा व्यक्ति 1.220 / 3.448 = 35.4% बताता है; 3 एक बताते हैं .577 / 3.448 = 16.7%।
तो, उनका क्या मतलब है जब वे कहते हैं कि " PCA विचरण को अधिकतम करता है " या " PCA अधिकतम विचरण को स्पष्ट करता है "? बेशक, यह नहीं है कि यह तीन मूल्यों के बीच सबसे बड़ा विचरण ढूंढता है 1.343730519 .619205620 1.485549631
, नहीं। पीसीए पाता है, डेटा स्पेस में, समग्र विचरण से बाहर सबसे बड़े विचरण के साथ आयाम (दिशा) । यह सबसे बड़ा विचरण होगा । फिर यह दूसरे सबसे बड़े विचरण के आयाम को पाता है, पहले समग्र को, शेष समग्र विचरण से बाहर । यह दूसरा आयाम विचरण होगा । और इसी तरह। अंतिम शेष आयाम विचरण है। यहां भी "Pt3" और यहां देखें शानदार जवाब1.343730519+.619205620+1.485549631 = 3.448
1.651354285
3.448-1.651354285
1.220288343
.576843142
यह बताते हुए कि इसने और अधिक विस्तार से कैसे किया।
गणितीय रूप से, PCA को रेखीय बीजगणित कार्यों के माध्यम से किया जाता है जिसे eigen-decomposition या svd- अपघटन कहा जाता है। ये फ़ंक्शन आपको एक ही बार में सभी eigenvalues 1.651354285 1.220288343 .576843142
(और संबंधित eigenvectors) वापस कर देंगे ( देखें , देखें )।