मैं मूल घटक विश्लेषण के आउटपुट को समझने की कोशिश कर रहा हूं जो निम्न प्रकार से किया गया है:
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
> res = prcomp(iris[1:4], scale=T)
> res
Standard deviations:
[1] 1.7083611 0.9560494 0.3830886 0.1439265
Rotation:
PC1 PC2 PC3 PC4
Sepal.Length 0.5210659 -0.37741762 0.7195664 0.2612863
Sepal.Width -0.2693474 -0.92329566 -0.2443818 -0.1235096
Petal.Length 0.5804131 -0.02449161 -0.1421264 -0.8014492
Petal.Width 0.5648565 -0.06694199 -0.6342727 0.5235971
>
> summary(res)
Importance of components:
PC1 PC2 PC3 PC4
Standard deviation 1.7084 0.9560 0.38309 0.14393
Proportion of Variance 0.7296 0.2285 0.03669 0.00518
Cumulative Proportion 0.7296 0.9581 0.99482 1.00000
>
मैं उपरोक्त आउटपुट से निम्नलिखित निष्कर्ष निकालता हूं:
विचरण का अनुपात बताता है कि किसी विशेष प्रमुख घटक के विचरण में कुल विचरण का कितना हिस्सा है। इसलिए, PC1 परिवर्तनशीलता डेटा के कुल विचरण का 73% बताती है।
दिखाए गए रोटेशन मान कुछ विवरणों में उल्लिखित 'लोडिंग' के समान हैं।
PC1 के घूर्णन को ध्यान में रखते हुए, कोई भी निष्कर्ष निकाल सकता है कि Sepal.Length, Petal.Length और Petal.Width सीधे संबंधित हैं, और वे सभी Sepal.Width से विपरीत हैं (जिसका PC1 के रोटेशन में नकारात्मक मान है)
पौधों में एक कारक हो सकता है (कुछ रासायनिक / भौतिक कार्यात्मक प्रणाली आदि) जो इन सभी चर (सेपल.लिवेट, पेटल.लिविएंट और पेटल। एक दिशा में और सेपल.विपरीत दिशा में) को प्रभावित कर रहे हैं।
यदि मैं सभी ग्राफ को एक ग्राफ में दिखाना चाहता हूं, तो मैं उस मुख्य घटक के विचरण के अनुपात से प्रत्येक घुमाव को गुणा करके उनके सापेक्ष योगदान को दिखा सकता हूं। उदाहरण के लिए, PC1 के लिए, 0.52, -0.26, 0.58 और 0.56 के घुमाव सभी को 0.73 से गुणा किया जाता है (PC1 के लिए आनुपातिक विचलन, सारांश (Res) आउटपुट में दिखाया गया है।
क्या मैं उपर्युक्त निष्कर्षों के बारे में सही हूं?
प्रश्न 5 के बारे में संपादित करें: मैं एक साधारण बारचार्ट में सभी रोटेशन को निम्नानुसार दिखाना चाहता हूं:
चूंकि PC2, PC3 और PC4 का उत्तरोत्तर भिन्नता में कम योगदान है, क्या इससे वहां के चरों के लोडिंग को समायोजित (कम) करने का कोई मतलब होगा?