मैंने दो अलग-अलग फ़ंक्शन ( prcomp
और princomp
) का उपयोग करते हुए आर के साथ मुख्य घटक विश्लेषण (पीसीए) किया और देखा कि पीसीए स्कोर साइन में भिन्न थे। यह कैसे हो सकता है?
इस पर विचार करो:
set.seed(999)
prcomp(data.frame(1:10,rnorm(10)))$x
PC1 PC2
[1,] -4.508620 -0.2567655
[2,] -3.373772 -1.1369417
[3,] -2.679669 1.0903445
[4,] -1.615837 0.7108631
[5,] -0.548879 0.3093389
[6,] 0.481756 0.1639112
[7,] 1.656178 -0.9952875
[8,] 2.560345 -0.2490548
[9,] 3.508442 0.1874520
[10,] 4.520055 0.1761397
set.seed(999)
princomp(data.frame(1:10,rnorm(10)))$scores
Comp.1 Comp.2
[1,] 4.508620 0.2567655
[2,] 3.373772 1.1369417
[3,] 2.679669 -1.0903445
[4,] 1.615837 -0.7108631
[5,] 0.548879 -0.3093389
[6,] -0.481756 -0.1639112
[7,] -1.656178 0.9952875
[8,] -2.560345 0.2490548
[9,] -3.508442 -0.1874520
[10,] -4.520055 -0.1761397
+/-
दो विश्लेषणों के लिए संकेत ( ) अलग क्यों हैं ? अगर मैं एक घटक में प्रिंसिपल घटकों PC1
और PC2
भविष्यवाणियों के रूप में उपयोग कर रहा था, तो lm(y ~ PC1 + PC2)
, यह पूरी तरह से दो चर के प्रभाव के बारे में मेरी समझ को बदल देगा, y
जो कि मैंने किस पद्धति पर उपयोग किया था! फिर मैं कैसे कह सकता हूं कि PC1
उदाहरण के लिए सकारात्मक प्रभाव पड़ता है y
और PC2
उदाहरण के लिए नकारात्मक प्रभाव पड़ता है y
?
इसके अलावा: यदि पीसीए घटकों का संकेत अर्थहीन है, तो क्या यह कारक विश्लेषण (एफए) के लिए भी सही है? क्या यह अलग-अलग पीसीए / एफए घटक स्कोर (या लोडिंग मैट्रिक्स के एक स्तंभ के रूप में) के संकेत को फ्लिप (रिवर्स) करने के लिए स्वीकार्य है?