पीसीए स्कोर की व्याख्या करना


16

पीसीए स्कोर की व्याख्या करने में कोई मेरी मदद कर सकता है? मेरा डेटा भालू की ओर दृष्टिकोण पर एक प्रश्नावली से आता है। लोडिंग के अनुसार, मैंने अपने प्रमुख घटकों में से एक को "भालू के डर" के रूप में व्याख्या किया है। क्या उस प्रिंसिपल कंपोनेंट के स्कोर संबंधित होंगे कि प्रत्येक प्रतिवादी उस प्रिंसिपल कंपोनेंट (चाहे वह उस पर सकारात्मक / नकारात्मक रूप से स्कोर करता हो) तक कैसे मापता है?


आपके प्रश्न का संक्षिप्त उत्तर हां है।
अमीबा का कहना है कि मोनिका

जवाबों:


13

मूल रूप से, कारक लोडिंग द्वारा भारित कच्चे प्रतिक्रियाओं के रूप में कारक स्कोर की गणना की जाती है। तो, आपको अपने पहले आयाम के कारक लोडिंग को देखने की जरूरत है कि कैसे प्रत्येक चर प्रमुख घटक से संबंधित है। विशिष्ट चर से जुड़े उच्च सकारात्मक (सम्मान नकारात्मक) लोड करने का मतलब है कि ये चर इस घटक के लिए सकारात्मक (सम्मान नकारात्मक) योगदान करते हैं; इसलिए, इन चर पर उच्च स्कोर करने वाले लोग इस विशेष आयाम पर उच्च (सम्मान कम) कारक स्कोर करेंगे।

सहसंबंध चक्र को खींचना उपयोगी है चर का एक सामान्य विचार है जो "सकारात्मक" बनाम "नकारात्मक" (यदि कोई हो) का योगदान पहले प्रमुख धुरी पर करता है, लेकिन यदि आप R का उपयोग कर रहे हैं तो आप FactoMineR पैकेज पर एक नज़र डाल सकते हैं dimdesc()समारोह।

यहाँ USArrestsडेटा के साथ एक उदाहरण दिया गया है:

> data(USArrests)
> library(FactoMineR)
> res <- PCA(USArrests)
> dimdesc(res, axes=1)  # show correlation of variables with 1st axis
$Dim.1
$Dim.1$quanti
         correlation  p.value
Assault        0.918 5.76e-21
Rape           0.856 2.40e-15
Murder         0.844 1.39e-14
UrbanPop       0.438 1.46e-03
> res$var$coord  # show loadings associated to each axis
         Dim.1  Dim.2  Dim.3   Dim.4
Murder   0.844 -0.416  0.204  0.2704
Assault  0.918 -0.187  0.160 -0.3096
UrbanPop 0.438  0.868  0.226  0.0558
Rape     0.856  0.166 -0.488  0.0371

जैसा कि नवीनतम परिणाम से देखा जा सकता है, पहला आयाम मुख्य रूप से हिंसक कृत्यों (किसी भी प्रकार का) को दर्शाता है। यदि हम अलग-अलग मानचित्र देखें, तो यह स्पष्ट है कि दाईं ओर स्थित राज्य वे हैं जहाँ ऐसे कार्य सबसे अधिक होते हैं।

वैकल्पिक शब्द वैकल्पिक शब्द

आपको इस संबंधित प्रश्न में भी रुचि हो सकती है: प्रमुख घटक स्कोर क्या हैं?


5

मेरे लिए, पीसीए स्कोर डेटा का सिर्फ एक रूप में पुन: व्यवस्था है जो मुझे कम चर के साथ सेट डेटा की व्याख्या करने की अनुमति देता है। स्कोर यह दर्शाता है कि प्रत्येक आइटम घटक से कितना संबंधित है। आप उन्हें कारक विश्लेषण के अनुसार नाम दे सकते हैं, लेकिन यह याद रखना महत्वपूर्ण है कि वे अव्यक्त चर नहीं हैं, क्योंकि पीसीए डेटा सेट में सभी भिन्नता का विश्लेषण करता है, न कि केवल सामान्य रूप से रखे गए तत्व (जैसा कि कारक विश्लेषण करता है)।


हां, आप यह कहने में सही हैं कि एफए के विपरीत, पीसीए में त्रुटियों का कोई मॉडल शामिल नहीं है। मैंने उस विशेष बिंदु के लिए +1 किया है। ध्यान दें कि मैंने कहा "यह विचार करने के लिए समझ में आता है", नहीं कि पीसीए से निकाले गए प्रमुख घटक सच्चे एलवी हैं। जब तक आप पैमाने की विश्वसनीयता या माप मॉडल का आकलन करने में रुचि नहीं लेते, तब तक यह बहुत कम फर्क पड़ता है कि क्या आप पीसीए या एफए का उपयोग करते हैं, हालांकि। अब, डेटा विश्लेषण अक्सर चर या विषयों के समूहों के बीच संबंध को समझाने के साथ संबंधित है, इसलिए फैक्टरियल स्पेस के एक या अधिक आयामों की व्याख्या करने का विचार है। (...)
CHL

(...) FactoMineR में वाइन के बारे में एक डेटा सेट शामिल है, और इसके साथ खेलने के लिए कई कारक विधियों का उपयोग किया जा सकता है (PCA, MFA), और यहां तक ​​कि PLS या CCA, जैसा कि मिशेल टेनहॉस द्वारा किया गया है।
chl

@ chl, पैकेज के रूप में संकेत के लिए धन्यवाद, मैं इसे देखूंगा। पीसीए बनाम एफए मैं एक बिंदु तक सहमत हूं। मैं ज्यादातर अनुप्रयोगों के लिए एफए को पसंद करता हूं, क्योंकि मैं सांप्रदायिकता (सामान्य विचरण) को निधि देता हूं जो किसी विशेष कारक संरचना के मूल्य का आकलन करने में बहुत उपयोगी है। हालाँकि, यह एक व्यक्तिगत प्राथमिकता हो सकती है।
अमीरमोइर्रिसो

आप पूरी तरह से सही हैं (मैंने पहले ही आपकी प्रतिक्रिया को रद्द कर दिया था क्योंकि यह बहुत स्पष्ट किया गया था)। यह सिर्फ (अनियंत्रित) PCA का डेटा विश्लेषण (esp। फ्रांसीसी स्कूल) में अपना इतिहास है, साथ में CA, MFA, MCA है। दूसरी ओर, पॉल क्लाइन के व्यक्तित्व अनुसंधान में एफए के उपयोग पर दो बहुत अच्छी किताबें हैं। और विलियम रेवेल की आगामी पुस्तक को आर उपयोगकर्ताओं के लिए रॉक करना चाहिए :) खैर, किसी भी मामले में, मुझे लगता है कि हम सहमत हैं कि ये सहसंबंध मैट्रिक्स की संरचना का विश्लेषण करने के लिए उपयोगी उपकरण हैं।
chl

0

पीसीए परिणाम (विभिन्न आयामों या कम्यूप्रेशर) को आम तौर पर एक वास्तविक अवधारणा में अनुवाद नहीं किया जा सकता है मुझे लगता है कि यह गलत है कि घटकों में से एक "भालू का डर" है जो आपको लगता है कि घटक क्या था? प्रमुख घटक प्रक्रिया आपके डेटा मैट्रिक्स को समान या कम मात्रा के आयामों के साथ एक नए डेटा मैट्रिक्स में बदल देती है, और परिणामी आयाम उस सीमा से होता है जो उस विचरण को बेहतर तरीके से समझाता है जो इसे कम समझाता है। इस घटक की गणना परिकलित आइगेनवेक्टरों के साथ मूल चर के संयोजन के आधार पर की जाती है। ओवरल पीसीए प्रक्रिया मूल चर को ऑर्थोगोनल वालों (रैखिक रूप से स्वतंत्र) में परिवर्तित करती है। आशा है कि यह आपको pca प्रक्रिया के बारे में थोड़ा स्पष्ट करने में मदद करेगा


क्या आप इस बात से सहमत होंगे कि कुछ चर का एक रेखीय संयोजन अभी भी व्याख्या किया जा सकता है क्योंकि उनमें से प्रत्येक के कारक धुरी में किसी प्रकार के भारित योगदान को दर्शाया गया है?
chl

हां, बिलकुल ऐसा ही है।
मरिआना

तो, इसे नाम देने से क्यों रोका जाए? चर को केवल प्रकट चर के रूप में माना जाता है, और कुछ मामलों में यह उनके भारित संयोजन पर विचार करने के लिए एक अव्यक्त (अप्रतिबंधित) कारक को दर्शाता है।
chl
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.