एक पीसीए द्विध्रुवीय में तीर का क्या मतलब है?


14

निम्नलिखित पीसीए biplot पर विचार करें:

library(mvtnorm)
set.seed(1)
x  <- rmvnorm(2000, rep(0, 6), diag(c(5, rep(1,5))))
x  <- scale(x, center=T, scale=F)
pc <- princomp(x)
biplot(pc)

यहाँ छवि विवरण दर्ज करें

वहाँ लाल तीरों का एक गुच्छा लगाया जाता है, उनका क्या मतलब है? मुझे पता था कि "वर 1" के साथ लेबल किया गया पहला तीर डेटा-सेट की सबसे अलग दिशा की ओर इशारा करता है (यदि हम उन्हें 2000 डेटा बिंदु मानते हैं, तो प्रत्येक का आकार 6 का वेक्टर होता है)। मैं भी कहीं से पढ़ता हूं, सबसे अलग दिशा 1 ईजन वेक्टर की दिशा होनी चाहिए।

हालांकि, आर। में द्विपद के कोड में पढ़ना। तीर के बारे में पंक्ति है:

if(var.axes)
    arrows(0, 0, y[,1L] * 0.8, y[,2L] * 0.8, col = col[2L], 

yवास्तव में लोडिंग मैट्रिक्स कहां है, जो कि आइजन्वेक्टर मैट्रिक्स है। तो ऐसा लगता है कि 1 तीर वास्तव में से इशारा कर रहा (0, 0)है (y[1, 1], y[1, 2])। मैं समझता हूं कि हम एक 2D विमान पर एक उच्च आयामी तीर की साजिश करने की कोशिश कर रहे हैं। इसलिए हम y[1, ]वेक्टर के पहले और दूसरे तत्व को ले रहे हैं । हालाँकि जो मुझे समझ में नहीं आता है वह है:

नहीं चाहिए 1 eigenvector दिशा के y[, 1]बजाय वेक्टर द्वारा निरूपित किया जाना चाहिए y[1, ]? (फिर से, यहाँ yeigenvector मैट्रिक्स है, जिसे PCA द्वारा या के eigendecomposition द्वारा प्राप्त किया गया है t(x) %*% x।) यानी eigenvectors कॉलम वैक्टर होना चाहिए, न कि क्षैतिज वैक्टर।

भले ही हम उन्हें 2 डी प्लेन पर प्लॉट कर रहे हैं, फिर भी हमें 1 दिशा को (0, 0)इंगित करने से आकर्षित करना चाहिए (y[1, 1], y[2, 1])?


2
साइट पर प्रश्नों के लिए उपलब्ध फ़ॉर्मेटिंग का उपयोग करने की कोशिश करने पर भी विचार करें, उन्नत मार्कडाउन मदद देखें । मुझे लगता है कि आपके किसी भी पिछले प्रश्न के उत्तर नहीं हैं, और यदि आप उन्हें थोड़ा और अधिक पठनीय बनाने के लिए संपादित करते हैं तो वे सूची के शीर्ष पर टकराएंगे और उत्तर आकर्षित कर सकते हैं।
एंडी डब्ल्यू

@Andy W उत्कृष्ट संदर्भ
conjugateprior

@Andy W: आपके उत्कृष्ट संदर्भों को पढ़ने के बाद, मुझे अभी भी लगता है कि आर कोड biplot.princomp में बग है: लोडिंग मैट्रिक्स (eigenvector मैट्रिक्स) को biplot.princomp में भेजे जाने से पहले ट्रांसपोज़ किया जाना चाहिए ... मेरे विचार ...?
लूना

ऐसा लग रहा है कि कोई बग नहीं है
CHL

@Andy W: क्या आप अपनी टिप्पणियों को "उत्तर" में रखना चाहते हैं ताकि मैं आपके उत्तर को स्वीकार कर सकूं? यह एक महान है! बहुत बहुत धन्यवाद!
लूना

जवाबों:


9

वैसे ऐसा प्रतीत होता है कि केविन राइट को भ्रम ( आर-हेल्प मेल सूची से ) को समझाने में मदद करने का अधिकांश श्रेय दिया जाना चाहिए ;

तीर डेटा की सबसे अलग दिशा में इंगित नहीं कर रहे हैं। प्रिंसिपल घटक डेटा की सबसे अलग दिशा में इंगित कर रहे हैं। लेकिन आप डेटा को मूल पैमाने पर साजिश नहीं कर रहे हैं, आप डेटा को घुमाए गए पैमाने पर साजिश कर रहे हैं, और इस प्रकार क्षैतिज अक्ष डेटा की सबसे अलग दिशा है।

तीर चर की दिशा में इंगित कर रहे हैं, जैसा कि द्विपद के 2-डी विमान में अनुमानित है।

कोई बग नहीं है।

केविन राइट

माइकल ग्रीनकेयर के पास Biplots, Biplots in Practice के बारे में एक बहुत ही बेहतरीन मुफ्त ऑनलाइन पुस्तक है , और बस पहले अध्याय को पढ़ने के लिए प्रेरित करना चाहिए कि तीर के निर्देशांक कहां से लिए गए हैं। साइट पर कई अन्य प्रश्न भी हैं जो समान हैं और आप में रुचि हो सकती है, आर में प्रमुख घटक विश्लेषण में द्विपद की व्याख्या और दो उदाहरणों के लिए एमडीएस कारक भूखंड की व्याख्या देखेंसाइट पर खोज में biplot के साथ प्रश्नों को भी देखें , क्योंकि संभावित ब्याज के कुछ और हैं (यह प्रतीत होता है कि शायद एक biplot टैग भी इस बिंदु पर उपयोगी होगा, जितने प्रश्नों की संख्या यह सामने आई है)।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.