मुझे पीसीए के साथ शुरू करते हैं। मान लीजिए कि आपके पास n डेटा बिंदु हैं, जिसमें प्रत्येक संख्या d संख्या (या आयाम) शामिल है। यदि आप इस डेटा को केंद्र में रखते हैं ( प्रत्येक डेटा वेक्टर से माध्य डेटा बिंदु को घटाएं ) तो आप मैट्रिक्स बनाने के लिए डेटा को स्टैक कर सकते हैंμxi
X=⎛⎝⎜⎜⎜⎜⎜⎜xT1−μTxT2−μT⋮xTn−μT⎞⎠⎟⎟⎟⎟⎟⎟.
सहसंयोजक मैट्रिक्स
S=1n−1∑i=1n(xi−μ)(xi−μ)T=1n−1XTX
अलग-अलग निर्देशांक जिसमें आपके डेटा को दिया जाता है, को अलग-अलग करने के उपाय। तो, यह शायद आश्चर्य की बात नहीं है कि पीसीए - जो आपके डेटा की भिन्नता को पकड़ने के लिए डिज़ाइन किया गया है - कोविरियन मैट्रिक्स के संदर्भ में दिया जा सकता है। विशेष रूप से, का स्वदेशी अपघटन होता हैS
S=VΛVT=∑i=1rλivivTi,
जहां है मई के प्रधानाचार्य घटक , या पीसी, और है वें के eigenvalue और भी साथ डेटा की विचरण के बराबर है मई के पीसी। यह अपघटन रैखिक बीजगणित में एक सामान्य प्रमेय से आता है, और पीसीए से रिलेटिनो को प्रेरित करने के लिए कुछ काम करना पड़ता है।viiλiiSi
SVD अपने कॉलम-स्पेस और रो-स्पेस के संदर्भ में मैट्रिक्स को समझने का एक सामान्य तरीका है। (यह पंक्ति और स्तंभ स्थान के सहज संबंध के साथ अन्य मैट्रिक्स के संदर्भ में किसी भी मैट्रिक्स को फिर से लिखने का एक तरीका है। उदाहरण के लिए, मैट्रिक्स के लिए हम दिशानिर्देश पा सकते हैं और डोमेन और रेंज ताकि मेंA=(1021)uivi
आप पर विचार कैसे द्वारा इन पा सकते हैं एक रेखीय परिवर्तन के रूप में एक इकाई क्षेत्र morphs अंडाकार के प्रमुख अर्द्ध कुल्हाड़ियों से तालमेल: एक अंडाकार करने के लिए अपने डोमेन में और उनके preimages हैं।ASuivi
किसी भी मामले में, ऊपर डेटा मैट्रिक्स (वास्तव में, बस सेट करें ), एसवीडी हमें लिखने देता हैXA=X
X=∑i=1rσiuivTj,
जहां और की eigenvalue अपघटन के साथ vectors.A तुलना की orthonormal सेट हैं पता चलता है कि "सही विलक्षण वैक्टर" पीसी के बराबर हैं, "सही विलक्षण वैक्टर" कर रहे हैं{ v i } S v i{ui}{vi}Svi
ui=1(n−1)λi−−−−−−−−√Xvi,
और "एकवचन मान" माध्यम से डेटा मैट्रिक्स से संबंधित हैंσi
σ2i=(n−1)λi.
यह एक सामान्य तथ्य है कि सही वैक्टर के कॉलम स्पेस को । इस विशिष्ट मामले में, हमें -th प्रिंसिपल कंपोनेंट की दिशा में डेटा का स्केल्ड प्रोजेक्शन देता है । बाईं ओर का एकवचन वैक्टर सामान्य रूप से की पंक्ति स्थान पर होता है, जो हमें ऑर्थोनॉमिक वैक्टर का एक सेट देता है जो डेटा को पीसी की तरह फैलाता है। एक्स यू मैं एक्स मैं v मैं एक्सuiXuiXiviX
मैं इस लंबे लेख में पीसीए और एसवीडी के बीच संबंधों के कुछ और विवरणों और लाभों पर जाता हूं ।