पीसीए या फैक्टर विश्लेषण के एक लोडिंग प्लॉट की व्याख्या।
लोड हो रहा है प्लॉट मुख्य घटकों (या कारकों) के स्थान में चर के रूप में दिखाता है। चर के निर्देशांक, आमतौर पर, लोडिंग हैं। (यदि आप ठीक से एक ही घटक स्थान में डेटा मामलों के संबंधित स्कैल्प्लॉट के साथ लोडिंग प्लॉट को जोड़ते हैं, तो वह बाइप्लॉट होगा।)
हमें 3 किसी भी तरह से सहसंबंधित चर, वी , डब्ल्यू , यू । हम उन्हें केंद्र में रखते हैं और पीसीए करते हैं , तीन में से 2 पहले प्रमुख घटकों को निकालते हैं: एफ 1 और एफ 2 । हम लोडिंग प्लॉट को नीचे करने के लिए निर्देशांक के रूप में लोडिंग का उपयोग करते हैं। लोडिंग अनजाइन्ड इजेनेवेटर्स एलीमेंट्स होते हैं, अर्थात संबंधित कंपोनेंट्स वेरिएंस, या ईजेनवेल्यूज से संपन्न आइजनवेक्टर।VWUF1F2
प्लॉट लोड हो रहा है चित्र पर विमान है। आइए केवल चर V पर विचार करें । तीर एक लोडिंग प्लाट पर आदतन खींचा जाता है जिसे यहाँ h ′ लेबल किया जाता है; निर्देशांक एक 1 , एक 2 की लोडिंग कर रहे हैं वी के साथ एफ 1 और एफ 2 में क्रमश: (कृपया पता है कि terminologically कहते हैं "घटक लोड एक चर", इसका उल्टा नहीं अधिक सही है)।Vh′a1a2VF1F2
तीर ज ' प्रक्षेपण है, घटक विमान पर, वेक्टर के ज जो सच चर की स्थिति है वी चर में' द्वारा फैला अंतरिक्ष वी , डब्ल्यू , यू । वेक्टर की चौकोर लंबाई, h 2 , V का विचरण है । जबकि ज ' 2 है कि विचरण के भाग समझाया दो घटकों द्वारा।h′hVVWUh2aVh′2
लोड हो रहा है, सहसंबंध, अनुमानित सहसंबंध । के बाद से चर, घटकों के पूर्व निकासी केंद्रित थे क्योंकि φ है पियर्सन सहसंबंध के बीच वी और घटक एफ 1 । लोडिंग प्लॉट पर कॉस α के साथ भ्रमित नहीं होना चाहिए , जो कि एक और मात्रा है: यह घटक एफ 1 और चर के बीच पियरसन सहसंबंध है जिसे एच ′ के रूप में यहां जोड़ा गया है । एक चर के रूप में, ज ' की भविष्यवाणी है वी रेखीय प्रतीपगमन में (मानकीकृत) घटकों द्वारा (रेखीय प्रतीपगमन ज्यामिति के ड्राइंग के साथ तुलना करें यहाँcosϕVF1cosαF1h′h′V) जहां लोडिंग एक प्रतिगमन गुणांक है (जब घटकों को ऑर्थोगोनल रखा जाता है, जैसा कि निकाला जाता है)।a
आगे की। हमें याद कर सकते हैं (त्रिकोणमिति) है कि एक 1 = ज ⋅ क्योंकि φ । यह रूप में समझा जा सकता है अदिश उत्पाद वेक्टर के बीच वी और यूनिट-लंबाई वेक्टर एफ 1 : ज ⋅ 1 ⋅ क्योंकि φ । एफ 1 कि यूनिट-विचरण वेक्टर सेट किया गया है, क्योंकि इसका कोई अपनी है खुद की है कि विचरण से अलग विचरण वी जो यह बताते हैं (राशि से ज ' ): यानी एफ 1a1=h⋅cosϕVF1h⋅1⋅cosϕF1Vh′F1एक एक्सट्रैक्टेड-वी, डब्ल्यू, यू और न कि एक आमंत्रित-से-बाहर की इकाई है। फिर, स्पष्ट रूप से, एक 1 = √वी एक आर वी ⋅ वी एक आर एफ 1 ⋅आर=ज⋅1⋅क्योंकिφहैसहप्रसरणके बीचवीऔरमानकीकृत, इकाई बढ़ायाखसेट करने के लिए (रों1= √a1=varV⋅varF1−−−−−−−−−−√⋅r=h⋅1⋅cosϕVbv a r F 1 =1) घटकF1। यह सहसंयोजक सीधे इनपुट चर के बीच सहसंयोजकों के साथ तुलनीय है; उदाहरण के लिए,वीऔरडब्ल्यू केबीच सहसंयोजकउनके बीच की कोज्या से गुणा उनकी वेक्टर लंबाई का उत्पाद होगा।s1=varF1−−−−−√=1F1VW
सारांश में: लोड हो रहा है एक 1 मानकीकृत घटक और देखे गए चर, के बीच सहप्रसरण के रूप में देखा जा सकता है ज ⋅ 1 ⋅ क्योंकि φ , या समतुल्य रूप मानकीकृत घटक और समझाया (सभी घटकों साजिश को परिभाषित करते हुए) के बीच की छवि चर, ज ' ⋅ 1 ⋅ क्योंकि α । यही कारण है कि क्योंकि α कहा जा सकता है वि एफ 1 सहसंबंध अनुमान एफ 1-F2 घटक उपस्पेस पर।a1h⋅1⋅cosϕh′⋅1⋅cosαcosα
एक चर और एक घटक, के बीच उक्त सहसंबंध क्योंकि φ = एक 1 / घंटा , यह भी मानकीकृत या कहा जाता है पुनः पैमाना लोड हो रहा है । यह घटकों की व्याख्या में सुविधाजनक है क्योंकि यह सीमा [-1,1] में है।cosϕ=a1/h
आइजनवेक्टरों से संबंध । पुनः पैमाना लोड हो रहा है क्योंकि φ चाहिए नहीं के साथ भ्रमित होने आइजन्वेक्टर तत्व है जो - जैसा कि हम जानते - एक चर और एक प्रमुख घटक के बीच के कोण की कोज्या है। स्मरण करो कि लोडिंग eigenvector तत्व घटक के एकवचन मूल्य (eigenvalue के वर्गमूल) द्वारा बढ़ाया जाता है। चर के लिए यानी वी हमारे साजिश की: एक 1 = ई 1 रों 1 , जहां एस 1 सेंट है। विचलन (नहीं 1 की लेकिन मूल अर्थात विलक्षण मूल्य) एफ 1cosϕVa1=e1s1s11F1अव्यक्त चर। तो यह है कि आइजन्वेक्टर तत्व आता है ई 1 = एक 1s 1 =एचरों 1 क्योंकिφ, नहींक्योंकिφही। दो शब्दों "कोज्या" घुल आसपास भ्रम जब हम याद करते हैं क्या अंतरिक्ष प्रतिनिधित्व की तरह हम में हैं। आइजन्वेक्टर मूल्यहैकोज्यारोटेशन के कोण केजनसंपर्क में धुरी के रूप में एक चर के। चर के रूप में अक्ष के रूप में घटक (उर्फ स्कैल्प्लॉट दृश्य),जैसे कि यहां। जबकिक्योंकिφहमारे लोड हो रहा है भूखंड परकोज्या समानता उपाय हैवेक्टर और एक जनसंपर्क के रूप में एक चर के बीच। घटक के रूप में ... अच्छी तरह से .. वेक्टर के रूप में भी, यदि आपको पसंद है (यद्यपि यह भूखंड पर अक्ष के रूप में तैयार किया गया है), - वर्तमान में हमविषय स्थान पर हैंe1=a1s1=hs1cosϕcosϕcosϕ (जो लोडिंग प्लॉट है) जहां सहसंबद्ध चर वैक्टर के प्रशंसक हैं - ऑर्थोगोनल एक्सिस नहीं हैं, - और वेक्टर कोण एसोसिएशन के माप हैं - और स्पेस बेस रोटेशन के नहीं।
जबकि लोडिंग एक वैरिएबल और यूनिट-स्केल वाले कंपोनेंट के बीच कोणीय (यानी स्केलर उत्पाद प्रकार) एसोसिएशन माप है, और रीकॉल्ड लोडिंग मानकीकृत लोडिंग है जहां वेरिएबल का स्केल या तो यूनिट तक कम हो जाता है, लेकिन आइजनवेक्टर गुणांक लोड हो रहा है जहां घटक "ओवरस्टैंडाइज़्ड" है, अर्थात 1 / s (1 के बजाय) पैमाने पर लाया गया था ; वैकल्पिक रूप से, इसे एक रीकल्ड लोडिंग के रूप में माना जा सकता है जहां चर का पैमाना h / s (1 के बजाय) लाया गया था ।1/sh/s
तो, एक चर और एक घटक के बीच क्या संबंध हैं ? आप जो चाहें उसे चुन सकते हैं। यह लोड हो सकता है (इकाई स्केल वाले घटक के साथ सहसंयोजक) ए ; पुनः पैमाना लोड हो रहा है क्योंकि φ (= चर-घटक सहसंबंध); के बीच संबंध छवि (भविष्यवाणी) और घटक (= सहसंबंध अनुमान क्योंकि α )। तुम भी चुन सकते हैं आइजन्वेक्टर गुणांक ई = एक / s अगर आप की जरूरत है (हालांकि मुझे आश्चर्य है कि क्या एक कारण हो सकता है)। या अपने खुद के उपाय का आविष्कार करें।a cosϕcosαe=a/s
Eigenvector मान चुकता एक चर में एक पीआर के योगदान का अर्थ है। घटक। पुनर्गठित लोडिंग वर्ग में एक पीआर के योगदान का अर्थ है। एक चर में घटक।
सहसंबंधों के आधार पर पीसीए से संबंध। यदि हम PCA-विश्लेषित न केवल केन्द्रित बल्कि मानकीकृत (तब यूनिट-वैरिएबल स्केल्ड) वेरिएबल्स को केन्द्रित करते हैं, तो तीन वैरिएबल वैक्टर (प्लेन पर उनके अनुमान नहीं) एक ही, यूनिट की लंबाई के होंगे। फिर यह स्वचालित रूप से इस प्रकार है कि एक लोडिंग सहसंबंध है , एक चर और घटक के बीच सहसंयोजक नहीं। लेकिन उस सहसंबंध नहीं होगा "मानकीकृत लोड हो रहा है" के बराबर क्योंकि φ की , ऊपर चित्र (सिर्फ केंद्रित चर के विश्लेषण के आधार पर), क्योंकि मानकीकृत चर के पीसीए (सह-संबंध के आधार पर पीसीए) पैदावार विभिन्न केंद्रित चर के पीसीए (से घटकों covariances- आधारित पीसीए)। सहसंबंध आधारित पीसीए में एक 1cosϕ = क्योंकि φ क्योंकि ज = 1 , लेकिन प्रिंसिपल घटक हैंउन्हीं नहींप्रिंसिपल घटक के रूप में हम से सहप्रसरण आधारित पीसीए मिल (पढ़ें,पढ़)।a1=cosϕh=1
में कारक विश्लेषण , लोड हो रहा है साजिश मूलतः एक ही अवधारणा और पीसीए के रूप में व्याख्या की है। केवल (लेकिन महत्वपूर्ण ) अंतर का पदार्थ है ज ' । कारक विश्लेषण में, ज ' - तो चर के "communality" कहा जाता है - अपने विचरण वाले हिस्से की द्वारा समझाया गया है है आम कारण जो विशेष रूप से के लिए जिम्मेदार हैं सहसंबंध चर के बीच में। पीसीए में रहते हुए समझाया भाग ज 'h′h′ h′स्थूल "मिश्रण" है - यह आंशिक रूप से सहसंबंध का प्रतिनिधित्व करता है और आंशिक रूप से चरों के बीच असंबंधित है। कारक विश्लेषण के साथ, हमारी तस्वीर पर लोडिंग का विमान अलग-अलग रूप से उन्मुख होगा (वास्तव में, यह हमारे 3 डी चर के स्थान को 4 वें आयाम में भी विस्तारित करेगा, जिसे हम आकर्षित नहीं कर सकते हैं; लोडिंग विमान हमारा एक उप-समूह नहीं होगा; 3 डी अंतरिक्ष से फैला वी और अन्य दो चर), और प्रक्षेपण ज ' एक और लंबाई की और एक अन्य कोण के साथ हो जाएगा α । (पीसीए और कारक विश्लेषण के बीच सैद्धांतिक अंतर को ज्यामितीय रूप से यहां विषय स्थान प्रतिनिधित्व के माध्यम से और यहां चर अंतरिक्ष प्रतिनिधित्व के माध्यम से समझाया गया है ।)Vh′α
a , b टिप्पणियों में @Antoni Parellada के अनुरोध का उत्तर। यह आप के मामले में बात करने के लिए पसंद करते हैं बराबर हैविचरणया के मामले मेंबिखराव(विचलन के एस एस): विचरण = बिखराव / (n-1), जहांnनमूने का आकार है। क्योंकि हम एक हीएन केसाथ एक डेटासेट के साथ काम कर रहे हैं, निरंतर सूत्रों में कुछ भी नहीं बदलता है। यदिएक्सडेटा है (चर वी के साथ, डब्ल्यू, यू केंद्रित), तो इसकी (ए) के eigendecomposition सहप्रसरण मैट्रिक्स (बी) बिखराव मैट्रिक्स के eigendecomposition रूप में एक ही eigenvalues (घटक प्रसरण) और eigenvectors पैदावार एक्स ' एक्सa,b/(n−1)nnXX′Xकी प्रारंभिक विभाजन के बाद प्राप्त एक्स द्वारा √Xएन - 1 कारक। उसके बाद, एक लोडिंग के सूत्र में (उत्तर के बीच अनुभाग देखें),एक1=ज⋅रों1⋅क्योंकिφ, अवधिजहैसेंट। विचलन √n−1−−−−−√a1=h⋅s1⋅cosϕh वी एक आर वी (ए) लेकिन जड़ बिखराव (यानी आदर्श) में‖वी‖(बी) में। टर्मरों1है, जो बराबर होती है1,हैमानकीकृतएफ1घटक के सेंट। विचलन √varV−−−−√∥V∥s11F1वी एक आर एफ 1 में (ए) लेकिन जड़ बिखराव‖एफ1‖में (बी)। अंत में,क्योंकिφ=आरसहसंबंध जो हैअसंवेदनशील हैके उपयोग करने के लिएn-1अपनी गणना में। इस प्रकार, हम केवलवैरिएशन (ए) या स्कैटर (बी) के वैचारिक रूप सेबोलते हैं, जबकि मूल्य स्वयं दोनों उदाहरणों में सूत्र में समान रहते हैं।varF1−−−−−√∥F1∥cosϕ=rn−1