कई आयामों में विचरण द्वारा समझा जाता है ("कुल विचरण") बस प्रत्येक आयाम में भिन्नता का एक योग है। गणितीय रूप से, यह सहसंयोजक मैट्रिक्स का एक निशान है: ट्रेस केवल सभी विकर्ण तत्वों का एक योग है। इस परिभाषा में कई अच्छे गुण हैं, जैसे ट्रेस ऑर्थोगोनल रैखिक परिवर्तनों के तहत अपरिवर्तनीय है, जिसका अर्थ है कि यदि आप अपने समन्वय अक्षों को घुमाते हैं, तो कुल विचरण समान रहता है।
बिशप की पुस्तक (खंड 12.1.1) में जो साबित किया गया है, वह यह है कि सहसंयोजक मैट्रिक्स का प्रमुख आइजनवेक्टर अधिकतम विचरण की दिशा देता है। दूसरा eigenvector एक अतिरिक्त बाधा के तहत अधिकतम विचरण की दिशा देता है कि यह पहले eigenvector के लिए ऑर्थोगोनल होना चाहिए, आदि (मेरा मानना है कि यह व्यायाम 12.1 का गठन करता है)। यदि लक्ष्य 2 डी उप-क्षेत्र में कुल विचरण को अधिकतम करना है, तो यह प्रक्रिया एक लालची अधिकतमकरण है: पहले एक अक्ष चुनें जो विचरण को अधिकतम करता है, फिर एक और।
आपका सवाल है: यह लालची प्रक्रिया वैश्विक अधिकतम क्यों प्राप्त करती है?
यहाँ एक अच्छा तर्क है कि @whuber ने टिप्पणियों में सुझाव दिया है। आइए हम पहले पीसीए अक्षों के साथ समन्वय प्रणाली को संरेखित करें। सहसंयोजक मैट्रिक्स विकर्ण हो जाता है: । सादगी के लिए हम उसी 2 डी मामले पर विचार करेंगे, यानी अधिकतम कुल विचरण वाला विमान क्या है? हम यह साबित करना चाहते हैं कि यह पहले दो आधार वैक्टर (कुल विचरण ) द्वारा दिया गया विमान है ।A = d i a g (λमैं)λ1+λ2
दो ऑर्थोगोनल वैक्टर और द्वारा फैलाए गए विमान पर विचार करें । इस विमान में कुल विचलनतो यह गुणांक वाले eigenvalues का एक रैखिक संयोजन है जो सभी सकारात्मक हैं, से अधिक नहीं (नीचे देखें), और योग । यदि ऐसा है, तो यह लगभग स्पष्ट है कि अधिकतम पर पहुंच गया है ।यूv
यू⊤Σ u +v⊤∑ वी = ∑λमैंयू2मैं+ ∑λमैंv2मैं= ∑λमैं(यू2मैं+v2मैं) का है ।
λमैं12λ1+λ2
यह केवल यह दिखाना बाकी है कि गुणांक से अधिक नहीं हो सकता है । ध्यान दें कि , जहाँ है वें आधार वेक्टर। यह मात्रा और द्वारा विमान पर प्रक्षेपण की एक वर्ग लंबाई है । इसलिए इसे की चौकोर लंबाई से छोटा होना पड़ता है जो कि , QED के बराबर है ।1यू2क+v2क= ( यू ⋅ कश्मीर)2+ ( V ⋅ कश्मीर)2कककयूvक|क|2= 1
पीसीए का उद्देश्य क्या है @ कार्डिनल का उत्तर भी देखें (यह उसी तर्क का अनुसरण करता है)।