एफए, पीसीए, और आईसीए, सभी 'संबंधित' हैं, उनमें से तीनों में आधार वैक्टर हैं जो डेटा के खिलाफ अनुमानित हैं, जैसे कि आप यहां सम्मिलित मानदंड-अधिकतम करते हैं। बेस वैक्टरों के बारे में सोचें जैसे कि रैखिक संयोजन को समाप्त करना।
उदाहरण के लिए, आपके डेटा मैट्रिक्स को कहने की अनुमति देता है एक x मैट्रिक्स था, , आपके पास दो यादृच्छिक चर हैं, और उनमें से प्रत्येक का अवलोकन। फिर आपको यह बताने देता है कि आपने एक आधार वेक्टर पाया है । जब आप (पहला) संकेत निकालते हैं, (इसे वेक्टर ), तो यह ऐसा किया जाता है: 2 एन एन डब्ल्यू = [ 0.1 - 4 ] वाईZ2NNw=[0.1−4]y
y=wTZ
इसका मतलब है "अपने डेटा की पहली पंक्ति से 0.1 गुणा करें, और अपने डेटा की दूसरी पंक्ति को 4 गुना घटाएं"। फिर यह देता है , जो निश्चित रूप से x वेक्टर है, जिसमें वह संपत्ति है जिसे आपने अपने सम्मिलित-मापदंड-यहाँ अधिकतम किया है। 1 नy1N
तो वे मापदंड क्या हैं?
दूसरा-आदेश मानदंड:
पीसीए में, आपको आधार वैक्टर मिल रहे हैं जो आपके डेटा के विचरण को 'सबसे अच्छी तरह से समझाते हैं'। पहला (यानी उच्चतम रैंक वाला) वेक्टर एक होने जा रहा है जो आपके डेटा से सभी प्रकारों को सबसे अच्छी तरह फिट करता है। दूसरे वाले के पास भी यह मानदंड है, लेकिन पहले के लिए ऑर्थोगोनल होना चाहिए, और इसी तरह और आगे। (पीसीए के लिए उन आधार वैक्टर को चालू करता है, आपके डेटा के सहसंयोजक मैट्रिक्स के आइजनवेक्टर के अलावा और कुछ नहीं है)।
एफए में, इसके और पीसीए के बीच अंतर है, क्योंकि एफए जेनरेटिव है, जबकि पीसीए नहीं है। मैंने एफए को 'पीसीए के साथ शोर' के रूप में वर्णित किया है, जहां 'शोर' को 'विशिष्ट कारक' कहा जाता है। सभी समान, समग्र निष्कर्ष यह है कि पीसीए और एफए दूसरे क्रम के आँकड़ों, (सहसंयोजक) पर आधारित हैं, और ऊपर कुछ भी नहीं।
उच्चतर आदेश मानदंड:
आईसीए में, आप फिर से आधार वैक्टर ढूंढ रहे हैं, लेकिन इस बार, आप आधार वैक्टर चाहते हैं जो एक परिणाम दे, जैसे कि यह परिणामी वेक्टर मूल डेटा के स्वतंत्र घटकों में से एक है। आप सामान्यीकृत कुर्तोसिस के निरपेक्ष मूल्य को अधिकतम करके कर सकते हैं - एक 4 के क्रम सांख्यिकीय। यही है, आप अपने डेटा को कुछ आधार वेक्टर पर प्रोजेक्ट करते हैं, और परिणाम के कर्टोसिस को मापते हैं। आप अपने आधार वेक्टर को थोड़ा बदल देते हैं, (आमतौर पर ग्रेडिएंट एसेंट के माध्यम से), और फिर कर्टोसिस को फिर से मापते हैं, आदि आदि। आखिरकार आप एक आधार वेक्टर के लिए होंगे जो आपको एक परिणाम देता है जिसमें उच्चतम संभव कर्टोसिस होता है, और यह आपका स्वतंत्र है घटक।
ऊपर दिए गए शीर्ष आरेख आपको इसकी कल्पना करने में मदद कर सकते हैं। आप स्पष्ट रूप से देख सकते हैं कि आईसीए वैक्टर डेटा की कुल्हाड़ियों से कैसे मेल खाते हैं, (एक-दूसरे से स्वतंत्र), जबकि पीसीए वैक्टर उन दिशाओं को खोजने की कोशिश करते हैं जहां विचरण अधिकतम होता है। (कुछ हद तक परिणामी)।
यदि शीर्ष आरेख में पीसीए वैक्टर दिखते हैं, तो वे लगभग आईसीए वैक्टर के अनुरूप हैं, जो कि केवल संयोग है। यहां विभिन्न डेटा और मिक्सिंग मैट्रिक्स पर एक और उदाहरण है जहां वे बहुत अलग हैं। ;-)