क्या इस डेटासेट पर पीसीए के बराबर दो समान डेटासेट के बीच सीसीए है?


9

दो यादृच्छिक वैक्टर और लिए विहित सहसंबंध विश्लेषण (सीसीए) के बारे में विकिपीडिया को पढ़ते हुए , मैं सोच रहा था कि क्या मुख्य घटक एन्सिलिसिस (पीसीए) रूप में सीसीए के समान है ?XYX=Y


कृपया इसे और अधिक स्पष्ट करें: 1) vectors X and Yक्या यह दो चर (डेटा के स्तंभ) या दो मामले (पंक्तियाँ) हैं? यह देखते हुए कि हम चर का विश्लेषण करने जा रहे हैं। 2) X and Y are the sameक्या आप यह कहना चाहते हैं कि एक्स = वाई या किसी अन्य तरीके से गोल?
15'13

@ttnphns: 1) और दो यादृच्छिक वैक्टर हैं। वे यादृच्छिक चर के दो वैक्टर हैं, डेटा के स्तंभों के दो सेट, दो मामले (पंक्तियाँ) नहीं। 2) । XYX=Y
टिम

यदि प्रत्येक सेट में एक एकल चर होता है, तो एक विहित संबंध है, जो वास्तव में उनके बीच पियर्सन आर है; और CCA Y द्वारा X का रैखिक प्रतिगमन बन जाता है और इसके विपरीत। पीसीए के माध्यम से उस आर का अपघटन एक और कहानी है। पीसीए और सीसीए अलग-अलग विश्लेषण हैं।
ttnphns 15:15 पर

नमस्ते, @ टिम, मैं सोच रहा हूँ कि क्या मेरा उत्तर उपयोगी था या यदि आप अभी भी कुछ और प्रश्न पूछना चाहते हैं? यदि हां, तो मुझे स्पष्ट करने में खुशी होगी।
अमीबा

@amoeba: हाँ, यह है। मेरे पास अभी और प्रश्न नहीं हैं, और मैं आपके उत्तर को बाद में पढ़ूंगा। आपके उत्तर के लिए धन्यवाद। + 1
टिम

जवाबों:


6

चलो X होना n×p1 तथा Y होना n×पी2 डेटा मैट्रिक्स, दो डेटासेट का प्रतिनिधित्व करता है n नमूने (यानी अपने यादृच्छिक पंक्ति वैक्टर के अवलोकन एक्स तथा Y) उनमें से प्रत्येक में।

CCA एक रैखिक संयोजन की तलाश करता है p1 में चर X और का एक रैखिक संयोजन p2 में चर Yइस तरह कि वे एक दूसरे के बीच अधिकतम सहसंबद्ध हैं; फिर यह पहली जोड़ी के साथ शून्य सहसंबंध की कमी के तहत अगली जोड़ी की तलाश करता है; आदि।

यदि X=Y (तथा p1=p2=p), एक डेटासेट में किसी भी रैखिक संयोजन का परस्पर संबंध होगा 1किसी अन्य डेटासेट में समान रैखिक संयोजन के साथ। इसलिए सभी सीसीए जोड़े में सहसंबंध होंगे1, और जोड़े का क्रम मनमाना है। एकमात्र शेष बाधा यह है कि रैखिक संयोजनों को एक दूसरे के बीच असंबंधित किया जाना चाहिए। चुनने के लिए अनंत तरीके हैंpअसंबद्ध रेखीय संयोजन (ध्यान दें कि वज़न को ऑर्थोगोनल होने की ज़रूरत नहीं हैp-डिमेक्टिव स्पेस) और उनमें से कोई भी एक वैध CCA समाधान का उत्पादन करेगा। ऐसा ही एक तरीका वास्तव में पीसीए द्वारा दिया गया है, क्योंकि किसी भी दो पीसी में सहसंबंध शून्य है।

तो पीसीए समाधान वास्तव में एक वैध सीसीए समाधान होगा, लेकिन इस मामले में समान रूप से अच्छा सीसीए समाधान की एक अनंत संख्या है।


गणितीय रूप से, CCA सही लगता है (a) और चला गया (b) के विलक्षण वैक्टर CXX1/2CXYCYY1/2, जो इस मामले में बराबर है Iकिसी भी वेक्टर के साथ एक आइजनवेक्टर है। इसलिएa=bमनमाना हो सकता है। CCA तब रैखिक संयोजन भार प्राप्त करता हैCXX1/2a तथा CYY1/2b। इस मामले में यह एक मनमाना आधार लेने और इसे बदलने के लिए उबलता हैCXX1/2, जो वास्तव में असंबद्ध दिशाओं का उत्पादन करेगा

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.