कैसे कल्पना करें कि कैनोनिकल सहसंबंध विश्लेषण क्या करता है (प्रिंसिपल घटक विश्लेषण की तुलना में) क्या करता है?


70

कैन्यिकल कॉर्लेशन विश्लेषण (CCA) एक घटक है जो प्रमुख घटक विश्लेषण (PCA) से संबंधित है। जबकि पीसीए या रैखिक प्रतिगमन को स्कैटर प्लॉट का उपयोग करना सिखाना आसान है (Google छवि खोज पर कुछ हज़ार उदाहरण देखें), मैंने सीसीए के लिए समान सहज दो-आयामी उदाहरण नहीं देखा है। कैसे स्पष्ट रूप से समझाने के लिए कि रैखिक CCA क्या करता है?


1
किस तरह से CCA PCA को सामान्य करता है? मैं यह नहीं कहूंगा कि यह इसका सामान्यीकरण है। पीसीए चर के एक सेट के साथ काम करता है, सीसीए दो (या अधिक, आधुनिक कार्यान्वयन) के साथ काम करता है, और यह एक बड़ा अंतर है।
ttnphns

2
खैर, सख्ती से संबंधित संबंधित शब्द का एक बेहतर विकल्प हो सकता है। वैसे भी, पीसीए एक सहसंयोजक मैट्रिक्स पर काम करता है, और एक क्रॉस-सहसंयोजक मैट्रिक्स पर सीसीए। यदि आपके पास सिर्फ एक डेटासेट है, तो इसके खिलाफ अपने क्रॉस-कोवरिएंस की गणना करना सरल केस (पीसीए) पर वापस आ जाता है।
फिगर

4
ठीक है, हाँ, "संबंधित" बेहतर है। CCA अंतर-कोविरियन और क्रॉस-कोवरियन दोनों के लिए खाता लेता है।
tnnphns

1
कुछ ने हेलियोग्राफ का उपयोग करते हुए विहित सहसंबंधों की कल्पना करने का सुझाव दिया है। आप कागज ti.arc.nasa.gov/m/profile/adegani/Composite_Heliographs.pdf

जवाबों:


97

खैर, मुझे लगता है कि Canonical सहसंबंध विश्लेषण (CCA) के विज़-इन- प्रिंसिपल घटक विश्लेषण (PCA) या रैखिक प्रतिगमन का एक दृश्य विवरण प्रस्तुत करना वास्तव में मुश्किल है । बाद के दो को अक्सर 2 डी या 3 डी डेटा स्कैप्लेट्स के माध्यम से समझाया और तुलना किया जाता है, लेकिन मुझे संदेह है कि अगर यह सीसीए के साथ संभव है। नीचे मैंने ऐसी तस्वीरें खींची हैं जो तीन प्रक्रियाओं में सार और अंतर को समझा सकती हैं, लेकिन इन चित्रों के साथ भी - जो "विषय स्थान" में वेक्टर प्रतिनिधित्व हैं - सीसीए को पर्याप्त रूप से कैप्चर करने में समस्याएं हैं। (विहित सहसंबंध विश्लेषण के बीजगणित / एल्गोरिथ्म के लिए यहां देखें )

व्यक्तियों को एक ऐसे स्थान के बिंदुओं के रूप में खींचना जहां अक्ष चर होते हैं, एक सामान्य स्कैप्लेट, एक चर स्थान होता है । यदि आप विपरीत तरीके - बिंदुओं और व्यक्तियों को कुल्हाड़ियों के रूप में खींचते हैं - जो एक विषय स्थान होगा । कई अक्षों को आकर्षित करना वास्तव में अनावश्यक है क्योंकि अंतरिक्ष में गैर-बेमानी आयामों की संख्या गैर-कोलीनियर चर की संख्या के बराबर है। परिवर्तनीय बिंदु मूल स्थान के साथ मूल और फार्म वैक्टर, तीर के साथ जुड़े हुए हैं; तो यहाँ हम हैं ( यह भी देखें )। एक विषय स्थान में, यदि चर को केन्द्रित किया गया है, तो उनके वैक्टर के बीच कोण का कोसाइन उनके बीच पियर्सन सहसंबंध है, और वैक्टर की लंबाई चुकता उनके संस्करण हैं। प्रदर्शित किए गए चरों के नीचे चित्र केंद्रित होते हैं (स्थिर आवेश की कोई आवश्यकता नहीं)।

मूल घटक

यहाँ छवि विवरण दर्ज करें

X1X2P1P2P1P2P1abbb12/(|P1||X2|)a

बहु - प्रतिगमन

यहाँ छवि विवरण दर्ज करें

YX1X2YYYXeYYYbbb2/|X2|

कैनन संबंधी सहसंबंध

पीसीए में, चर का एक सेट खुद का अनुमान लगाता है: वे प्रमुख घटक मॉडल करते हैं जो बदले में चर वापस मॉडल करते हैं, आप भविष्यवक्ताओं के स्थान को नहीं छोड़ते हैं और (यदि आप सभी घटकों का उपयोग करते हैं) तो भविष्यवाणी त्रुटि रहित है। एकाधिक प्रतिगमन में, चर का एक सेट एक बाहरी चर की भविष्यवाणी करता है और इसलिए कुछ भविष्यवाणी त्रुटि है। सीसीए में, स्थिति प्रतिगमन में समान है, लेकिन (1) बाहरी चर कई हैं, अपने स्वयं के सेट का निर्माण करते हैं; (2) दो सेट एक-दूसरे की भविष्यवाणी करते हैं (इसलिए प्रतिगमन के बजाय सहसंबंध); (३) वे एक दूसरे में जो भविष्यवाणी करते हैं वह एक अर्क है, एक अव्यक्त चर, एक प्रतिगमन के प्रेक्षित पूर्वानुमान से ( देखें भी )।

यहाँ छवि विवरण दर्ज करें

Y1Y2XYVxVyYYYVxVyVyVxϕXYX1 X2Y1 Y2Vx(2)VxVy(2)Vy

CCA और PCA + रिग्रेशन के बीच के अंतर के लिए भी करना CCA बनाम पीसीए के साथ एक आश्रित चर बनाना और फिर रिग्रेशन करना देखें


3
+1 (दिनों से पहले)। मैं वास्तव में आशा करता हूं कि आप इसके लिए w / 6 से अधिक upvotes को समाप्त करेंगे; यह वास्तव में एक महान अवलोकन है कि सीसीए कैसे काम करता है।
गुंग

2
यह मुझे CCA को समझने में बहुत मदद करता है।
झेंगलेई

@ ग्लेन_ब, मुझे बहुत अचंभे में डाल दिया गया, जिससे आप बहुत खुश हुए कि आपने इस जवाब को देने का फैसला किया।
ttnphns

1
@ttnphns, शानदार। भले ही मुझे सब कुछ समझ में नहीं आया, लेकिन यह निश्चित रूप से CCA की सबसे अच्छी व्याख्या है। और मुझे लगता है कि वास्तव में क्या हो रहा है, इसका एक दृश्य प्राप्त करना महत्वपूर्ण है, क्योंकि मुझे पता है कि मुझे कुछ याद होगा अगर मैं इसे कल्पना कर सकता हूं, जैसा कि विभिन्न प्रमेयों के माध्यम से शोक मनाने के लिए है।
क्रिश्चियन

P1X1X2

2

मेरे लिए एस। मुलिक की किताब "द फाउंडर्स ऑफ फैक्टरानैलिसिस" (1972) को पढ़ना बहुत मददगार था, कि विहित रूप से कोरोनरी कॉर्सेशन पर पहुंचने के लिए फैक्टर लोडिंग के मैट्रिक्स के घूमने की एक विधि है, इसलिए मैं पता लगा सका यह उन अवधारणाओं के संयोजन में है, जिन्हें मैं पहले से ही प्रमुख घटक विश्लेषण और कारक विश्लेषण से अब तक समझ चुका था।

शायद आप इस उदाहरण में रुचि रखते हैं (जिसे मैंने 1998 के कुछ दिनों पहले एक पहले कार्यान्वयन / चर्चा से फिर से बनाया है, क्रॉसचेक और एसपीएसएस द्वारा गणना के खिलाफ विधि को फिर से सत्यापित करने के लिए)। देखें यहाँ । मैं अपने छोटे मैट्रिक्स / pca-tools का उपयोग कर रहा हूं Inside-[R]और इसके Matmateलिए, लेकिन मुझे लगता है कि इसे Rबहुत अधिक प्रयास के बिना पुनर्निर्माण किया जा सकता है ।


2

यह उत्तर CCA को समझने के लिए एक दृश्य सहायता प्रदान नहीं करता है, हालांकि CCA की एक अच्छी ज्यामितीय व्याख्या एंडरसन-1958 [1] के अध्याय 12 में प्रस्तुत की गई है । इसका सार इस प्रकार है:

Nx1,x2,...,xNpXp×NxiXp(N1)p1p2x1,...,xp1p2xp1+1,...,xp

मुझे यह परिप्रेक्ष्य इन कारणों से दिलचस्प लगता है:

  • यह सीसीए विहित चर की प्रविष्टियों के बारे में एक दिलचस्प ज्यामितीय व्याख्या प्रदान करता है।
  • सहसंबंध गुणांक दो CCA अनुमानों के बीच के कोण से जुड़ा हुआ है।
  • का अनुपातp1Np2N(N1)N

p1p2

(N1)Nmean(xi)=0

[१] एंडरसन, TW एक बहुभिन्नरूपी सांख्यिकीय विश्लेषण का परिचय। वॉल्यूम। 2. न्यूयॉर्क: विली, 1958।


1
क्या आप उत्तर की कल्पना करने के लिए उस पुस्तक से चित्र जोड़ सकते हैं?
ttnphns

दुर्भाग्य से, पुस्तक में इस अध्याय के लिए चित्र नहीं हैं (वास्तव में मुझे नहीं लगता कि पूरी पुस्तक में कोई आंकड़े हैं)।
idnavid

@ttnphns मैंने दूसरे दिन कुछ समय बिताया और इस बिंदु को स्पष्ट करने के लिए एक छोटा सा उदाहरण दिया। सलाह के लिये धन्यवाद!
इदनावद ३१'१

1

आँकड़ों को पढ़ाने का सबसे अच्छा तरीका डेटा के साथ है। बहुभिन्नरूपी सांख्यिकीय तकनीकों को अक्सर मैट्रिसेस के साथ बहुत जटिल बनाया जाता है जो सहज नहीं हैं। मैं एक्सेल का उपयोग करके सीसीए की व्याख्या करूंगा। दो नमूने बनाएं, नए संस्करण (मूल रूप से कॉलम) जोड़ें और गणना दिखाएं। और जहां तक ​​CCA के मैट्रिक्स निर्माण का सवाल है, तो सबसे अच्छा तरीका है कि पहले एक बिवरिएट केस के साथ पढ़ाया जाए और फिर उसका विस्तार किया जाए।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.