रैंक सहसंबंध के साथ कैनन संबंधी सहसंबंध विश्लेषण


15

Canonical सहसंबंध विश्लेषण (CCA) का उद्देश्य दो डेटा सेटों के रैखिक संयोजनों के सामान्य पियर्सन उत्पाद-क्षण सहसंबंध (यानी रैखिक सहसंबंध गुणांक) को अधिकतम करना है।

यह बहुत ही कारण है कि हम भी उपयोग करते हैं, उदाहरण के लिए, Spearman- है - अब, इस तथ्य है कि इस सहसंबंध गुणांक संघों रैखिक केवल उपायों पर विचार या Kendall- τ (रैंक) सहसंबंध गुणांक जो मनमाने ढंग से एक लय को मापने (जरूरी रैखिक नहीं) के बीच संबंध चर।ρτ

इसलिए, मैं निम्नलिखित के बारे में सोच रहा था: सीसीए की एक सीमा यह है कि यह केवल अपने उद्देश्य फ़ंक्शन के कारण गठित रैखिक संयोजनों के बीच रैखिक संघ को पकड़ने की कोशिश करता है। क्या अधिकतम रूप से CCA को कुछ अर्थों में विस्तारित करना संभव नहीं होगा, कहते हैं, पियर्सन- r के बजाय स्पीयरमैन- ?ρआर

क्या इस तरह की प्रक्रिया से सांख्यिकीय रूप से व्याख्या और सार्थक कुछ भी हो सकता है? (क्या यह समझ में आता है - उदाहरण के लिए - रैंक पर सीसीए करने के लिए ...?) मैं सोच रहा हूं कि क्या यह मदद करेगा जब हम गैर-सामान्य डेटा के साथ काम कर रहे हैं ...


4
क्या OVERALS - रैखिक विहित विश्लेषण जो कि आशातीत रूप से तराजू ( एकरूपता से रूपांतरित) करता है, जो कैनोनिकल सहसंबंधों को अधिकतम करने के लिए चर - आपकी पसंद के अनुसार हो?
ttnphns

@ttnphns: इस विचार के लिए धन्यवाद, मैंने इसके बारे में पहले नहीं सुना है, और वास्तव में दिलचस्प लग रहा है! हालांकि, मुझे नहीं लगता कि यह इस बिंदु को संबोधित करता है: जहां तक ​​मैं समझता हूं, यह अनिवार्य रूप से इष्टतम स्केलिंग और सीसीए का एक संयोजन है - लेकिन इष्टतम स्केलिंग केवल श्रेणीबद्ध चर के लिए वास्तव में समझ में आता है। यह अनुपात पैमाने पर मापी गई निरंतर चर (जो मेरे दिमाग में है!) के लिए बहुत कुछ बदलने के लिए प्रतीत नहीं होता है । लेकिन मुझे सही करें, अगर मैं गलत हूं।
तमस फेरेंसी

1
@ttnphns: ठीक है, उसी तरह जिस तरह आप कभी-कभी निरंतर चर पर स्पीयरमैन सहसंबंध का उपयोग करते हैं! (निश्चित रूप से यह डेटा को आर्डिनल होने के रूप में संभालता है ... लेकिन हम इसे बिना किसी सामान्य मोनोटोन (और न केवल रैखिक) एसोसिएशन के चर के रूप में चिह्नित करने के लिए निश्चित रूप से निरंतर चर पर उपयोग करते हैं। यही कारण है कि मुझे लगा कि यह सीसीए के भीतर भी समझ में आएगा। ...
तमस फेरेंकी

@Glen_b, आप सही कह रहे हैं। बेशक रैंक सहसंबंध किसी भी एकरसता के लिए हैं - यह क्रमिक या निरंतर डेटा हो। मैं ऊपर की अपनी टिप्पणी पर इतना हैरान हूं कि मैं इसे हटा रहा हूं।
tnnphns

आप कर्नेल सीसीए का उपयोग करने की कोशिश कर सकते हैं जो विशेष रूप से जब रेडियल आधार फ़ंक्शन के साथ उपयोग किया जाता है, तो हमें डेटा को एक अनंत आयामी उप-क्षेत्र में प्रोजेक्ट करने में सक्षम बनाता है।
रोनी

जवाबों:


6

जब मैंने विहित चर की गणना की तो मैंने क्यूब स्प्लिन विस्तार का उपयोग किया। आप विश्लेषण में नॉनलाइन आधार कार्यों को ठीक उसी तरह जोड़ रहे हैं जैसे आप नई सुविधाएँ जोड़ रहे होंगे। यह nonlinear प्रमुख घटक विश्लेषण में परिणाम है। उदाहरण के लिए R Hmiscपैकेज का transcanकार्य देखें । द आरhomals पैकेज इसे और आगे ले जाता है।


1
धन्यवाद! होमल्स में वर्णित दृष्टिकोण मेरे लिए उपन्यास था, लेकिन निश्चित रूप से दिलचस्प था।
तमसा फेरेंसी

4

CCA की मानक विधि उत्पाद पल सहसंबंध गुणांक मैट्रिक्स के साथ काम करती है। सबसे बड़ी mgnitude CC के लिए यह दो मैटिक (n पंक्तियों और m1 और m2 वैरिएबल्स) के रैखिक संयोजन द्वारा दो समग्र चर z1 (n) और z2 (n) का निर्माण करता है, जैसे कि abs (सहसंबंध (z1, z2)) अधिकतम होता है। यह उद्देश्य फ़ंक्शन सीधे भी अधिकतम हो सकता है, भले ही सहसंबंध (z1, z2) उत्पाद क्षण न हो, लेकिन अलग-अलग परिभाषित हो।

मिश्रा, एसके (2009) "रैंकिंग सेटों के दो सेटों के सामान्य औपनिवेशिक सहसंबंध विश्लेषण पर एक नोट"

http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1328319

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.