सहसंबंध मैट्रिक्स के eigenvalues ​​के वितरण की अंतर्ज्ञान / व्याख्या?


13

एक सहसंबंध मैट्रिक्स के eigenvalues ​​के वितरण की आपकी अंतर्ज्ञान / व्याख्या क्या है? मैं सुनता हूं कि आमतौर पर 3 सबसे बड़े प्रतिध्वनि सबसे महत्वपूर्ण होते हैं, जबकि शून्य के करीब शोर होते हैं। इसके अलावा, मैंने कुछ शोध पत्रों की जांच की है कि कैसे स्वाभाविक रूप से eigenvalue वितरण की गणना यादृच्छिक सहसंबंध matrices (फिर से, संकेत से अलग शोर) से गणना की जाती है।

कृपया अपनी अंतर्दृष्टि पर विस्तार से विचार करें।


क्या आपके पास किसी विशेष एप्लिकेशन को ध्यान में रखना है, क्या आप सामान्य सलाह के लिए चाहते हैं कि हमें किसी भी एप्लिकेशन (यानी एक शुद्ध गणितीय पक्ष) के अलावा कितने ईवी पर विचार करने की आवश्यकता है या क्या यह एक विशिष्ट संदर्भ पर लागू होना चाहिए (जैसे कारक विश्लेषण, पीसीए, आदि)?
chl

मैं गणितीय पक्ष में अधिक रुचि रखता हूं, अर्थात एक सहसंबंध मैट्रिक्स के डेटा की एक संपत्ति के रूप में eigenvalues। यदि विशिष्ट संदर्भ के संदर्भ में इस पर चर्चा करना समझ में आता है, तो ऐसा करने के लिए स्वतंत्र महसूस करें।
एडुआर्डस

जवाबों:


4

मैं सुनता हूं कि आमतौर पर 3 सबसे बड़े प्रतिध्वनि सबसे महत्वपूर्ण होते हैं, जबकि शून्य के करीब शोर होते हैं

आप उसके लिए परीक्षण कर सकते हैं। अधिक विवरण के लिए इस पोस्ट में जुड़े पेपर देखें । यदि आपका वित्तीय समय श्रृंखला के साथ काम कर रहा है, तो आप पहले लेप्टोक्यूरिटी के लिए सही करना चाहते हैं (यानी गार्द-समायोजित रिटर्न की श्रृंखला पर विचार करें, कच्चे रिटर्न पर नहीं)।

मैंने कुछ शोध पत्रों की जांच की है कि कैसे स्वाभाविक रूप से eigenvalue वितरण की गणना यादृच्छिक सहसंबंध matrices (फिर से, संकेत से अलग शोर) से गणना की जाती है।

एडवर्ड:> आमतौर पर, एक इसे दूसरे तरीके से किया जाता है: जो आप चाहते हैं उस एप्लिकेशन से आने वाले eigenvalues ​​(सहसंबंध के मैट्रिसेस) के बहुभिन्नरूपी वितरण को देखें। एक बार जब आप eigenvalues ​​के वितरण के लिए एक विश्वसनीय उम्मीदवार की पहचान कर लेते हैं, तो उनसे उत्पन्न करना काफी आसान होना चाहिए।

p10p

संपादित करें (Shabbychef द्वारा टिप्पणियां)

चार चरण प्रक्रिया:

  1. j=1,...,JC~jj
  2. jΛ~j= log(λ~1j)log(λ~pj)C~j
  3. CV(Λ~)J×pΛ~j
  4. CV(Λ~)wमैंसीवी(Λ~)wमैं=γमैंΣमैं=1पीγमैंγमैं

एक सीमा यह है कि अंकों की एक श्रृंखला के उत्तल पतवार की तीव्र गणना तब बहुत धीमी हो जाती है जब आयामों की संख्या 10. से बड़ी हो जाती हैजे2


1
मैं उत्सुक हूँ: क्या चाल है?
shabbychef

सी~

λ1

यह एक बहुत ही अजीब प्रक्रिया है; यह कहीं प्रकाशित किया गया है?
शब्बीशेफ

@ शब्बीशेव:> नहीं, लेकिन मेरे पास संबंधित समस्या पर काम करने का अवसर था (बस एक समय श्रृंखला में शामिल नहीं) (एक ही समस्या के रूप में यह एक आँकड़े ।stackexchange.com
questions/

11

Eigenvalues ​​डेटा प्रसार के सिद्धांत घटकों के परिमाण देते हैं।


(स्रोत: yaroslavvb.com )
गॉसियन से सहसंयोजक मैट्रिक्स ) से पहले डेटासेट उत्पन्न किया गया था(3001)π/4


2

आमतौर पर पहला ईजनपोर्ट पोर्टफोलियो हर नाम पर लगभग बराबर होता है, जो कि 'मार्केट' पोर्टफोलियो को सभी एसेट्स के बराबर डॉलर वेट के साथ कहना है। दूसरा ईजनपोर्ट पोर्टफोलियो का कुछ अर्थ हो सकता है, जिसके आधार पर आप समय अवधि देखते हैं: उदाहरण के लिए ज्यादातर ऊर्जा स्टॉक, या बैंक स्टॉक, इत्यादि। मेरे अनुभव में, आपको किसी भी कहानी को पांचवें ईजिनपोर्ट पोर्टफोलियो से परे या उससे बाहर बनाने के लिए दबाव डाला जाएगा। और यह कुछ भाग ब्रह्मांड के चयन और विचार किए गए समय अवधि पर निर्भर करता है। यह सिर्फ ठीक है क्योंकि आमतौर पर पांचवां ईजेनवल्यू या तो मार्चेंको-पाश्चर वितरण द्वारा लगाए गए सीमाओं से बहुत दूर नहीं है।


हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.