आईआईडी (एक समान या सामान्य) डेटा के लिए eigenvalues ​​का अनुमानित वितरण


9

मान लें कि मेरे पास आयामों (जैसे ) के साथ एक डेटा सेट है, ताकि प्रत्येक आयाम iid (वैकल्पिक रूप से, प्रत्येक आयाम ) और स्वतंत्र है एक दूसरे।dd=20XiU[0;1]XiN[0;1]

अब मैं इस डेटासेट से एक रैंडम ऑब्जेक्ट खींचता हूँ और निकटतम पड़ोसियों को लेता हूँ और इस सेट पर PCA की गणना करता हूँ। किसी से क्या अपेक्षा की जा सकती है, इसके विपरीत, आइजनवेल्स सभी समान नहीं हैं। 20 आयामों की वर्दी में, एक विशिष्ट परिणाम इस तरह दिखता है:k=3d

0.11952316626613427, 0.1151758808663646, 0.11170020254046743, 0.1019390988585198,
0.0924502502204256, 0.08716272453538032, 0.0782945015348525, 0.06965903935713605, 
0.06346159593226684, 0.054527131148532824, 0.05346303562884964, 0.04348400728546128, 
0.042304834600062985, 0.03229641081461124, 0.031532033468325706, 0.0266801529298156, 
0.020332085835946957, 0.01825531821510237, 0.01483790669963606, 0.0068195084468626625

सामान्य वितरित डेटा के लिए, परिणाम बहुत समान दिखाई देते हैं, कम से कम जब उन्हें कुल योग ( वितरण में स्पष्ट रूप से पहले स्थान पर एक उच्च विचरण होता है)।1N[0;1]d

मुझे आश्चर्य है कि क्या कोई परिणाम है जो इस व्यवहार की भविष्यवाणी करता है? मैं एक परीक्षण की तलाश कर रहा हूं कि क्या eigenvalues ​​की श्रृंखला कुछ हद तक नियमित है, और कितने eigenvalues ​​के रूप में अपेक्षित हैं और जो कि अपेक्षित मूल्यों से काफी भिन्न हैं।

किसी दिए गए (छोटे) नमूने के आकार , क्या एक परिणाम है यदि दो चर के लिए सहसंबंध गुणांक महत्वपूर्ण है? यहां तक ​​कि iid चर में कम लिए कभी-कभी एक गैर-0 परिणाम होगा ।kk


1
हम्म, क्या आप कम सिग अंजीर के साथ उन परिणामों को प्रिंट कर सकते हैं? मैं उन्हें आसानी से पार्स नहीं कर सकता ...
shabbychef

खैर, जैसा कि आप देख सकते हैं कि परिमाण रुचि का है। भोलेपन से, सभी को उम्मीद है कि सभी के पास एक ही परिमाण होगा।
QUIT - Anony-Mousse

जवाबों:


7

यादृच्छिक मेट्रिसेस के लिए आइजनवेल्यूस के वितरण पर एक बड़ा साहित्य है (आप यादृच्छिक मैट्रिक्स सिद्धांत को गुगली करने की कोशिश कर सकते हैं)। विशेष रूप से, मार्शेंको-पाश्चर वितरण शून्य और समान वैरिएबल के साथ डेटा के सहसंयोजक मैट्रिक्स के लिए eigenvalues ​​के वितरण की भविष्यवाणी करता है क्योंकि चर और टिप्पणियों की संख्या अनंत तक जाती है। निकटता से संबंधित विग्नर का अर्धवृत्त वितरण है।i.i.d.

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.