एक पेपर में मुख्य घटकों की संख्या निर्धारित करने के लिए "मोंटे कार्लो सिमुलेशन" का उल्लेख है; यह कैसे काम करता है?


10

मैं एमआरआई डेटा पर एक मैटलैब विश्लेषण कर रहा हूं जहां मैंने पीसीए को मैट्रिक्स आकार 10304x236 पर प्रदर्शन किया है जहां 10304 वॉक्सल्स की संख्या है (उन्हें पिक्सेल के रूप में सोचो) और 236 टाइमपॉइंट की संख्या है। पीसीए मुझे 236 ईजेंवल और उनके संबंधित गुणांक देता है। यह सब ठीक है। हालाँकि जब यह तय करने का समय आता है कि कितने घटकों को बनाए रखना है, तो मैं जिस पेपर की नकल कर रहा हूं वह निम्नलिखित कहता है (कृपया मुझे बताएं कि क्या किसी स्पष्टीकरण की आवश्यकता है क्योंकि यह पूरे पेपर का एक छोटा हिस्सा है):

फिर हमने प्रत्येक स्कैन के लिए उपद्रव वाले ROI डेटा से निकालने के लिए मुख्य घटक (PC) की संख्या निर्धारित करने के लिए मोंटे कार्लो सिमुलेशन का प्रदर्शन किया। सामान्य रूप से एन्कोडिंग और बाकी उपद्रव ROI डेटा के बराबर रैंक के डेटा वितरित पर PCA प्रदर्शन करके प्रत्येक विषय के लिए एन्कोडिंग और बाकी डेटा के लिए अलग-अलग eigenvalues ​​का एक शून्य वितरण उत्पन्न किया गया था। सच्चे उपद्रव ROI डेटा से पीसी को एक दिए गए आराम या एन्कोडिंग स्कैन के लिए चुना गया था यदि उनके संबंधित eigenvalues ​​मोंटे कार्लो सिमुलेशन से eigenvalues ​​के 99 वें विश्वास अंतराल को पार कर गए थे।

टैम्बिनी एंड डेवाची, पीएनएएस 2013, हिप्पोकैम्पस मल्टीवॉक्सल पैटर्न के पोस्टकेनोडिंग रेस्ट में दृढ़ता स्मृति से संबंधित है

मुझे बिल्कुल पता नहीं है कि यहां क्या करना है। मुझे समझाया गया संचयी विचरण के बंद घटकों को चुनने के लिए उपयोग किया जाता है। मेरी सोच यह है, हालांकि:

फिर हमने प्रत्येक स्कैन के लिए उपद्रव वाले ROI डेटा से निकालने के लिए मुख्य घटक (PC) की संख्या निर्धारित करने के लिए मोंटे कार्लो सिमुलेशन का प्रदर्शन किया।

मोंटे कार्लो सिम का मतलब सिर्फ निम्नलिखित 1000 (या ऐसा) बार करना है, है ना?

सामान्य रूप से एन्कोडिंग और समान उपद्रव वाले ROI डेटा को समान रैंक के वितरित डेटा पर PCA प्रदर्शन करके अपेक्षित eigenvalues ​​का एक शून्य वितरण उत्पन्न किया गया था।

सबसे पहले, मैं 'समान रैंक' मान रहा हूं, मूल रूप से इसका मतलब यह होगा कि मैं एक मैट्रिक्स को मूल (10304x236) के आकार का बनाऊंगा। 'समान रूप से समान रैंक के वितरित डेटा' के संदर्भ में ... क्या इसका मतलब है कि मुझे सामान्य वितरण से यादृच्छिक संख्याओं का 10304x236 मैट्रिक्स बनाना चाहिए? मतलाब का एक कार्य 'नॉर्चर' है जो ऐसा करता है लेकिन इसके लिए एक म्यू और सिग्मा इनपुट की आवश्यकता होती है। क्या मैं उसी म्यू और सिग्मा का उपयोग करूंगा जो शुरुआती डेटासेट से प्राप्त होते हैं? क्या यह कमोबेश what अपेक्षित प्रतिजन ’से है, क्योंकि मुझे इस बात का कोई अंदाजा नहीं है कि निर्यातित प्रतिजन का वितरण कैसा दिखेगा।

मुझे लगता है कि मेरी समस्या कम या ज्यादा है कि मैं नहीं जानता कि कैसे eigenvalues ​​का 'अशक्त वितरण' करना है।

जवाबों:


6

इस प्रश्न का एक संबंधित शब्द "समानांतर विश्लेषण" है।

सरल शब्दों में, मोंटे कार्लो सिमुलेशन 1000 (या इस तरह) यादृच्छिक रूप से वितरित डेटा के 10304x236 मैट्रिसेस उत्पन्न करेगा (यह मानता है, कि आपके द्वारा विश्लेषण किया जाने वाला डेटा सामान्य रूप से वितरित किया जाता है; यदि आपका डेटा अलग-अलग वितरित किया गया था, तो आप इसका उपयोग करेंगे; विभिन्न यादृच्छिक वितरण)। फिर आप अपने द्वारा बनाए गए प्रत्येक डेटा सेट के लिए eigenvalues ​​निकालेंगे, और प्रत्येक 1000 (या ऐसे) प्रतिकृति भर में औसत eigenvalue भी आत्मविश्वास अंतराल बना सकते हैं। फिर आप अपने डेटा से eigenvalues ​​की तुलना अपने सिमुलेशन से औसत eigenvalues ​​से करते हैं।

जहाँ आपके डेटासेट से आइगेनवेल्स, मोंटे कार्लो सिमुलेशन से आइजनवेल्यूज के 99 वें विश्वास अंतराल को पार करते हैं, वही विश्लेषण कितने कारकों को बनाए रखने का सुझाव देगा।

उदाहरण के लिए, यदि आपके डेटा से २५ वाँ प्रतिध्वनि २.१० और २६ वाँ १.९ 25 है, और १००० (या ऐसे) यादृच्छिक आंकड़ों के २५ वें स्वदेशी का ९९ वाँ अन्तराल २.०४ और २६ वाँ २.०१ है, यह आपको सुझाव देगा कि 25 घटकों को बनाए रखें।

आपके लिए ऐसा करने के लिए कार्य किए गए हैं। मतलब की एक कड़ी यह है:

http://www.mathworks.com/matlabcentral/fileexchange/44996-parallel-analysis--pa--to-for-determining-the-number-of-components-to-retain-from-pca/content/pa_test। म

मैंने पाया कि "माटलैब में समानांतर विश्लेषण" को गुगली करके।


+1। यह बहुत स्पष्ट है और लिंक मुझे बहुत मदद करेगा! मैंने बेतरतीब ढंग से वितरित आइजेनवेल्स के निष्कर्षण को सही ढंग से कोडित किया था, लेकिन सही तरीके से आत्मविश्वास अंतराल का उपयोग नहीं कर रहा था। अपनी प्रतिक्रिया देने के लिए आपका बहुत - बहुत धन्यवाद।
चैनहोमेलो

मदद करने के लिए खुश! खुशी है कि यह आपके लिए उपयोगी था।
मैक्सवेलड्जएक्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.