मैं एमआरआई डेटा पर एक मैटलैब विश्लेषण कर रहा हूं जहां मैंने पीसीए को मैट्रिक्स आकार 10304x236 पर प्रदर्शन किया है जहां 10304 वॉक्सल्स की संख्या है (उन्हें पिक्सेल के रूप में सोचो) और 236 टाइमपॉइंट की संख्या है। पीसीए मुझे 236 ईजेंवल और उनके संबंधित गुणांक देता है। यह सब ठीक है। हालाँकि जब यह तय करने का समय आता है कि कितने घटकों को बनाए रखना है, तो मैं जिस पेपर की नकल कर रहा हूं वह निम्नलिखित कहता है (कृपया मुझे बताएं कि क्या किसी स्पष्टीकरण की आवश्यकता है क्योंकि यह पूरे पेपर का एक छोटा हिस्सा है):
फिर हमने प्रत्येक स्कैन के लिए उपद्रव वाले ROI डेटा से निकालने के लिए मुख्य घटक (PC) की संख्या निर्धारित करने के लिए मोंटे कार्लो सिमुलेशन का प्रदर्शन किया। सामान्य रूप से एन्कोडिंग और बाकी उपद्रव ROI डेटा के बराबर रैंक के डेटा वितरित पर PCA प्रदर्शन करके प्रत्येक विषय के लिए एन्कोडिंग और बाकी डेटा के लिए अलग-अलग eigenvalues का एक शून्य वितरण उत्पन्न किया गया था। सच्चे उपद्रव ROI डेटा से पीसी को एक दिए गए आराम या एन्कोडिंग स्कैन के लिए चुना गया था यदि उनके संबंधित eigenvalues मोंटे कार्लो सिमुलेशन से eigenvalues के 99 वें विश्वास अंतराल को पार कर गए थे।
मुझे बिल्कुल पता नहीं है कि यहां क्या करना है। मुझे समझाया गया संचयी विचरण के बंद घटकों को चुनने के लिए उपयोग किया जाता है। मेरी सोच यह है, हालांकि:
फिर हमने प्रत्येक स्कैन के लिए उपद्रव वाले ROI डेटा से निकालने के लिए मुख्य घटक (PC) की संख्या निर्धारित करने के लिए मोंटे कार्लो सिमुलेशन का प्रदर्शन किया।
मोंटे कार्लो सिम का मतलब सिर्फ निम्नलिखित 1000 (या ऐसा) बार करना है, है ना?
सामान्य रूप से एन्कोडिंग और समान उपद्रव वाले ROI डेटा को समान रैंक के वितरित डेटा पर PCA प्रदर्शन करके अपेक्षित eigenvalues का एक शून्य वितरण उत्पन्न किया गया था।
सबसे पहले, मैं 'समान रैंक' मान रहा हूं, मूल रूप से इसका मतलब यह होगा कि मैं एक मैट्रिक्स को मूल (10304x236) के आकार का बनाऊंगा। 'समान रूप से समान रैंक के वितरित डेटा' के संदर्भ में ... क्या इसका मतलब है कि मुझे सामान्य वितरण से यादृच्छिक संख्याओं का 10304x236 मैट्रिक्स बनाना चाहिए? मतलाब का एक कार्य 'नॉर्चर' है जो ऐसा करता है लेकिन इसके लिए एक म्यू और सिग्मा इनपुट की आवश्यकता होती है। क्या मैं उसी म्यू और सिग्मा का उपयोग करूंगा जो शुरुआती डेटासेट से प्राप्त होते हैं? क्या यह कमोबेश what अपेक्षित प्रतिजन ’से है, क्योंकि मुझे इस बात का कोई अंदाजा नहीं है कि निर्यातित प्रतिजन का वितरण कैसा दिखेगा।
मुझे लगता है कि मेरी समस्या कम या ज्यादा है कि मैं नहीं जानता कि कैसे eigenvalues का 'अशक्त वितरण' करना है।