हम आमतौर पर पीसीए को डेटा के लिए एक आयामी कमी तकनीक के रूप में उपयोग करते हैं जहां मामलों को आईआईडी माना जाता है
प्रश्न: पीसीए को आश्रित, गैर-आईआईडी डेटा के लिए आवेदन करने में क्या विशिष्ट बारीकियां हैं? पीसीए के अच्छे / उपयोगी गुण जो आईआईडी डेटा के लिए हैं, उनसे समझौता किया जाता है (या पूरी तरह से खो दिया है)?
उदाहरण के लिए, डेटा एक बहुभिन्नरूपी श्रृंखला हो सकती है, जिसमें ऑटोकॉर्लेशन या ऑटोरेस्पिरेटिव सशर्त हेट्रोसेकेडसिटी (ARCH) की उम्मीद की जा सकती है।
पीसीए को समय श्रृंखला डेटा पर लागू करने से संबंधित कई प्रश्न पहले पूछे गए हैं, जैसे 1 , 2 , 3 , 4 , लेकिन मैं एक अधिक सामान्य और व्यापक उत्तर (प्रत्येक व्यक्तिगत बिंदु पर बहुत विस्तार करने की आवश्यकता के बिना) की तलाश कर रहा हूं।
संपादित करें: जैसा कि @ttnphns द्वारा उल्लेख किया गया है, पीसीए स्वयं एक हीनतापूर्ण विश्लेषण नहीं है। हालांकि, किसी को पीसीए के सामान्यीकरण प्रदर्शन में दिलचस्पी हो सकती है, यानी नमूना पीसीए के जनसंख्या समकक्ष पर ध्यान केंद्रित करना। जैसे नादलर में लिखा गया (2008) :
मान लिया गया डेटा एक (आम तौर पर अज्ञात) वितरण से एक परिमित और यादृच्छिक नमूना है, एक दिलचस्प सैद्धांतिक और व्यावहारिक सवाल परिमित डेटा और अंतर्निहित जनसंख्या मॉडल से गणना किए गए नमूना पीसीए परिणामों के बीच का संबंध है।
संदर्भ:
- नाडलर, बोअज़। "प्रमुख घटक विश्लेषण के लिए परिमित नमूना सन्निकटन परिणाम: एक मैट्रिक्स गड़बड़ी दृष्टिकोण।" द एनल्स ऑफ स्टैटिस्टल्स (2008): 2791-2817।