आश्रित टिप्पणियों के लिए पीसीए के गुण


23

हम आमतौर पर पीसीए को डेटा के लिए एक आयामी कमी तकनीक के रूप में उपयोग करते हैं जहां मामलों को आईआईडी माना जाता है

प्रश्न: पीसीए को आश्रित, गैर-आईआईडी डेटा के लिए आवेदन करने में क्या विशिष्ट बारीकियां हैं? पीसीए के अच्छे / उपयोगी गुण जो आईआईडी डेटा के लिए हैं, उनसे समझौता किया जाता है (या पूरी तरह से खो दिया है)?

उदाहरण के लिए, डेटा एक बहुभिन्नरूपी श्रृंखला हो सकती है, जिसमें ऑटोकॉर्लेशन या ऑटोरेस्पिरेटिव सशर्त हेट्रोसेकेडसिटी (ARCH) की उम्मीद की जा सकती है।

पीसीए को समय श्रृंखला डेटा पर लागू करने से संबंधित कई प्रश्न पहले पूछे गए हैं, जैसे 1 , 2 , 3 , 4 , लेकिन मैं एक अधिक सामान्य और व्यापक उत्तर (प्रत्येक व्यक्तिगत बिंदु पर बहुत विस्तार करने की आवश्यकता के बिना) की तलाश कर रहा हूं।

संपादित करें: जैसा कि @ttnphns द्वारा उल्लेख किया गया है, पीसीए स्वयं एक हीनतापूर्ण विश्लेषण नहीं है। हालांकि, किसी को पीसीए के सामान्यीकरण प्रदर्शन में दिलचस्पी हो सकती है, यानी नमूना पीसीए के जनसंख्या समकक्ष पर ध्यान केंद्रित करना। जैसे नादलर में लिखा गया (2008) :

मान लिया गया डेटा एक (आम तौर पर अज्ञात) वितरण से एक परिमित और यादृच्छिक नमूना है, एक दिलचस्प सैद्धांतिक और व्यावहारिक सवाल परिमित डेटा और अंतर्निहित जनसंख्या मॉडल से गणना किए गए नमूना पीसीए परिणामों के बीच का संबंध है।

संदर्भ:


14
सिर्फ नोट के लिए। PCA अपने आप में एक हीनतापूर्ण विश्लेषण नहीं है। यह संख्याओं के बहुभिन्नरूपी डेटासेट का रूपांतरण है; इसका मूल सिर्फ svd या eigendecomposition है। इसलिए यह अवलोकन स्वतंत्रता को धारणा नहीं बनाता है। जब हम आबादी से नमूनों का विश्लेषण करने के लिए एक सांख्यिकीय उपकरण के रूप में पीसीए का उपयोग करते हैं तो मान्यताएं उत्पन्न होती हैं । लेकिन वे पीसीए की धारणा नहीं हैं। उदाहरण के लिए, यदि पीसीए को डेटा को कम करने के लिए उचित ठहराया जाता है, तो यह निर्धारित करने के लिए गोलाकारता का परीक्षण करना आवश्यक है, और परीक्षण ऐसा लग सकता है जैसे कि "भीतर-पीसीए" धारणा परीक्षण, लेकिन वास्तव में यह "बाहर" परीक्षण है।
ttnphns

@ttnphns, बहुत अच्छे अंक, धन्यवाद। यदि आप मेरी पोस्ट को संपादित करने का एक अच्छा तरीका देखते हैं, तो बेझिझक। मैं खुद भी इसके बारे में सोचूंगा।
रिचर्ड हार्डी

1
रिचर्ड, आपका प्रश्न ठीक और महत्वपूर्ण है (+1)। बस शायद मैं इसे फिर से एक तरह से फिर से शब्दों में लिखूंगा जैसे "हम आमतौर पर पीसीए का उपयोग डेटा के लिए एक गतिशीलता में कमी के रूप में करते हैं जहां मामलों को आईआईडी माना जाता है ... समय श्रृंखला डेटा के लिए पीसीए को लागू करने में विशिष्ट बारीकियां हैं जहां मामले (समय) अंक) अंतराल-निर्भर हैं ...? "
ttnphns

1
@ लिंबा, ठीक है। लेकिन हम शायद ही कभी पीसी के लोडिंग प्राप्त करने पर रोकते हैं। आमतौर पर पीसीए का पालन करने वाले चरणों में, हमें गैर-आइडेंस के तहत क्या जानना चाहिए? मुझे उम्मीद है कि एक सवाल सवाल से बेहतर हो सकता है (इसके मौजूदा निर्माण में)। यदि आप इसे शिथिल / रचनात्मक रूप से देखते हैं, तो शायद आप कुछ अच्छे बिंदुओं के साथ आ सकते हैं।
रिचर्ड हार्डी

2
सादा पीसीए केवल "क्षैतिज" संघों (यानी स्तंभों के बीच) का सम्मान करता है और "ऊर्ध्वाधर" (मामलों के बीच) को अनदेखा करता है: स्तंभों का सहसंयोजक मैट्रिक्स समान है यदि आप मामलों का क्रम फेरबदल करते हैं। क्या इसे "केस सीरियल संबंधों के लिए कोई धारणा नहीं" कहा जा सकता है या "स्वतंत्र मामलों के लिए धारणा" बनाया जाता है। डेटा विश्लेषण में iid धारणा डिफ़ॉल्ट है, और इसलिए ऐसे तरीके जो पीसीए की तरह केस ऑर्डर पर विशेष ध्यान नहीं देते हैं, उन्हें आईआईडी धारणा के लिए "मूक समर्थन" लगाया जा सकता है।
ttnphns

जवाबों:


1

संभवतः, आप समय-घटक को अपने नमूना बिंदुओं के लिए अतिरिक्त सुविधा के रूप में जोड़ सकते हैं, और अब वे iid हैं? मूल रूप से, मूल डेटा बिंदु समय पर सशर्त हैं:

p(xiti)p(xi)

लेकिन, अगर हम करते हैं, तो हमारे पास है:xi={xi,ti}

p(xiti)=p(xi)

... और डेटा नमूने अब परस्पर स्वतंत्र हैं।

व्यवहार में, प्रत्येक डेटा बिंदु में एक सुविधा के रूप में समय को शामिल करके, पीसीए के परिणामस्वरूप हो सकता है कि एक घटक समय सुविधा अक्ष के साथ इंगित करता है। लेकिन अगर किसी फीचर को टाइम फीचर से जोड़ा जाता है, तो एक कंपोनेंट में एक या अधिक फीचर्स हो सकते हैं, साथ ही टाइम फीचर भी।


1
जवाब के लिए धन्यवाद। यह एक विशेष मामला होगा जहां समय रैखिक रूप से प्रवेश करता है। एक अधिक व्यापक घटना है, उदाहरण के लिए, ऑटोकैरेलेशन जहां समय स्वयं एक विशेषता के रूप में भूमिका नहीं निभाता है।
रिचर्ड हार्डी

ठीक है मैं समझा। तो, आपका मतलब है कि, उदाहरण के लिए केवल कुछ पैरामीटरों की का कार्य नहीं है , बल्कि पर भी निर्भर करता है ? इसलिए, मार्कोव है, जिसे और ? तो, क्या हम PCA में एक सुविधा के रूप में जोड़ सकते हैं ? (मैं नहीं कह सकता कि हम कर सकते हैं या खिचड़ी भाषा, वास्तव में समस्या के माध्यम से सोच ...) θ एक्स टी - 1 एक्स टी एक्स टी - 1 θ एक्स टी - 1xtθxt1xtxt1θxt1
ह्यूग पर्किन्स

ऐसा कुछ, हाँ, लेकिन एक विशेषता के रूप में को जोड़े बिना, क्योंकि मुझे पीसीए में दिलचस्पी है जो मूल चर पर परिभाषित किया गया है ..xt1
रिचर्ड हार्डी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.