पीसीए ऑटोकैरेक्टेड डेटा के साथ क्या कर रहा है?


9

सिर्फ इसलिए कि कुछ संवाददाता ने आटोक्लेररेशन की गणना के तरीकों के बारे में एक दिलचस्प सवाल पेश किया, मैंने इसके साथ खेलना शुरू किया, लगभग समय श्रृंखला और ऑटोक्रेलेशन के बारे में बिना किसी ज्ञान के।

संवाददाता ने अपने डेटा की व्यवस्था की (32 एक टाइम सीरीज़ के डेटा पॉइंट्स) को एक-एक बार शिफ्ट किया गया, इसके अलावा उसके पास एक मैट्रिक्स था 32×32 डेटा (जैसा कि मैंने उसे समझा था) जहां पहली पंक्ति का मूल डेटा है, दूसरी पंक्ति द्वारा स्थानांतरित डेटा 1समय इकाई, एक और एक द्वारा अगली पंक्ति। मैंने पूंछ के अंत को गोंद करके इसके अतिरिक्त महसूस किया, इसलिए "परिपत्र" डेटासेट बना रहा है।

फिर, केवल यह देखने के लिए कि इससे क्या हो सकता है, मैंने सहसंबंध मैट्रिक्स की गणना की और इसमें से प्रमुख घटक। हैरानी की बात है कि मुझे एक आवृत्ति-अपघटन की छवि मिली है, और (फिर अन्य डेटा के साथ) एक आवृत्ति, कहते हैं कि इस अवधि के साथ में32 डेटा पहले मुख्य घटक में था, और यह कि चार अवधि दूसरे पीसी में थी और इसी तरह (मुझे मिला) 6 eigenvalue के साथ "प्रासंगिक" पीसी >1)। पहले मैंने सोचा कि यह इनपुट डेटा पर निर्भर करता है, लेकिन अब मैं यह मानता हूं कि यह इस तरह से व्यवस्थित रूप से इसके परिपत्र पारियों (जिसे "टोलपिट्ज़" मैट्रिक्स के रूप में भी जाना जाता है) के साथ सेट किया गया है। पीसी-सॉल्यूशन के वरीमैक्स या अन्य रोटेशन-मापदंड के रोटेशन ने थोड़ा अलग, और संभवतः दिलचस्प परिणाम दिया, लेकिन सामान्य तौर पर ऐसा आवृत्ति-अपघटन प्रदान करता है।

यहाँ उन चित्रों का लिंक दिया गया है, जिनसे मैं बना हूँ32- डेटा सेट; घटता बस फैक्टॉर्मेट्रिक्स के लोडिंग से बनाया जाता है: एक वक्र एक कारक पर लोडिंग। पहले PC1 के वक्र को सबसे अधिक आयाम दिखाना चाहिए (मोटे तौर पर क्योंकि इसमें सबसे अधिक भार भार का होता है)

प्रशन:

  • Q1: यह डिजाइन द्वारा एक विशेषता है? (इस प्रकार के डेटासेट के साथ पीसीए)
  • Q2: क्या यह दृष्टिकोण वास्तव में आवृत्ति- / तरंग दैर्ध्य विश्लेषण के लिए एक गंभीर दृष्टिकोण के लिए उपयोग करने योग्य है?

[अपडेट] यहां डेटासेट है (आशा है कि यह आपके लिए कॉपी योग्य होगा)

-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4
-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5
-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3
0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1
2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0
4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2
6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4
5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6
3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5
1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3
1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1
0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1
-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0
-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2
-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3
0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1
3,5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0
5,7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3
7,6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5
6,7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7
7,5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6
5,4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7
4,3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5
3,2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4
2,3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3
3,5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2
5,4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3
4,3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5
3,2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4
2,3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3
3,4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2
4,-5,-3,-1,0,2,4,6,5,3,1,1,0,-2,-3,-1,0,3,5,7,6,7,5,4,3,2,3,5,4,3,2,3

धन्यवाद @amoeba और बहुत सारे संपादन के लिए। मैंने केवल दो त्रुटियां देखीं, जिन्हें मैं बाद में संपादित करना चाहता था, अब प्रश्न बहुत अच्छा लग रहा है!
गॉटफ्रीड हेल्स

जवाबों:


4

मुझे अपनी पूर्व टिप्पणी को उत्तर में बदलने दें।

क्या आप चर या नमूने होने के लिए अपने डेटा मैट्रिक्स में पंक्तियों की कल्पना करते हैं? मैं मानूंगा कि वे नमूने हैं: यानी आपके पासn=32 विभिन्न समय श्रृंखला (नमूने)।

फिर, यदि सभी n=32 पंक्तियाँ समान हैं, लेकिन केवल परिपत्र रूप से स्थानांतरित कर दी गई हैं 1 प्रत्येक स्थिति, फिर n×nसभी जोड़े पंक्तियों के बीच डॉट उत्पादों से युक्त आपके डेटा के ग्राम मैट्रिक्स में टोप्लेट्ज़ संरचना होगी: विकर्ण के करीब उच्च मूल्य और धीरे-धीरे घटकर शून्य मान इससे दूर हो जाते हैं। Toeplitz मैट्रिसेस में लगातार फ्यूरियर मोड होते हैं क्योंकि उनके eigenvectors (और ग्राम मैट्रिक्स के eigenvectors मुख्य घटक हैं, स्केलिंग तक), इसलिए आपके Q1 के लिए हाँ : यह कोई आश्चर्य की बात नहीं है कि आपको पीसी के रूप में बढ़ती आवृत्तियों की साइनसॉइड तरंगें मिलती हैं।

कोई विचार नहीं अगर यह उपयोगी हो सकता है (Q2)। मेरे अनुभव में, यह एक कष्टप्रद विरूपण साक्ष्य के रूप में प्रकट होता है। यानी लोगों के पास कुछ डेटा है, पीसीए से बाहर फूरियर मोड्स जैसा दिखने वाला कुछ प्राप्त करें और यह सोचना शुरू करें कि उनका क्या मतलब हो सकता है, जबकि वे मूल समय श्रृंखला में कुछ समय के बदलाव के कारण हैं।


खैर, बहुत अच्छा, धन्यवाद! हां, मैंने पंक्तियों के साथ डेटा को सोचा है। Q2 भी आता है क्योंकि मैंने आज तक कभी नहीं समझा कि फूरियर विश्लेषण कैसे काम करता है - और दुर्घटना से यह एक कदम हो सकता है के बारे में कुछ अंतर्ज्ञान पाने के लिए (लेकिन यह अस्पष्ट आशा वास्तव में यहाँ बेकार लगती है ...)
Gottfried हेल्स

वैसे, क्या आप अपनी 32-मूल्यवान समय-श्रृंखला को साझा करने का मन करेंगे? मैं ग्राम मैट्रिक्स दिखाते हुए एक आकृति सम्मिलित करना चाहूंगा, और मैं इसे सीधे आपके डेटा के साथ कर सकता हूं।
अमीबा

क्या आपने मेरे प्रश्न का लिंक देखा? यह एक वेबपेज पर रीडायरेक्ट करता है, जिसे मैंने exce.l का उपयोग करके बनाया है। इसमें 4 या 5 उपपृष्ठ हैं, जो स्क्रीन के निचले भाग में टैब-बार पर एक क्लीक द्वारा मेरे इंस्टॉलेशन में "फ़ायरफ़ॉक्स" द्वारा चयन करने योग्य हैं। पहला उपपृष्ठ डेटा की सूची दिखाता है। हालाँकि, खड़ी: एक नई तालिका में इसे पहली पंक्ति के रूप में लेना चाहिए और दाईं ओर साइकिल चलाते हुए 31 पंक्तियों को जोड़ना चाहिए। अगर यह असुविधाजनक है तो मैं अपने प्रश्न में डेटा भी जोड़ सकता हूं ...
गॉटफ्रीड हेल्स

अरे वाह, मुझे एहसास नहीं था कि यह एक पूरी ऑनलाइन स्प्रेडशीट थी, और सिर्फ एक स्क्रीनशॉट नहीं! धन्यवाद।
अमीबा
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.