प्रिंसिपल कंपोनेंट एनालिसिस का इस्तेमाल करके डेटा को व्हाइट कैसे करें?


18

मैं अपने डेटा \ mathbf X को रूपांतरित करना चाहता हूं, Xजैसे कि संस्करण एक होंगे और सहसंयोजक शून्य होंगे (यानी मैं डेटा को सफेद करना चाहता हूं)। इसके अलावा साधन शून्य होना चाहिए।

मुझे पता है कि मैं जेड-मानकीकरण और पीसीए-परिवर्तन करके वहां पहुंचूंगा, लेकिन मुझे उन्हें किस क्रम में करना चाहिए?

मुझे यह जोड़ना चाहिए कि रचित परिवर्तन के लिए फॉर्म ।xWx+b

क्या पीसीए के समान कोई विधि है जो इन दोनों परिवर्तनों को ठीक करती है और मुझे ऊपर दिए गए फॉर्मूले का सूत्र देती है?


(मेरी पहली टिप्पणी आपके प्रश्न को गलत ठहराने पर आधारित थी।) पीसीए आपको शून्य सहानुभूति देता है; यदि आप चाहें तो आप बाद में पीसी को मानकीकृत कर सकते हैं। यह करने के लिए एक अजीब बात लगती है, लेकिन आप इसे कर सकते हैं।
निक कॉक्स

@NickCox शायद यह अजीब लगता है क्योंकि रूपांतरित डेटा तब गोलाकार होता है, जो बिना सूचना के लगता है। हालांकि, यह परिवर्तन है जिसे मुझे जानना आवश्यक है, और अंतिम परिणाम नहीं। फिर भी मुझे नहीं पता कि परिवर्तन कैसा दिखेगा। मैं अभी भी पीसीए पर पढ़ रहा हूं, हालांकि।
एंजेलोर्फ

जवाबों:


31

सबसे पहले, आप माध्य घटाकर औसत शून्य प्राप्त करते हैं μ=1Nx

दूसरा, आप पीसीए करके कोवेरियन शून्य प्राप्त करते हैं। यदि Σ आपके डेटा का सहसंयोजक मैट्रिक्स है, तो PCA एक eigendecomposition Σ=UΛU , जहां U होता है एक ऑर्थोगोनल रोटेशन मैट्रिक्स \ boldsymbol \ Sigma के eigenvectors से बना है Σ, और Λ विकर्ण पर eigenvalues ​​के साथ एक विकर्ण मैट्रिक्स है। मैट्रिक्स U को डेटा को डी-कोरट करने के लिए आवश्यक रोटेशन देता है (यानी मूल सुविधाओं को मूल घटकों में मैप करता है)।

तीसरा, रोटेशन के बाद प्रत्येक घटक में एक इसी प्रतिजन द्वारा दिया गया विचरण होगा। तो बराबर बनाने के लिए , आपको वर्गमूल द्वारा विभाजित करने की आवश्यकता है ।1Λ

सभी एक साथ, परिवर्तन । आप जिस फॉर्म की तलाश कर रहे हैं, उसे प्राप्त करने के लिए कोष्ठक खोल सकते हैं।xΛ1/2U(xμ)


अपडेट करें। अधिक विवरण के लिए यह बाद का धागा भी देखें: ZCA व्हाइटनिंग और PCA व्हाइटनिंग में क्या अंतर है?


2
मुझे लगता है कि आपको eigenvalues ​​के वर्गमूल द्वारा विभाजित करने की आवश्यकता है, क्योंकि यह SD द्वारा स्केलिंग का मामला है, न कि विचरण का।
निक कॉक्स

@ नाइकॉक्स: हां, बिल्कुल सही कहा आपने। मैंने अपना जवाब सही किया। धन्यवाद!
अमीबा का कहना है कि मोनिका

1
मैंने सूत्र को औपचारिक रूप से सत्यापित किया है। मेरी सहायता करने के लिए धन्यवाद!
एंजेलोर्फ
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.