इस एसई पर कई पोस्ट हैं जो प्रमुख घटक विश्लेषण (पीसीए) के लिए मजबूत दृष्टिकोणों पर चर्चा करते हैं, लेकिन मैं इस बात का एक भी अच्छा विवरण नहीं पा सकता हूं कि पीसीए पहली जगह में आउटलेर्स के लिए संवेदनशील क्यों है।
इस एसई पर कई पोस्ट हैं जो प्रमुख घटक विश्लेषण (पीसीए) के लिए मजबूत दृष्टिकोणों पर चर्चा करते हैं, लेकिन मैं इस बात का एक भी अच्छा विवरण नहीं पा सकता हूं कि पीसीए पहली जगह में आउटलेर्स के लिए संवेदनशील क्यों है।
जवाबों:
कारणों में से एक यह है कि पीसीए को डेटा के निम्न-श्रेणी के अपघटन के रूप में माना जा सकता है जो अपघटन के अवशिष्ट के मानदंडों के योग को कम करता है । Ie यदि आपका डेटा ( आयामों का वैक्टर ) है, और PCA आधार है ( आयामों के vectors ), तो अपघटन सख्ती से
यहां A पीसीए अपघटन के गुणांक का मैट्रिक्स है और \ lVert \ cdot \ rVert_F मैट्रिक्स का फ्रोबेनियस मानदंड है
क्योंकि PCA मानदंड (यानी द्विघात मानदंड) को कम करता है, इसमें समान मुद्दे हैं, जो कम से कम वर्ग हैं या आउटलेयर के प्रति संवेदनशील होकर एक गाऊसी फिटिंग करते हैं। बाहरी लोगों के विचलन के कारण, वे कुल आदर्श पर हावी होंगे और इसलिए पीसीए घटकों को चलाएंगे।