मुझे समझ नहीं आता कि आयाम में कमी महत्वपूर्ण क्यों है। कुछ डेटा लेने और उनके आयाम को कम करने से क्या लाभ है?
मुझे समझ नहीं आता कि आयाम में कमी महत्वपूर्ण क्यों है। कुछ डेटा लेने और उनके आयाम को कम करने से क्या लाभ है?
जवाबों:
एकवचन मान अपघटन (SVD) डेटा की गतिशीलता को कम करने के समान नहीं है। यह मैट्रिक्स को अन्य मैट्रिक्स में विघटित करने की एक विधि है जिसमें बहुत सारे अद्भुत गुण हैं जो मैं यहां नहीं जाऊंगा। SVD पर अधिक जानकारी के लिए, विकिपीडिया पृष्ठ देखें ।
अपने डेटा की गतिशीलता को कम करना कभी-कभी बहुत उपयोगी होता है। यह हो सकता है कि आपके पास टिप्पणियों की तुलना में बहुत अधिक चर हों; यह जीनोमिक कार्य में असामान्य नहीं है। यह हो सकता है कि हमारे पास कई चर हैं जो बहुत अधिक सहसंबद्ध हैं, उदाहरण के लिए, जब वे अंतर्निहित कारकों की एक छोटी संख्या से बहुत प्रभावित होते हैं, और हम अंतर्निहित कारकों के कुछ सन्निकटन को पुनर्प्राप्त करना चाहते हैं। आयामी घटक को कम करने वाली तकनीक जैसे कि प्रमुख घटक विश्लेषण, बहुआयामी स्केलिंग और विहित वैचारिक विश्लेषण हमें टिप्पणियों और / या चर के बीच संबंधों में अंतर्दृष्टि प्रदान करते हैं कि हम किसी अन्य तरीके से प्राप्त करने में सक्षम नहीं हो सकते हैं।
एक ठोस उदाहरण: कुछ साल पहले मैं एक कर्मचारी संतुष्टि सर्वेक्षण का विश्लेषण कर रहा था जिसमें 100 से अधिक प्रश्न थे। खैर, कोई भी प्रबंधक कभी भी 100+ प्रश्नों के उत्तरों को देखने में सक्षम नहीं हो सकता है, यहाँ तक कि संक्षेप में, और अनुमान लगाने से ज्यादा यह है कि इसका क्या अर्थ है, क्योंकि कौन बता सकता है कि उत्तर कैसे संबंधित हैं और उन्हें क्या चला रहा है, वास्तव में ? मैंने डेटा पर एक कारक विश्लेषण किया, जिसके लिए मेरे पास 10,000 से अधिक अवलोकन थे, और पांच बहुत स्पष्ट और आसानी से व्याख्या करने योग्य कारक आए, जिनका उपयोग प्रबंधक-विशिष्ट स्कोर (प्रत्येक कारक के लिए एक) को विकसित करने के लिए किया जा सकता है 100+ प्रश्न सर्वेक्षण। एक्सेल स्प्रेडशीट डंप की तुलना में बेहतर समाधान जो रिपोर्टिंग परिणामों का पूर्व तरीका था!
इस प्रश्न के बारे में आपके गोपनीयता बिंदु के बारे में, डेटा सेट के लिए आयामी कमी के लाभ हो सकते हैं:
इसके अलावा, पीसीए से परे, एसवीडी के सिग्नल प्रोसेसिंग, एनएलपी और कई और अधिक में कई अनुप्रयोग हैं
मेरे इस जवाब पर एक नजर । विलक्षण मूल्य अपघटन प्रमुख घटक विश्लेषण का एक प्रमुख घटक है , जो एक बहुत ही उपयोगी और बहुत शक्तिशाली डेटा विश्लेषण तकनीक है।
यह अक्सर चेहरे की पहचान एल्गोरिदम में उपयोग किया जाता है, और मैं हेज फंड विश्लेषक के रूप में अपने दिन के काम में इसका लगातार उपयोग करता हूं।