विलक्षण मूल्य विघटन का क्या मतलब है?


9

मुझे समझ नहीं आता कि आयाम में कमी महत्वपूर्ण क्यों है। कुछ डेटा लेने और उनके आयाम को कम करने से क्या लाभ है?


3
प्रश्न का स्वर रचनात्मक उत्तर को आमंत्रित नहीं करता है। कृपया अपने प्रश्न को पुनः दर्ज करने पर विचार करें।
साशा

2
सटीकता के मामूली नुकसान (उदाहरण के लिए जेपीईजी छवि संपीड़न) के खर्च के रूप में कुछ जानकारी को संग्रहीत करने के लिए आवश्यक डेटा की मात्रा को कम करने के लिए बिंदु हो सकता है।
साशा

2
आपकी टिप्पणियों के लिए धन्यवाद, @ साशा। यह एक वाजिब सवाल है, इसलिए मैंने मूल शब्द-विद्या द्वारा व्यक्त की गई कुंदता (निश्चित रूप से अनपेक्षित) की छाप से बचने के लिए एक मामूली संपादन किया।
whuber

एक उदाहरण के लिए आँकड़े देखें ।stackexchange.com/questions/177102/… !
kjetil b halvorsen

आप विषय मॉडलिंग के लिए एसवीडी करते हैं जो संभाव्य नहीं है। विषय मॉडलिंग के लिए जो कि संभाव्य उपयोग एलडीए है। यदि आप विषय मॉडलिंग नहीं कर रहे हैं तो पीसीए का उपयोग करें।
ब्रैड

जवाबों:


18

एकवचन मान अपघटन (SVD) डेटा की गतिशीलता को कम करने के समान नहीं है। यह मैट्रिक्स को अन्य मैट्रिक्स में विघटित करने की एक विधि है जिसमें बहुत सारे अद्भुत गुण हैं जो मैं यहां नहीं जाऊंगा। SVD पर अधिक जानकारी के लिए, विकिपीडिया पृष्ठ देखें ।

अपने डेटा की गतिशीलता को कम करना कभी-कभी बहुत उपयोगी होता है। यह हो सकता है कि आपके पास टिप्पणियों की तुलना में बहुत अधिक चर हों; यह जीनोमिक कार्य में असामान्य नहीं है। यह हो सकता है कि हमारे पास कई चर हैं जो बहुत अधिक सहसंबद्ध हैं, उदाहरण के लिए, जब वे अंतर्निहित कारकों की एक छोटी संख्या से बहुत प्रभावित होते हैं, और हम अंतर्निहित कारकों के कुछ सन्निकटन को पुनर्प्राप्त करना चाहते हैं। आयामी घटक को कम करने वाली तकनीक जैसे कि प्रमुख घटक विश्लेषण, बहुआयामी स्केलिंग और विहित वैचारिक विश्लेषण हमें टिप्पणियों और / या चर के बीच संबंधों में अंतर्दृष्टि प्रदान करते हैं कि हम किसी अन्य तरीके से प्राप्त करने में सक्षम नहीं हो सकते हैं।

एक ठोस उदाहरण: कुछ साल पहले मैं एक कर्मचारी संतुष्टि सर्वेक्षण का विश्लेषण कर रहा था जिसमें 100 से अधिक प्रश्न थे। खैर, कोई भी प्रबंधक कभी भी 100+ प्रश्नों के उत्तरों को देखने में सक्षम नहीं हो सकता है, यहाँ तक कि संक्षेप में, और अनुमान लगाने से ज्यादा यह है कि इसका क्या अर्थ है, क्योंकि कौन बता सकता है कि उत्तर कैसे संबंधित हैं और उन्हें क्या चला रहा है, वास्तव में ? मैंने डेटा पर एक कारक विश्लेषण किया, जिसके लिए मेरे पास 10,000 से अधिक अवलोकन थे, और पांच बहुत स्पष्ट और आसानी से व्याख्या करने योग्य कारक आए, जिनका उपयोग प्रबंधक-विशिष्ट स्कोर (प्रत्येक कारक के लिए एक) को विकसित करने के लिए किया जा सकता है 100+ प्रश्न सर्वेक्षण। एक्सेल स्प्रेडशीट डंप की तुलना में बेहतर समाधान जो रिपोर्टिंग परिणामों का पूर्व तरीका था!


"पतली एसवीडी" नामक एक विधि का उपयोग आयामी कमी के लिए किया जाता है। एसवीडी पर विकिपीडिया देखें।
सायबोर्ग

5

इस प्रश्न के बारे में आपके गोपनीयता बिंदु के बारे में, डेटा सेट के लिए आयामी कमी के लाभ हो सकते हैं:

  • स्टोरेज स्पेस को कम करना चाहिए
  • गणना में तेजी लाना (उदाहरण के लिए मशीन लर्निंग एल्गोरिदम में), कम आयाम मतलब लेस कंप्यूटिंग, यह भी कम आयाम एल्गोरिदम के उपयोग को बड़ी संख्या में आयामों के लिए अयोग्य अनुमति दे सकते हैं।
  • निरर्थक सुविधाओं को हटा दें, उदाहरण के लिए दोनों वर्ग मीटर और वर्ग मील (शायद डेटा एकत्र करना। त्रुटिपूर्ण) में एक इलाके के आकार को संग्रहीत करने का कोई मतलब नहीं है।
  • 2 डी या 3 डी के लिए डेटा के आयाम को कम करने से हमें इसकी साजिश करने और कल्पना करने की अनुमति मिल सकती है, शायद पैटर्न का निरीक्षण करें, हमें अंतर्दृष्टि दें

इसके अलावा, पीसीए से परे, एसवीडी के सिग्नल प्रोसेसिंग, एनएलपी और कई और अधिक में कई अनुप्रयोग हैं


2

मेरे इस जवाब पर एक नजर । विलक्षण मूल्य अपघटन प्रमुख घटक विश्लेषण का एक प्रमुख घटक है , जो एक बहुत ही उपयोगी और बहुत शक्तिशाली डेटा विश्लेषण तकनीक है।

यह अक्सर चेहरे की पहचान एल्गोरिदम में उपयोग किया जाता है, और मैं हेज फंड विश्लेषक के रूप में अपने दिन के काम में इसका लगातार उपयोग करता हूं।


1
क्या SVD और PCA (संबंधित) अलग-अलग प्रक्रियाएँ नहीं हैं?
B_Miner

2
तुम सही हो। एसवीडी पीसीए समस्या का समाधान प्राप्त करने की एक विधि है।
21

1
@B_Miner हाँ - इसलिए मैंने कहा कि svd pca का एक प्रमुख घटक है । मैंने pca पर ध्यान केंद्रित किया क्योंकि प्रश्न चिंताओं में कमी को कम करता है (जिसके लिए pca उपयुक्त है, और svd नहीं है)
क्रिस टेलर

शायद घटक का शब्द विकल्प वह था जो अस्थायी रूप से @B_Miner बंद फेंक दिया। :)
कार्डिनल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.