यह बहुत है व्यापक सवाल है, जो मुझे लगता है कि यह कवर करने के लिए असंभव है व्यापक एक भी जवाब में। इसलिए, मुझे लगता है कि प्रासंगिक उत्तर और / या संसाधनों के लिए कुछ संकेत प्रदान करना अधिक लाभदायक होगा। यह बिल्कुल वही है जो मैं निम्नलिखित जानकारी और विचार प्रदान करके करूँगा।
सबसे पहले, मुझे Microsoft अनुसंधान से बर्ग (2009) द्वारा आयामीता में कमी पर उत्कृष्ट और व्यापक ट्यूटोरियल का उल्लेख करना चाहिए । वह पूरे मोनोग्राफ में अक्सर डेटा के उच्च-आयामी पहलुओं को छूता है । यह काम की चर्चा करते हुए आयामी स्वरूप में कमी के रूप में आयाम कमी , उपहार में एक सैद्धांतिक परिचय समस्या , एक पता चलता वर्गीकरण आयामी स्वरूप कमी तरीकों में से, से मिलकर प्रक्षेपीय तरीकों और कई गुना मॉडलिंग तरीकों , साथ ही साथ एक प्रदान करता है सिंहावलोकन प्रत्येक श्रेणी में कई तरीकों में से।
" प्रोजेक्टिव खोज" विधियों में स्वतंत्र घटक विश्लेषण (ICA) , प्रमुख घटक विश्लेषण (PCA) और इसकी विविधताएँ, जैसे कर्नेल PCA और संभाव्य PCA , कैनोनिकल सहसंबंध विश्लेषण (CCA) और इसकी कर्नेल CCA भिन्नता, रैखिक विवेचक विश्लेषण (LDA) शामिल हैं। ) , कर्नेल आयाम में कमी (KDR) और कुछ अन्य। कई गुना तरीकों की समीक्षा की शामिल बहुआयामी स्केलिंग (एमडीएस) और इसकी ऐतिहासिक एमडीएस भिन्नता, Isomap , स्थानीय स्तर पर रैखिक एम्बेडिंगऔर चित्रमय विधियां, जैसे कि लाप्लासियन ईजेनमैप्स और वर्णक्रमीय क्लस्टरिंग । यदि यहां मूल प्रकाशन आपके लिए अप्राप्य है, तो ऑनलाइन (ऊपर लिंक), या ऑफलाइन (संदर्भ) के लिए, मैं समीक्षा की गई अधिकांश विधियों को यहाँ सूचीबद्ध कर रहा हूँ ।
"व्यापक" शब्द के लिए एक चेतावनी है जिसे मैंने उपर्युक्त कार्य पर लागू किया है। हालांकि यह वास्तव में व्यापक है, यह सापेक्ष है, क्योंकि आयाम में कमी के कुछ दृष्टिकोण मोनोग्राफ में चर्चा नहीं की जाती है, विशेष रूप से, जो, अप्रचलित (अव्यक्त) चर पर केंद्रित हैं । उनमें से कुछ का उल्लेख है, हालांकि, एक अन्य स्रोत के संदर्भ में - आयामीता में कमी पर एक किताब।
अब, मैं संक्षेप में अपने प्रासंगिक या संबंधित उत्तरों का संदर्भ देकर विषय के कई संकीर्ण पहलुओं को कवर करूंगा। के संबंध में निकटतम पड़ोसियों (एनएन) प्रकार दृष्टिकोण उच्च आयामी डेटा के लिए, कृपया अपने जवाब को देखने के लिए यहाँ (मैं विशेष रूप से मेरी सूची में कागज # 4 की जाँच करने की सलाह देते हैं)। आयामीता के अभिशाप के प्रभावों में से एक यह है कि उच्च-आयामी डेटा अक्सर विरल होता है । इस तथ्य को ध्यान में रखते हुए, मुझे विश्वास है कि मेरी प्रासंगिक जवाब यहाँ और यहाँ पर प्रतिगमन और पीसीए के लिए विरल और उच्च आयामी डेटा उपयोगी हो सकता है।
संदर्भ
बर्जेस, सीजेसी (2010)। आयाम में कमी: एक निर्देशित दौरे। मशीन लर्निंग में नींव और रुझान®, 2 (4), 275-365। डोई: 10.1561 / +२२०००००००२