उच्च आयामी डेटा की कल्पना करना


11

मेरे पास दो वर्गों के नमूने हैं जो उच्च आयामी स्थान में वैक्टर हैं और मैं उन्हें 2 डी या 3 डी में प्लॉट करना चाहता हूं।

मैं आयामीता में कमी की तकनीकों के बारे में जानता हूं, लेकिन मुझे टूल (मैटलैब, अजगर या प्रीबील्ट .exe में) का उपयोग करने के लिए वास्तव में सरल और आसान चाहिए।

इसके अलावा मुझे आश्चर्य है कि 2 डी में प्रतिनिधित्व "सार्थक" होने जा रहा है? (उदाहरण के लिए दो वर्ग कैसे अलग हो सकते हैं या अलग हो सकते हैं)।

जवाबों:


8

आप tSNE को एक कोशिश दे सकते हैं । यह उपयोग करने के लिए बहुत सीधा है। यह मतलाब और पायथन के अलावा, ऑक्टेव के साथ काम करता है। एक मिनट के भीतर पहला प्लॉट पाने के लिए गाइड पर एक नज़र डालें ।


10

उच्च आयामी डेटा को देखने के लिए एक पूर्वनिर्मित उपकरण ggobi है । यह आपको समूहों का प्रतिनिधित्व करने के लिए बिंदुओं को रंग देता है और फिर उच्च आयामों को 2 आयामी प्रतिनिधित्व को कम करने के लिए कुछ विकल्प देता है। एक विशेष रूप से अच्छा उपकरण 2 डी भव्य दौरा है जो मूल रूप से डेटा क्लाउड को कई आयामों में घुमाता है और आपको रोटेशन के 2 डी प्रक्षेपण का एक एनीमेशन दिखाता है। जब आप दिलचस्प पैटर्न देखते हैं तो आप रोटेशन को धीमा या रोक सकते हैं।


एक बहुत अच्छा उपकरण वास्तव में, जो आर। के साथ भी काम करता है
यवेस


2

रैखिक दृष्टिकोण में कमी लाने के लिए पीसीए ( प्रिंसिपल कंपोनेंट एनालिसिस ) का उपयोग करना शास्त्रीय दृष्टिकोण होगा । अनिवार्य रूप से, यह आपके डेटा को कम-आयाम स्थान (2 डी मामले में यह केवल एक विमान है) पर संभव के रूप में डेटा के अधिक से अधिक संरक्षण करते हुए प्रोजेक्ट करता है।

पीसीए चलाने में आमतौर पर अधिकांश प्रोग्रामिंग भाषाओं में एक ही कमांड को निष्पादित करना शामिल है, इसलिए यह बहुत सरल है।

आपको यह याद रखना चाहिए कि यह संभव है कि आपके डेटा का 2 या 3 आयामों में सही प्रतिनिधित्व नहीं किया जा सकता है। पीसीए आपको स्वचालित रूप से इसका एक मात्रात्मक अनुमान देगा: यह आपको बताएगा कि परिणामी निम्न आयामी प्रतिनिधित्व द्वारा कितने प्रतिशत विचरण पकड़ा गया है। इससे आपको यह एहसास होगा कि इस सरलीकृत दृश्य को देखकर आप कितनी जानकारी खो देते हैं।




1

@ Juampa के सुझाव के अलावा आपको NeRV (नेबर रिट्रीवल विजुअलाइज़र) भी आज़माना चाहिए , जो " nonlinear डाइमेंशन रिडक्शन के लिए एक रियायती सूचना पुनर्प्राप्ति आधारित दृष्टिकोण है ", और SNE / t-SNE को NeRV के विशेष मामलों के रूप में देखा जा सकता है। NeRV के मुख्य बिंदु के एक समंजन कम करने के लिए है याद और सटीक मूल अंतरिक्ष और प्रदर्शन के बीच। NeRV को C ++ में लिखी कमांड लाइन टूल के रूप में प्रदान किया जाता है।

उनकी वेबसाइट से एक डेमो तस्वीर: बाएं परिणाम याद करने पर अधिक जोर देता है (कम "याद आती है"), जबकि दायां सटीक पर अधिक जोर देता है (कम "झूठे पड़ोसी")।

यहाँ छवि विवरण दर्ज करें


1

यदि आपको व्यावसायिक सॉफ़्टवेयर से कोई आपत्ति नहीं है, तो आप सॉफ़्टवेयर VisuMap की कोशिश कर सकते हैं जो उच्च आयामी डेटा के लिए दर्जनों रैखिक और गैर-रैखिक मैपिंग एल्गोरिदम को लागू करता है, जिसमें PCA, LDA, SMACOF, tSNE, CCA, सैमन, कोहोनन मैप, आदि जैसे तरीके शामिल हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.