दो आयामी विमान में उच्च आयामी स्थान कैसे प्रोजेक्ट करें?


11

मेरे पास एन-डायमेंशनल स्पेस में डेटा पॉइंट्स का एक सेट है। इसके अलावा, मैं भी इसी एन-आयामी अंतरिक्ष में एक केन्द्रक है। क्या कोई दृष्टिकोण है जो मुझे मूल स्थान में उनके सापेक्ष दूरी की जानकारी रखते हुए इन डेटा बिंदुओं को दो-आयामी स्थान में प्रोजेक्ट करने की अनुमति दे सकता है। क्या पीसीए सही है?


1
यदि आप दूरियों को संरक्षित करने का प्रयास करना चाहते हैं, तो मेरा पहला विचार खुद दूरियों (जो पीसीए से संबंधित है) पर बहुआयामी स्केलिंग होगा, लेकिन चूंकि आपके पास स्थान हैं और न केवल दूरी, मेरी समझ से, पीसीए के लिए काम करना चाहिए ।
Glen_b -Reinstate मोनिका

1
@Glen_b, प्रमुख मुद्दा है कि एमडीएस दूरी इनपुट के लिए है और पीसीए निर्देशांक इनपुट के लिए है, लेकिन नहीं है कि पुनरावृत्ति फिट कुछ आयाम एमडीएस पीसीए कुछ आयामों को बरकरार रखे हुए है। इसलिए एमडीएस क्लासिक पीसीए की तुलना में कुछ हद तक दूरी बनाए रखता है। प्रश्न का उत्तर हां है, पीसीए उपयुक्त है, लेकिन एमडीएस अधिक उपयुक्त है।
tnnphns

1
यह काफी हद तक मीट्रिक स्पेस एम्बेडिंग के क्षेत्र में अध्ययन किया जाता है , यानी आप दूरी के विरूपण को कम करते हुए अपने डेटा की गतिशीलता को कैसे कम कर सकते हैं।
बिटवाइज

जवाबों:


6

एक सामान्य ढांचा जो आपकी समस्या को संबोधित करता है, उसे आयामी कमी कहा जाता है। आप अपने डेटा में "आवश्यक जानकारी" को संरक्षित करते हुए, एन आयामों से डेटा को 2 आयामों तक प्रोजेक्ट करना चाहेंगे। सबसे उपयुक्त विधि आपके डेटा के वितरण पर निर्भर करती है, अर्थात एन-आयामी कई गुना। पीसीए कम से कम वर्गों की कसौटी का उपयोग करके एक विमान को फिट करेगा। यह शायद "स्विस रोल" उदाहरण के लिए खराब काम करेगा: स्विस रोल

अधिक आधुनिक तरीकों में कर्नेल पीसीए, एलएलई, डिफ्यूजन मैप्स और स्पार्स डिक्शनरी रिप्रेजेंटेशन शामिल हैं। दूरी के संरक्षण के संबंध में, कुछ तरीके गैर-यूक्लिडियन दूरी को संरक्षित कर सकते हैं।


2
यह ध्यान रखना महत्वपूर्ण है कि "आयामी कमी" विधियां आमतौर पर "सापेक्ष दूरी की जानकारी" को बनाए नहीं रखती हैं। चाहे वे आंशिक रूप से विधि पर और आंशिक रूप से "दूरी" पर निर्भर करते हैं या नहीं।
whuber

2

जैसा कि पिछले उत्तर में बताया गया है, आयामीता में कमी के कई तरीके हैं, और एक महत्वपूर्ण बात यह है कि आप क्या प्रतिनिधित्व करने की कोशिश कर रहे हैं - क्या आप यूक्लिडियन दूरी के उपायों में रुचि रखते हैं? या नमूनों में समानता का एक मीट्रिक?

पूर्व के लिए, पीसीए उपयुक्त हो सकता है। यह आमतौर पर नमूनों (जानवरों, पौधों, आदि ...) के माप जैसे निरंतर उपायों के साथ प्रयोग किया जाता है। मैं हालांकि पहले के उत्तर में और अधिक आधुनिक उल्लेखों पर गौर करूंगा।

उत्तरार्द्ध के लिए, जहां आप गैर-यूक्लिडियन दूरी मीट्रिक का उपयोग करके समानता की तुलना करने की कोशिश कर रहे होंगे, कुछ अच्छे तरीके मौजूद हैं जैसे सिद्धांत अवयव आयुध (पीसीओए) और गैर-मीट्रिक बहु-आयामी स्केलिंग (एनएमडीएस)। आप इनका उपयोग कब कर सकते हैं इसका एक उदाहरण है जब आप विभिन्न क्षेत्रों के बीच पारिस्थितिक समुदायों की तुलना कर रहे हैं, और आपके पास विभिन्न प्रकार के जीवों की संख्या है जो पाए गए थे। तो, आपका डेटा "गणना" डेटा है। जैकार्ड, सोरेनसेन, ब्रे-कर्टिस जैसे कई समानता वाले मैट्रिक्स हैं, जो प्रभावी रूप से आपको अनुमान लगाते हैं कि जीवों की संरचना में साइटें कितनी समान हैं। पीसीओए और एनएमडीएस मूल रूप से आपको पारिस्थितिक दूरी (समानता) का प्रतिनिधित्व करने के लिए नमूनों (साइटों) की साजिश करने देते हैं, और आपके पास प्रत्येक अक्ष पर साइट के लिए एक स्कोर है।

बहुभिन्नरूपी विश्लेषण के लिए बहुत सारी अच्छी किताबें और अन्य संसाधन हैं। Google पर "आयुध" की खोज करें। इसके अलावा, 'शाकाहारी' नामक एक आर पैकेज है जो वास्तव में इस काम का एक बहुत कुछ करने के लिए अच्छा है।


0

आपकी समस्या बहुआयामी स्केलिंग के लिए एक पाठ्य-पुस्तक अनुप्रयोग की तरह लगती है । एक अच्छा परिचय यहाँ पाया जा सकता है: http://www.mathpsyc.uni-bonn.de/doc/delbeke/delbeke.htm

बेशक आप पीसीए की कोशिश कर सकते हैं। लेकिन पीसीए का मूल अंतरिक्ष में सापेक्ष दूरी की जानकारी रखने का कोई इरादा नहीं है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.