पीसीए, आईसीए और लाप्लासियन ईगेनमैप्स


11

सवाल

मुझे लाप्लासियन ईजेनमैप विधि में बहुत दिलचस्पी है। वर्तमान में, मैं इसका उपयोग अपने मेडिकल डेटा सेट पर आयाम में कमी करने के लिए कर रहा हूं।

हालांकि, मैं विधि का उपयोग कर एक समस्या में चला गया हूं।

उदाहरण के लिए, मेरे पास कुछ डेटा (स्पेक्ट्रा सिग्नल) हैं, और मैं कुछ पीसी (या आईसीएस) प्राप्त करने के लिए पीसीए (या आईसीए) का उपयोग कर सकता हूं। समस्या यह है कि LE का उपयोग करके मूल डेटा के समान आयाम कम किए गए घटकों को कैसे प्राप्त किया जाए?

लाप्लासियन ईजेनैप्स विधि के अनुसार, हमें सामान्यीकृत आइगेनवेल्यू समस्या को हल करने की आवश्यकता है, जो है

Ly=λDy

यहाँ eigenvector है। अगर मैं उदाहरण के लिए शीर्ष 3 eigenvectors (3 eigenvalues ​​के अनुसार समाधान) की साजिश करता हूं, तो परिणाम व्याख्या योग्य नहीं हैं।y

हालांकि, जब मैं शीर्ष 3 पीसी और शीर्ष 3 आईसी की साजिश रचता हूं, तो परिणाम हमेशा स्पष्ट (नेत्रहीन) मूल डेटा प्रतिनिधित्व करते हैं ।x

मुझे लगता है कि इसका कारण यह है कि मैट्रिक्स को वेट मैट्रिक्स (एडजेंसी मैट्रिक्स ) द्वारा परिभाषित किया गया है , और डेटा को बनाने के लिए हीट कर्नेल के साथ फिट किया गया है , जो एक घातीय फ़ंक्शन का उपयोग कर रहा है। मेरा सवाल है कि के कम किए गए घटकों को कैसे पुनः प्राप्त किया जाए ( मैट्रिक्स के आइजनवेक्टर नहीं )?LWxWxyL


डेटा

मेरा डेटासेट प्रतिबंधित है और समस्या को प्रदर्शित करना आसान नहीं है। यहां मैंने एक खिलौना समस्या बनाई जो यह दिखाने के लिए कि मेरा क्या मतलब है और मैं क्या पूछना चाहता हूं।

कृपया चित्र देखें,

सबसे पहले, मैं लाल वक्रों (आकृति का पहला स्तंभ) में दिखाते हुए कुछ साइन तरंगें A, B, C बनाता हूं। ए, बी और सी में 1000 नमूने हैं, दूसरे शब्दों में, 1x1000 वैक्टर में बचाया गया।

दूसरे, मैंने यादृच्छिक रूप से बनाए गए रैखिक संयोजनों, जैसे, , जिसमें यादृच्छिक मान हैं का उपयोग करके स्रोतों A, B, C को मिलाया । मिश्रित सिग्नल बहुत ही उच्च आयामी स्थान में है, उदाहरण के लिए, , 1517 को यादृच्छिक रूप से उच्च आयामी स्थान चुना जाता है। मैं ग्रीन कर्व्स (आकृति का दूसरा स्तंभ) में सिग्नल एम की केवल तीन पंक्तियों को दिखाता हूं।M=r1A+r2B+r3Cr1,r2,r3MMR1517×1000

इसके बाद, मैं आयाम घटाने के परिणाम प्राप्त करने के लिए पीसीए, आईसीए और लाप्लासियन आइगेनमैप चलाता हूं। मैंने एक निष्पक्ष तुलना करने के लिए 3 पीसी, 3 आईसी और 3 एलईएस का उपयोग करना चुना (नीली घटता क्रमशः 3, 4 के रूप में दिखाया गया है, और आंकड़े के अंतिम स्तंभ)।

पीसीए और आईसीए (3 जी, आंकड़ा का 4 वां कॉलम) के परिणामों से, हम देख सकते हैं कि हम परिणामों को कुछ आयाम में कमी के रूप में व्याख्या कर सकते हैं, अर्थात, आईसीए परिणामों के लिए, हम द्वारा मिश्रित संकेत प्राप्त कर सकते हैं (मुझे यकीन नहीं है कि हम पीसीए परिणामों के साथ भी प्राप्त कर सकते हैं लेकिन परिणाम मेरे लिए काफी सही लगता है)।M=b1IC1+b2IC2+b3IC3M=a1PC1+a2PC2+a3PC3

हालाँकि, कृपया LE के परिणामों को देखें, मैं परिणाम (आकृति के अंतिम कॉलम) की व्याख्या मुश्किल से कर सकता हूँ। यह घटे हुए घटकों के साथ कुछ 'गलत' लगता है। इसके अलावा, मैं यह उल्लेख करना चाहता हूं कि आखिरकार अंतिम कॉलम का प्लॉट eigenvector फॉर्मूलाyLy=λDy

क्या आप लोगों के पास अधिक विचार हैं?

चित्रा 1 12 निकटतम पड़ोसियों का उपयोग करता है और हीटिंग कर्नेल में सिग्मा 0.5 है: बाएं से दाएं कॉलम: मूल संकेत, मिश्रित संकेत, पीसी, आईसी, एलए

चित्रा 2 में 1000 निकटतम पड़ोसियों का उपयोग किया गया है और हीटिंग कर्नेल में सिग्मा 0.5 है: बाएं से दाएं कॉलम: मूल संकेत, मिश्रित संकेत, पीसी, आईसी, एलए

सोर्सकोड: आवश्यक पैकेज वाला मैटलैब कोड


2
X के घटे हुए घटकों से आपका क्या अभिप्राय है? क्या आपके कहने का मतलब है, x का निम्न-आयामी एम्बेडिंग?
रथी

यह दिलचस्प लगता है। क्या आप अधिक विस्तृत विवरण दे सकते हैं कि वास्तव में आपका डेटा कैसा दिखता है?
प्लासिडिया

जवाबों:


4

आपके प्रश्न का उत्तर मूल लाप्लासियन ईजेनमैप्स पेपर के पेज 6 के नीचे मैपिंग द्वारा दिया गया है :

xi(f1(i),,fm(i))

उदाहरण के लिए, एक बिंदु का एम्बेडिंग , कहते हैं, शीर्ष 2 "घटक" द्वारा दिए गए हैं जहां और दो छोटे गैर-शून्य eigenvalues ​​के अनुरूप हैं सामान्यीकृत आइगेनवैल्यू समस्या ।x5(f1(5),f2(5))f1f2Lf=λDf

ध्यान दें कि पीसीए के विपरीत, यह आउट-ऑफ-सैंपल एम्बेडिंग प्राप्त करने के लिए सीधा नहीं है। दूसरे शब्दों में, आप एक बिंदु के एम्बेडिंग को प्राप्त कर सकते हैं जो पहले से ही गणना करते समय माना जाता था , लेकिन अगर यह एक नया बिंदु है तो (आसानी से) नहीं। यदि आप बाद में करने में रुचि रखते हैं, तो इस पेपर को देखेंL


मैं इस बात को लेकर थोड़ा भ्रमित हूं कि आप अपने चरों के रूप में क्या विचार कर रहे हैं। जो मैं समझता हूं, आपके मैट्रिक्स में 1000-आयामी स्थान से 1517 नमूने हैं। जब आप इस मैट्रिक्स पर पीसीए (या आईसीए) करते हैं, तो आप भिन्नता के अंतर्निहित तरीकों को बहुत अच्छी तरह से पुनर्प्राप्त करने में सक्षम हैं: उदाहरण के लिए, अपने आंकड़ों में कॉलम 3 में, पंक्ति 1,2,3 ठिकानों के सी, ए, बी के अनुरूप हैं क्रमशः। यह समझ में आता है। हालाँकि, आपके कोड में, जब आप LEM करते हैं, तो आप ( ) पर फ़ंक्शन को कॉल करते हैं , जो उपरोक्त के अनुरूप नहीं है। MMTmixedSignal'
शांतनु

तो, पहले, मैट्रिक्स , आप चर क्या हैं और आपके अवलोकन क्या हैं? दूसरा, आपके विश्लेषण से यह प्रतीत होता है कि आप एलईएम का उपयोग करते हुए की एम्बेडिंग की तलाश में ही नहीं हैं , बल्कि पीसीए के रूप में आइजन्वेक्टर के बराबर भी हैं, है ना? आप इस एलईएम को नहीं कर सकते, कम से कम आसानी से नहीं। यह समझने के लिए यह पेपर पढ़ें । MM
शांतनु

यदि आप जो कुछ भी देख रहे हैं वह एम्बेडिंग है, तो वह आसानी से मैपिंग द्वारा दिया जाता है । विवरण के लिए मेरा जवाब देखें। अपने कोड में, रेखा 47 बदलें और इसके स्थानान्तरण के बजाय उपयोग करें ; परिणाम तब आपको अपने 1517 अंक के 3-आयामी एम्बेडिंग देगा। xi(f1(i),,fm(i))mixedSignalmappedX
शांतनु

पुनश्च: ऊपर, मेरा मतलब था "आप LEM का उपयोग करके ऐसा नहीं कर सकते , कम से कम आसानी से नहीं"।
शांतनु

2

यहां प्रो। ट्रॉसेट के वेब पेज का लिंक दिया गया है और साथ ही वह एक किताब http://mypage.iu.edu/~mtrosset/Courses/675/notes.pdf लिख रहा है जो हर हफ्ते या तो अपडेट होती रहती है। इसके अलावा लाप्लासियन ईजन मैप्स के लिए आर फ़ंक्शन दिए गए हैं। बस इसे अपने लिए आजमाएं। आप इस पत्र को बेल्किन द्वारा भी मान सकते हैं

धन्यवाद अभि प्रो स्टूडेंट ऑफ प्रो ब्रोसेट


1

पीसीए के विपरीत- लाप्लासियन ईगेनमैप्स सामान्यीकृत ईजन वैक्टर का उपयोग करता है जो सबसे छोटे आइगेनवैल्यूस के अनुरूप होता है। यह सबसे छोटे eigen मूल्य (शून्य हो सकता है) के साथ eigen वेक्टर को छोड़ देता है, और अगले कुछ सबसे छोटे eigen मूल्यों के अनुरूप eigen वैक्टर का उपयोग करता है। पीसीए कर्नेल / ग्राम मैट्रिक्स का उपयोग करके एम्बेडिंग को संरक्षित करने वाला एक अधिकतम संस्करण है। लैपलैसियन ईजेनैप्स को कम से कम करने की समस्या के रूप में पेश किया जाता है, जो कि कॉम्बीनेटरियल ग्राफ लैपलियन के संदर्भ में होता है (टरसेट द्वारा कागजात देखें)।


कृपया रुचि रखने वाले प्रत्येक व्यक्ति के पास मेरे प्रश्न पर फिर से एक नज़र है। मैंने कुछ उदाहरण रखे। बहुत बहुत धन्यवाद।
सामो जेरोम
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.