t-SNE बनाम MDS


21

टी-एसएनई ( टी-डिस्ट्रिब्यूटेड स्टोचैस्टिक पड़ोसी एंबेडिंग ) के बारे में कुछ प्रश्न पढ़े हैं , और हाल ही में एमडीएस ( बहुआयामी स्केलिंग ) के बारे में कुछ प्रश्नों का भी दौरा किया ।

वे अक्सर समान रूप से उपयोग किए जाते हैं, इसलिए ऐसा लग रहा था कि यह एक अच्छा विचार है इस प्रश्न को देखते हुए दोनों अलग-अलग (या पीसीए की तुलना में ) यहां कई प्रश्न हैं।


संक्षेप में, टी-एसएनई और एमडीएस को क्या अलग बनाता है? जैसे। डेटा पदानुक्रम की वे कौन सी बारीकियों का पता लगाते हैं, विभिन्न मान्यताओं आदि।

अभिसरण की दर? क्या गुठली के उपयोग के बारे में, दोनों अनुपालन करते हैं?

जवाबों:


19

PCA, N डेटा के eigenanalysis द्वारा प्रभावशाली आयामों का चयन करता है, जबकि MDS एक जोड़ीदार दूरी मैट्रिक्स के डेटा बिंदुओं के eigenanalysis द्वारा प्रभावशाली आयामों का चयन करता है । यह वितरण में एकरूपता से विचलन को उजागर करने का प्रभाव है। दूरी मैट्रिक्स को तनाव टेंसर के अनुरूप मानते हुए, एमडीएस को "बल-निर्देशित" लेआउट एल्गोरिथ्म माना जा सकता है, जिसका निष्पादन जटिलता जहां । एन2हे(एन)3<4

टी-एसएनई, दूसरी तरफ, बल-निर्देशित लेआउट के कुछ अलग रूप को अंजाम देने के लिए एक फ़ील्ड सन्निकटन का उपयोग करता है, आमतौर पर बार्न्स-हट के माध्यम से जो एक ग्रेड-आधारित जटिलता को घटाता है to , लेकिन अभिसरण गुण इस पुनरावृत्त स्टोकेस्टिक सन्निकटन विधि (मेरे ज्ञान के सर्वोत्तम) के लिए कम अच्छी तरह से समझे जाते हैं, और लिए ठेठ मनाया गया रन-टाइम आम तौर पर होता है अन्य आयाम-घटाने के तरीकों की तुलना में लंबे समय तक। परिणाम अक्सर भोले eigenanalysis की तुलना में अधिक स्पष्ट रूप से व्याख्या करने योग्य होते हैं, और वितरण के आधार पर, अक्सर एमडीएस परिणामों की तुलना में अधिक सहज होते हैं, जो कि टी-एसएनई द्वारा बनाए गए स्थानीय संरचना की कीमत पर वैश्विक संरचना को संरक्षित करते हैं।हे(एन2)हे(एनलॉग(एन))24

एमडीएस पहले से ही कर्नेल पीसीए का एक सरलीकरण है, और वैकल्पिक कर्नेल के साथ एक्स्टेंसिबल होना चाहिए, जबकि कर्नेल टी-एसएनई को गिलब्रेक्ट, हैमर, शुल्ज, मोकोबेल, ल्युक्स अल अल द्वारा काम में वर्णित किया गया है। मैं व्यावहारिक रूप से इससे परिचित नहीं हूं, लेकिन शायद एक और प्रतिवादी हो सकता है।

मैं संदर्भ लक्ष्य के आधार पर एमडीएस और टी-एसएनई के बीच चयन करता हूं। जो भी उस संरचना को स्पष्ट करता है जिसे मैं हाइलाइट करने में दिलचस्पी रखता हूं, जो भी संरचना में अधिक से अधिक व्याख्यात्मक शक्ति है, वह है एल्गोरिथ्म जिसका मैं उपयोग करता हूं। इसे एक ख़तरा माना जा सकता है, क्योंकि यह शोधकर्ता की स्वतंत्रता का एक रूप है। लेकिन बुद्धिमानी से इस्तेमाल की गई आजादी इतनी बुरी चीज नहीं है।


बहुत ही रोचक! क्या मैं आपसे MDS की व्याख्या "बल-निर्देशित" लेआउट एल्गोरिथ्म के रूप में कर सकता हूँ और यह कैसे अलग है, इस अर्थ में, t-SNE?
गरिनी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.