जहाँ तक मुझे पता है, दोनों ऑटोएन्कोडर्स और टी-एसएनई का उपयोग नॉनलाइनियर डायनेमिटी में कमी के लिए किया जाता है। उनके बीच क्या अंतर हैं और मुझे एक बनाम दूसरे का उपयोग क्यों करना चाहिए?
जहाँ तक मुझे पता है, दोनों ऑटोएन्कोडर्स और टी-एसएनई का उपयोग नॉनलाइनियर डायनेमिटी में कमी के लिए किया जाता है। उनके बीच क्या अंतर हैं और मुझे एक बनाम दूसरे का उपयोग क्यों करना चाहिए?
जवाबों:
वे दोनों आपके डेटा के निचले आयाम को खोजने की कोशिश करते हैं। हालांकि, अलग-अलग न्यूनतम समस्याएं हैं। अधिक विशेष रूप से, एक ऑटोकेनोडर पुनर्निर्माण त्रुटि को कम करने की कोशिश करता है, जबकि टी-एसएनई एक कम आयामी स्थान खोजने की कोशिश करता है और साथ ही साथ यह पड़ोस की दूरी को संरक्षित करने की कोशिश करता है। इस विशेषता के परिणामस्वरूप, टी-एसएनई को आमतौर पर भूखंडों और विज़ुअलाइज़ेशन के लिए पसंद किया जाता है।
[Autoencoders] मुख्य रूप से अव्यक्त स्थान में डेटा के विचरण को अधिकतम करने पर ध्यान केंद्रित करता है, जिसके परिणामस्वरूप ऑटोपेनॉडर्स कई गुना डेटा को सीखने वाले की तुलना में अव्यक्त स्थान में डेटा की स्थानीय संरचना को बनाए रखने में कम सफल होते हैं ...
"लर्निंग अ पैरामीट्रिक एंबेडिंग बाय प्रिजर्विंग लोकल स्ट्रक्चर", लॉरेन्स वैन डेर मातेन ( https://lvdmaaten.github.io/publications/papers/AISTATS_2009.pdf )
Autoencoder और t-SNE का उपयोग उच्च आयामी डेटा में बेहतर विज़ुअलाइज़ेशन के लिए एक साथ किया जा सकता है, जैसा कि [1] में वर्णित है:
2 डी विज़ुअलाइज़ेशन के लिए विशेष रूप से, टी-एसएनई संभवतः सबसे अच्छा एल्गोरिथ्म है, लेकिन इसके लिए आमतौर पर अपेक्षाकृत कम आयामी डेटा की आवश्यकता होती है। तो हाई-डायमेंशनल डेटा में समानता रिश्तों की कल्पना करने के लिए एक अच्छी रणनीति यह है कि अपने डेटा को कम-डायमेंशनल स्पेस (जैसे 32 डायमेंशनल) में कंप्रेस करने के लिए ऑटोकेनडर का उपयोग करके शुरू करें, फिर संकुचित डेटा को 2 डी प्लेन में मैप करने के लिए टी-एसएनई का उपयोग करें। ।
[१] https://blog.keras.io/building-autoencoders-in-keras.html
Autoencoder को 2-मानक अर्थों में पिछले डेटा को संरक्षित करने के लिए डिज़ाइन किया गया है, जिसे डेटा के गतिज ऊर्जा को संरक्षित करने के रूप में सोचा जा सकता है, यदि डेटा वेग है।
जबकि टी-एसएनई, केएल डाइवर्जेंस का उपयोग करें जो सममित नहीं है, यह टी-एसएनई को स्थानीय संरचना पर अधिक ध्यान केंद्रित करेगा, जबकि ऑटोकेनोडर समग्र एल 2 त्रुटि को छोटा रखने के लिए जाता है, जो एक वैश्विक अर्थ में है।