क्या टी-स्नेन आयाम सार्थक हैं?


18

क्या t-sne एम्बेडिंग के आयामों के लिए कोई अर्थ हैं? पीसीए के साथ की तरह हमारे पास रैखिक रूप से रूपांतरित रूपांतरों की अधिकतम क्षमता है, लेकिन टी-स्ने के लिए अंतर्ज्ञान के अलावा हमारे द्वारा केपी-दूरी के मानचित्रण और न्यूनीकरण के लिए निर्धारित स्थान है?


1
यकीन नहीं होता कि यह वास्तव में आप क्या पूछ रहे हैं पर मिलता है, लेकिन मेरा मानना ​​है कि t-sne के आयाम वास्तव में केवल डेटा की विभाज्यता पर निर्भर करते हैं। आयाम समान डाटासेट को बदल सकते हैं क्योंकि यह एक गैर-रैखिक परिवर्तन है। इसलिए आयामों को वास्तव में किसी दिए गए उदाहरण के संदर्भ में व्याख्या की जा सकती है। मुझे बताएं कि क्या मैं गलत हूं, यह एक दिलचस्प सवाल है।
होब्स

शायद यह पुराने बोरिंग है it3?
नाइट्रो

जवाबों:


17

निम्न आयामी स्थान के आयामों का कोई अर्थ नहीं है। ध्यान दें कि t-SNE हानि फ़ंक्शन केवल बिंदुओं ( और ) और उन दूरी ( और ) पर संभाव्यता वितरण के बीच की दूरी पर आधारित है :yमैंyजेपीमैंजेक्षमैंजे

δसीδyमैं=4Σजे(पीमैंजे-क्षमैंजे)(yमैं-yजे)(1+||yमैं-yजे||2)-1

इस प्रकार पूरे उच्च-आयामी स्थान से निम्न-आयामी स्थान तक कोई प्रक्षेपण नहीं होता है, टी-एसएनई केवल विशिष्ट आयामों के विशिष्ट सेट से कम आयामी बिंदुओं के एक विशिष्ट सेट से मानचित्रण पाता है। चूँकि एक स्थान से दूसरे स्थान पर कोई कार्य नहीं होता है इसलिए अक्षों का कोई निहित अर्थ भी नहीं होता है।

जिन चीजों की आप इसकी कल्पना कर सकते हैं:

  • हाई-डायमेंशनल या लो-डायमेंशनल स्पेस को रोटेट या ट्रांसलेट करने से पॉइंट्स के बीच की दूरियां प्रभावित नहीं होती हैं। इसलिए, टी-एसएनई दोनों स्थानों में रोटेशन या अनुवाद की परवाह नहीं करता है। इस प्रकार कुल्हाड़ियों की पूर्ण व्याख्या नहीं है।
  • टी-स्टूडेंट डिस्ट्रीब्यूशन में फैट टेल होती है। यह निम्न-आयामी प्रतिनिधित्व को उन बिंदुओं में परिवर्तन के लिए अपरिवर्तनीय बनाता है जो उच्च-आयामी स्थान में दूर हैं। यह उन बिंदुओं का भी कारण बनता है जो उच्च-आयामी अंतरिक्ष में दूर हैं या तो बहुत दूर की दूरी पर या कम आयामी स्थान में वास्तव में बहुत दूर हो सकते हैं। इस अर्थ में यह निम्न-आयामी कुल्हाड़ियों के कुछ हिस्सों (किसी भी मनमानी दिशा में) को फैलाता है।

कहा जा रहा है कि, टी-एसएनई मुख्य रूप से एक दृश्य तकनीक है और अन्य उद्देश्य के लिए इसकी आयाम में कमी प्रभावशीलता स्पष्ट नहीं है (शायद क्लस्टरिंग, सुविधा निष्कर्षण या सुविधा चयन के लिए उपयुक्त नहीं है)।

इसके अलावा: कागज

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.