टी-डिस्ट्रिब्यूटेड स्टॉचस्टिक नेबर एंबेडिंग (टी-एसएनई) आयामीता में कमी के लिए एक ( पुरस्कार विजेता ) तकनीक है जो विशेष रूप से उच्च-आयामी डेटासेट के विज़ुअलाइज़ेशन के लिए अनुकूल है।
तो यह बहुत अच्छा लगता है, लेकिन यह लेखक की बात कर रहा है।
लेखक का एक और उद्धरण (पुन: उपरोक्त प्रतियोगिता):
आपने इस प्रतियोगिता से क्या लिया है?
डेटा पर भविष्यवाणियों को प्रशिक्षित करने से पहले, हमेशा अपने डेटा की कल्पना करें! अक्सर, विज़ुअलाइज़ेशन जैसे कि मैंने जो डेटा बनाया है वह डेटा वितरण में अंतर्दृष्टि प्रदान करता है जो आपको यह निर्धारित करने में मदद कर सकता है कि किस प्रकार के भविष्यवाणी मॉडल का प्रयास करें।
सूचना 1 खो जाना चाहिए - यह एक आयामी कमी तकनीक है। हालाँकि, जब यह कल्पना करने के लिए उपयोग करने के लिए एक अच्छी तकनीक है, तो खोई गई जानकारी उजागर (/ 2 या 3 आयामों में कमी के माध्यम से दिखाई / समझ में आने योग्य) की तुलना में कम मूल्यवान है।
तो मेरा सवाल है:
- जब tSNE नौकरी के लिए गलत उपकरण है?
- किस प्रकार के डेटासेट इसके कारण कार्य नहीं करते हैं,
- यह किस तरह के सवालों के जवाब की तरह दिखता है, लेकिन यह वास्तव में नहीं हो सकता है?
- ऊपर दिए गए दूसरे उद्धरण में हमेशा अपने डेटासेट की कल्पना करने की सिफारिश की जाती है, क्या यह दृश्य हमेशा tSNE के साथ होना चाहिए?
मुझे उम्मीद है कि इस सवाल का उत्तर सबसे अच्छा हो सकता है, अर्थात उत्तर में: जब tSNE नौकरी के लिए सही उपकरण है?
मुझे सावधान किया गया है कि tSNE पर भरोसा न करने के लिए मुझे बताएं कि डेटा कितना आसान वर्गीकृत किया जाएगा (वर्गों में अलग - एक भेदभावपूर्ण मॉडल) यह भ्रामक होने का उदाहरण था, कि नीचे की दो छवियों के लिए, एक सामान्य मॉडल 2 बदतर था पहले / बाएं (सटीकता 53.6%) में दूसरे / दाएं (सटीकता 67.2%) के बराबर डेटा की कल्पना के लिए।
1 मैं इस बारे में गलत हो सकता हूं कि मैं बैठ सकता हूं और बाद में एक सबूत / काउंटर उदाहरण पर कोशिश कर सकता हूं
2 ध्यान दें कि एक जेनेरिक मॉडल एक भेदभावपूर्ण मॉडल के समान नहीं है, लेकिन यह वह उदाहरण है जो मुझे दिया गया था।