टी-एसएनई लागू करने से पहले क्या डेटा को केंद्रित किया जाना चाहिए?

मेरे डेटा की कुछ विशेषताओं में बड़े मूल्य हैं, जबकि अन्य सुविधाओं में बहुत छोटे मूल्य हैं।

क्या बड़े मूल्यों के प्रति पूर्वाग्रह को रोकने के लिए t-SNE लगाने से पहले + स्केल डेटा को केंद्र में रखना आवश्यक है?

मैं डिफ़ॉल्ट यूक्लिडियन दूरी मीट्रिक के साथ पायथन के sklearn.manifold.TSNE कार्यान्वयन का उपयोग करता हूं।

— stmax
स्रोत

एल्गोरिथ्म के बाद से कोई फर्क नहीं पड़ता क्योंकि एल्गोरिदम केवल बिंदुओं के बीच की दूरी पर संचालित होता है, हालांकि यदि आप चाहते हैं कि विभिन्न आयामों को समान महत्व के साथ व्यवहार किया जाए, क्योंकि 2-मानदंड बड़े विचरण वाले आयामों से अधिक प्रभावित होंगे।

— jon_simon
स्रोत