टी-एसएनई लागू करने से पहले क्या डेटा को केंद्रित किया जाना चाहिए?


18

मेरे डेटा की कुछ विशेषताओं में बड़े मूल्य हैं, जबकि अन्य सुविधाओं में बहुत छोटे मूल्य हैं।

क्या बड़े मूल्यों के प्रति पूर्वाग्रह को रोकने के लिए t-SNE लगाने से पहले + स्केल डेटा को केंद्र में रखना आवश्यक है?

मैं डिफ़ॉल्ट यूक्लिडियन दूरी मीट्रिक के साथ पायथन के sklearn.manifold.TSNE कार्यान्वयन का उपयोग करता हूं।

जवाबों:


18

एल्गोरिथ्म के बाद से कोई फर्क नहीं पड़ता क्योंकि एल्गोरिदम केवल बिंदुओं के बीच की दूरी पर संचालित होता है, हालांकि यदि आप चाहते हैं कि विभिन्न आयामों को समान महत्व के साथ व्यवहार किया जाए, क्योंकि 2-मानदंड बड़े विचरण वाले आयामों से अधिक प्रभावित होंगे।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.