मैं 200 आयामों ( doc2vec) के साथ लगभग 1 मिलियन वैक्टर पर आयामी कटौती करना चाहूंगा । मैं इसके लिए मॉड्यूल TSNEसे कार्यान्वयन का उपयोग कर रहा हूं sklearn.manifoldऔर प्रमुख समस्या समय जटिलता है। यहां तक कि method = barnes_hut, संगणना की गति अभी भी कम है। कुछ समय के लिए भी यह मेमोरी से बाहर चला जाता है।
मैं इसे 130G रैम के साथ 48 कोर प्रोसेसर पर चला रहा हूं। क्या यह प्रक्रिया को गति देने के लिए इसे समानांतर रूप से चलाने या बहुतायत संसाधन का उपयोग करने की एक विधि है।