मैं 200 आयामों ( doc2vec
) के साथ लगभग 1 मिलियन वैक्टर पर आयामी कटौती करना चाहूंगा । मैं इसके लिए मॉड्यूल TSNE
से कार्यान्वयन का उपयोग कर रहा हूं sklearn.manifold
और प्रमुख समस्या समय जटिलता है। यहां तक कि method = barnes_hut
, संगणना की गति अभी भी कम है। कुछ समय के लिए भी यह मेमोरी से बाहर चला जाता है।
मैं इसे 130G रैम के साथ 48 कोर प्रोसेसर पर चला रहा हूं। क्या यह प्रक्रिया को गति देने के लिए इसे समानांतर रूप से चलाने या बहुतायत संसाधन का उपयोग करने की एक विधि है।