स्किकिट-लर्न पर अधिकांश अनुमानकों में, समानांतर नौकरियों का उपयोग करने के लिए / विधियों n_jobs
में एक पैरामीटर है । मैंने देखा कि सिर्फ 1 पायथन प्रक्रिया बनाने के लिए इसे स्थापित करने और कोर को अधिकतम किया गया, जिससे सीपीयू का उपयोग शीर्ष पर 2500% तक पहुंच गया। यह इसे कुछ सकारात्मक पूर्णांक> 1 पर सेट करने से काफी अलग है, जो ~ 100% उपयोग पर कई पायथन प्रक्रियाएं बनाता है।fit
predict
joblib
-1
यह बहु-सीपीयू लिनक्स सर्वर पर सीपीयू और कोर उपयोग को कैसे प्रभावित करता है? (जैसे अगर n_jobs=8
तब 8 सीपीयू पूरी तरह से बंद हैं या सीपीयू अभी भी अन्य कार्यों / प्रक्रियाओं के लिए कुछ कोर आरक्षित करते हैं?)
इसके अतिरिक्त, मैं बड़े डेटासेट के लिए MemoryError
कभी-कभी मिलता हूं n_jobs=-1
। हालाँकि, स्मृति उपयोग आमतौर पर एकल पायथन प्रक्रिया के लिए लगभग 30-40% पर होता है। मान के आधार पर डेटा और मेमोरी को कैसे प्रबंधित / कॉपी किया जा रहा है n_jobs
?