जब मैं CUDA डेटा ट्रांसफ़र के लिए पिन किए गए मेमोरी का उपयोग करता हूं, तो डेटा ट्रांसफर में पर्याप्त स्पीडअप का निरीक्षण करता हूं। Linux पर, इसे प्राप्त करने के लिए अंतर्निहित सिस्टम कॉल mlock है। प्लॉक के मैन पेज से, यह कहा गया है कि पेज को लॉक करने से इसे स्वैप होने से रोकता है:
आलिंगन शुरू करने और लेन बाइट्स के लिए जारी रखने की सीमा में mlock () पेजों को लॉक करता है। सभी पृष्ठ जिनमें निर्दिष्ट पता सीमा का एक हिस्सा होता है, कॉल के सफलतापूर्वक वापस आने पर RAM में निवासी होने की गारंटी दी जाती है;
मेरे परीक्षणों में, मैंने अपने सिस्टम पर मुफ्त मेमोरी के कुछ गिग्स लिए थे, इसलिए कभी कोई जोखिम नहीं था कि मेमोरी पेजों की अदला-बदली हो सकती थी फिर भी मैंने स्पीडअप का अवलोकन किया। क्या कोई समझा सकता है कि वास्तव में यहाँ क्या हो रहा है ?, किसी भी जानकारी या जानकारी की बहुत सराहना की जाती है।