यह GPU के भौतिक प्रोसेसर (PP) पर वर्चुअल प्रोसेसर (VP) के संरेखण की समस्या है। चूंकि पीपी की संख्या अक्सर 2 की शक्ति होती है, इसलिए 2 की शक्ति से अलग वीपी की संख्या का उपयोग करने से खराब प्रदर्शन होता है।
आप पीपी की संख्या के स्लाइस के ढेर के रूप में पीपी पर वीपी की मैपिंग देख सकते हैं ।
कहते हैं कि आपको 16 पीपी मिले हैं।
आप उन पर 16 वीपी मैप कर सकते हैं: 1 वीपी 1 पीपी पर मैप किया गया है।
आप उन पर 32 वीपी मैप कर सकते हैं: 16 वीपी के 2 स्लाइस, 1 पीपी 2 वीपी के लिए जिम्मेदार होंगे।
आदि निष्पादन के दौरान, प्रत्येक पीपी 1 वीपी की नौकरी को निष्पादित करेगा, जिसके लिए वह जिम्मेदार है, फिर 2 वीपी की नौकरी आदि।
यदि आप 17 वीपी का उपयोग करते हैं, तो प्रत्येक पीपी अपने 1 पीपी की नौकरी को अंजाम देगा, फिर 1 पीपी होगा 17 वीं और की नौकरी निष्पादित करेंअन्य लोग कुछ भी नहीं करेंगे (नीचे दिए गए)।
यह SIMD प्रतिमान ( 70 के दशक में वेक्टर कहा जाता है ) के कारण होता है जिसका उपयोग GPU द्वारा किया जाता है। इसे अक्सर डेटा समानांतरवाद कहा जाता है: सभी पीपी एक ही समय में एक ही काम करते हैं लेकिन अलग-अलग डेटा पर। Https://en.wikipedia.org/wiki/SIMD देखें ।
अधिक सटीक रूप से, 17 वीपी के साथ उदाहरण में, एक बार किए गए 1 स्लाइस का काम (सभी पीपीपी अपने 1 वीपी के काम को पूरा करके), सभी पीपी एक ही काम करेंगे (2 वें वीपी), लेकिन केवल एक में कुछ है पर काम करने के लिए डेटा ।
सीखने से कोई लेना-देना नहीं। यह केवल प्रोग्रामिंग सामान है।