एक वास्तविक GPU में, गहराई वाले बफर के एक ही क्षेत्र को पढ़ने / लिखने की कोशिश करने और उनके बीच सिंक्रनाइज़ करने का प्रयास करने के बजाय कई कोर होने के बजाय, गहराई बफर को टाइलों में विभाजित किया जाता है (जैसे कि 16 × 16 या 32 × 32), और प्रत्येक टाइल को एक ही कोर सौंपा गया है। उस कोर को उस टाइल में सभी रैस्ट्राइजेशन के लिए जिम्मेदार माना जाता है: किसी भी त्रिकोण जो उस टाइल को छूते हैं, उस टाइल को रैस्टराइज़ किया जाएगा (उस टाइल के भीतर) जिसके पास कोर है। फिर कोर के बीच कोई हस्तक्षेप नहीं है, और उनके लिए कोई आवश्यकता नहीं है जब वे फ्रेमबफ़र के अपने हिस्से तक पहुंचते हैं।
तात्पर्य यह है कि कई टाइलों को छूने वाले त्रिकोणों को कई कोर द्वारा रेखापुंजित करने की आवश्यकता होगी। तो, ज्यामिति प्रसंस्करण (कोने और त्रिकोण पर संचालन) और पिक्सेल प्रसंस्करण के बीच एक कार्य पुनर्वितरण कदम है।
ज्यामिति चरण में, प्रत्येक कोर इनपुट प्राइमेटीज़ के एक चंक को संसाधित कर सकता है; तब प्रत्येक आदिम के लिए, यह जल्दी से यह निर्धारित कर सकता है कि कौन सी टाइलें आदिम छूती हैं (इसे "मोटे रेस्ट्राइजेशन" कहा जाता है), और प्रत्येक कोर के लिए एक कतार में आदिम जोड़ें जो प्रभावित टाइलों में से एक का मालिक है।
फिर, पिक्सेल अवस्था में, प्रत्येक कोर अपनी कतार में प्राइमिटिव्स की सूची पढ़ सकता है, कोर के मालिक की टाइलों के लिए पिक्सेल कवरेज की गणना करता है, और गहराई से परीक्षण, पिक्सेल छायांकन और फ़्रेमबफ़र को अपडेट करने के लिए आगे बढ़ता है, जिसमें आगे किसी भी समन्वय की आवश्यकता नहीं होती है। अन्य कोर के साथ।