यद्यपि कार्य-कुशल संस्करण को अधिक चरणों की आवश्यकता होती है, यह इस तथ्य से ऑफसेट होता है कि सक्रिय थ्रेड्स की संख्या तेजी से घट जाती है, और सभी पुनरावृत्तियों पर सक्रिय थ्रेड्स की कुल संख्या काफी कम होती है। अगर एक ताना के पास चलने के दौरान कोई सक्रिय धागा नहीं है, तो यह ताना सिर्फ निम्नलिखित बाधा को छोड़ देगा और निलंबित हो जाएगा, जिससे अन्य ताना चल सकता है। इसलिए, कम सक्रिय वॉर होने से अक्सर निष्पादन समय में भुगतान किया जा सकता है। (इसमें निहित यह है कि GPU कोड को इस तरह से डिज़ाइन करने की आवश्यकता है कि सक्रिय थ्रेड्स संभव के रूप में कुछ ताना में एक साथ पैक किए गए हैं - आप नहीं चाहते हैं कि वे बिखरे हुए हों, क्योंकि एक भी सक्रिय धागा पूरे ताना को मजबूर कर देगा। सक्रिय रहने के लिए।)
अनुभवहीन एल्गोरिथ्म में सक्रिय थ्रेड्स की संख्या पर विचार करें। लेख में चित्र 2 को देखते हुए, आप यह है कि सभी धागे सक्रिय हैं देख सकते हैं को छोड़कर पहले 2 के लिए कश्मीर पर कश्मीर वें यात्रा। तो एन थ्रेड्स के साथ , सक्रिय थ्रेड्स की संख्या N - 2 k की तरह हो जाती है । उदाहरण के लिए, N = 1024 के साथ, प्रति थ्रेड सक्रिय सक्रियणों की संख्या है:
1023, 1022, 1020, 1016, 1008, 992, 960, 896, 768, 512
यदि मैं इसे सक्रिय वारों की संख्या में परिवर्तित कर देता हूँ (32 से भाग देकर और ऊपर करके), मुझे मिलता है:
32, 32, 32, 32, 32, 31, 30, 28, 24, 16
289 की राशि के लिए। दूसरी ओर, कार्य-कुशल एल्गोरिथ्म आधे धागे के साथ शुरू होता है, फिर यह प्रत्येक पुनरावृत्ति पर सक्रिय लोगों की संख्या को आधा कर देता है जब तक कि यह 1 से नीचे नहीं हो जाता है, तब तक दोहरीकरण शुरू हो जाता है जब तक कि यह वापस नहीं उठता है आधा सरणी आकार फिर से:
512, 256, 128, 64, 32, 16, 8, 4, 2, 1, 2, 4, 8, 16, 32, 64, 128, 256, 512
इसे सक्रिय युद्ध में परिवर्तित करना:
16, 8, 4, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 4, 8, 16
योग 71 है, जो कि केवल एक चौथाई है। तो आप देख सकते हैं कि पूरे ऑपरेशन के दौरान, कार्य-कुशल एल्गोरिदम के साथ सक्रिय वॉर की संख्या बहुत कम है। (वास्तव में, बीच में एक लंबे समय तक चलने के लिए केवल एक मुट्ठी भर सक्रिय युद्ध हैं, जिसका अर्थ है कि अधिकांश चिप पर कब्जा नहीं किया गया है। यदि अतिरिक्त कम्प्यूट कार्य चल रहे हैं, जैसे कि अन्य सीयूडीए धाराओं से, वे भरने के लिए विस्तार कर सकते हैं। खाली जगह।)