संक्षेप में, प्रदर्शन कारण हैं कि वे प्रोग्राम करने योग्य क्यों नहीं हैं।
इतिहास और बाजार
अतीत में, फूला हुआ एफपीयू डिजाइनों से बचने के लिए शीर्ष और टुकड़ा प्रोसेसर के लिए अलग-अलग कोर हुआ करते थे। कुछ गणितीय ऑपरेशन थे जो आप केवल उदाहरण के लिए टुकड़ा shader कोड में कर सकते हैं (क्योंकि वे केवल खंड shaders के लिए प्रासंगिक थे)। यह उन अनुप्रयोगों के लिए गंभीर हार्डवेयर बाधाओं का उत्पादन करेगा जो प्रत्येक प्रकार के कोर की क्षमता को अधिकतम नहीं करते हैं।
जैसे-जैसे प्रोग्राम योग्य शेड अधिक लोकप्रिय होते गए, सार्वभौमिक इकाइयों को पेश किया गया। स्केलिंग की मदद के लिए हार्डवेयर में ग्राफिक्स पाइपलाइन के अधिक से अधिक चरणों को लागू किया गया था। इस समय के दौरान, GPGPU भी अधिक लोकप्रिय हो गया, इसलिए विक्रेताओं को इस कार्यक्षमता में से कुछ को शामिल करना पड़ा। हालांकि यह नोट करना महत्वपूर्ण है कि GPUs से आय का अधिकांश हिस्सा अभी भी वीडियो गेम था, इसलिए यह प्रदर्शन में हस्तक्षेप नहीं कर सकता था।
आखिरकार एक बड़े खिलाड़ी, इंटेल ने अपने लार्बी आर्किटेक्चर के साथ प्रोग्राम करने योग्य रैस्टर में निवेश करने का फैसला किया । यह परियोजना जमीनी स्तर की थी, लेकिन प्रदर्शन स्पष्ट रूप से वांछित से कम था । इसे बंद कर दिया गया था, और इसके कुछ हिस्सों को एक्सोन फी प्रोसेसर के लिए उतारा गया था। हालांकि यह ध्यान देने योग्य है कि अन्य विक्रेताओं ने इसे लागू नहीं किया है।
सॉफ्टवेयर Rasterizers पर प्रयास
सॉफ्टवेयर के माध्यम से रेखांकन पर कुछ प्रयास हुए हैं, लेकिन वे सभी प्रदर्शन के साथ समस्याएँ हैं।
इस पत्र में 2011 में एनवीडिया द्वारा एक उल्लेखनीय प्रयास किया गया था । यह तब जारी किया गया था जब लारबी को समाप्त कर दिया गया था, इसलिए यह बहुत संभव है कि यह उस पर प्रतिक्रिया थी। इसके बावजूद, इसमें कुछ प्रदर्शन आंकड़े हैं, और उनमें से अधिकांश हार्डवेयर रैस्टरएज़र की तुलना में कई बार धीमी गति से प्रदर्शन करते हैं।
सॉफ्टवेयर रेखांकन के साथ तकनीकी मुद्दे
कई मुद्दे हैं जो एनवीडिया पेपर में सामना किए गए थे। हालांकि सॉफ्टवेयर rasterizers के साथ सबसे महत्वपूर्ण मुद्दों में से कुछ हैं:
प्रमुख मुद्दों
प्रक्षेप:
हार्डवेयर कार्यान्वयन विशेष हार्डवेयर में प्रक्षेप समीकरण उत्पन्न करता है। यह सॉफ्टवेयर रेंडरर के लिए धीमा है क्योंकि यह टुकड़ा shader में किया जाना था।
एंटी-अलियासिंग:
एंटी-अलियासिंग (विशेषकर मेमोरी के साथ) के साथ प्रदर्शन के मुद्दे भी थे। उप-पिक्सेल नमूनों से संबंधित जानकारी को ऑन-चिप मेमोरी में संग्रहीत किया जाना चाहिए, जो इसे धारण करने के लिए पर्याप्त नहीं है। जूलियन गुर्टॉल्ट ने बताया कि बनावट कैश / कैश सॉफ्टवेयर के साथ धीमी हो सकती है। MSAA निश्चित रूप से यहाँ समस्या है क्योंकि यह कैश (गैर-बनावट कैश) को ओवरफ्लो करता है और चिप से मेमोरी में चला जाता है। Rasterizers उस मेमोरी में संग्रहीत डेटा को संपीड़ित करता है, जो यहां प्रदर्शन के साथ भी मदद करता है।
बिजली की खपत:
साइमन एफ ने बताया कि बिजली की खपत कम होगी। कागज ने उल्लेख किया कि कस्टम एएलयू रैस्टराइज़र (जो बिजली की खपत को कम करेगा) में हैं, और इसका मतलब यह होगा कि अतीत में टुकड़े टुकड़े और वर्टेक्स प्रोसेसिंग यूनिट्स में कस्टम इंस्ट्रक्शंस सेट (इसलिए संभावित कस्टम एएलयू के रूप में अच्छी तरह से) होते थे। यह निश्चित रूप से कई प्रणालियों (जैसे, मोबाइल) में एक अड़चन होगी, हालांकि इसके प्रदर्शन से परे निहितार्थ हैं।
सारांश
TL; DR: बहुत सारी अक्षमताएं हैं जो सॉफ्टवेयर रेंडरिंग को अतीत नहीं कर सकती हैं, और ये चीजें जोड़ देती हैं। कई बड़ी सीमाएं भी हैं, खासकर जब आप वीआरएएम बैंडविड्थ, सिंक्रनाइज़ेशन समस्याओं और अतिरिक्त संगणनाओं से निपट रहे हैं।