आप जो कुछ भी करते हैं, एक सेलुलर ऑटोमोबाटन के लिए अगले राज्य की गणना करने के लिए ऑटोमोबाइल में सेल की तुलना में अधिक गणना होती है। इस प्रकार एक निरंतर समय प्राप्त करने के लिए, आपको कई कंप्यूटिंग कोर की आवश्यकता होती है क्योंकि कोशिकाएं होती हैं।
GPU में इनकी संख्या वर्तमान में अधिकांश हजारों में है, जबकि अगले राज्य की गणना इतनी सरल है कि मैं उम्मीद करता हूं कि परिणाम IO से बंधे होंगे, यानी आप सिर्फ विचार करके समय की एक बहुत अच्छा अनुमान प्राप्त कर सकते हैं। डेटा आंदोलन की आवश्यकता (और यदि यह एक अच्छा सन्निकटन नहीं है, तो या तो कार्यान्वयन में अक्षमता है या वास्तुकला उपयुक्त नहीं है, लेकिन यह बहुत आश्चर्यजनक होगा)।
FPGA के लिए, प्रश्न अधिक कठिन है और संभवतया उपलब्ध स्मृति और संगणना इकाइयों के मिश्रण पर निर्भर करेगा। यदि मैं बहुत दूर नहीं हूं, तो आपके पास सभी इकाइयों को व्यस्त रखने के लिए पर्याप्त मेमोरी नहीं होगी और यदि आप बाहरी मेमोरी पर भरोसा करते हैं, तो आप GPU के रूप में एक ही सीट पर हैं, मेमोरी बैंडविड्थ सीमित कारक होगा और मैं नहीं करूंगा आश्चर्य होगा कि निष्कर्ष यह है कि GPU पर कोई लाभ नहीं है। (ध्यान दें कि जब मैंने FPGA के साथ काम किया है, तो यह वर्षों पहले था, अब एक सही मिश्रण के साथ FPGA मॉडल हो सकते हैं)।
ASIC अधिक लचीलापन प्रदान करता है। आप आसानी से कार्यान्वयन की तरह एक सिस्टोलिक हो सकते हैं (लेकिन द्विदिश डेटा प्रवाह के साथ, कुछ सिस्टोलिक आमतौर पर यूनिडायरेक्शनल डेटा प्रवाह तक सीमित है), प्रत्येक भौतिक सेल एक तार्किक है: स्मृति का थोड़ा सा और अगले राज्य की गणना करने के लिए आवश्यक तर्क और बाहर रखा गया है ताकि यह भौतिक पड़ोसी हो, यह तार्किक है। आप स्पष्ट रूप से निरंतर समय के दायरे में हैं। आपके पास जो कठिन मैक्रोज़ हैं, उसके आधार पर, आप कम स्पष्ट होने के लिए बेहतर हो सकते हैं और भौतिक कोशिकाएं होती हैं जो कई तार्किक को फिर से इकट्ठा करती हैं। लक्ष्य यह है कि एक चिप में क्या किया जाए, दूसरे शब्द में चिप के बाहर के साथ संचार को कम से कम करने के लिए जैसे ही आपकी संचार की आवश्यकता कोशिकाओं की संख्या के लिए आनुपातिक है, आप बैंडविड्थ सीमित होंगे। हां, इसका मतलब है कि यदि आपको प्रत्येक चरण के लिए सभी कोशिकाओं को देखने की आवश्यकता है, आप शायद GPU से बहुत बेहतर नहीं हैं। (पूर्ण कस्टम केवल बेहतर एकीकरण प्रदान करेगा, अर्थात प्रति चिप अधिक सेल)।
सारांश: - यदि आप सभी मध्यवर्ती राज्यों को देखना चाहते हैं, तो GPU सबसे प्रभावी दृष्टिकोण है - यदि आप नहीं करते हैं, तो आपको कुछ बेहतर करने के लिए ASIC को सही ठहराने के लिए वॉल्यूम की आवश्यकता है, FPGA शायद पर्याप्त लाभ प्रदान नहीं करेगा यदि वे कोई भी।