सीपीयू द्वारा पूरी तरह से खिलाया गया एक GPU बनाने के लिए क्या आवश्यक है?
उनकी फ्लॉप्स की तुलना करना काफी है?
उदाहरण के लिए, अगर मैं Nvidia-Fermi GPU में से एक के साथ एक बहुत पुराना (पेंटियम -3) CPU बनाने का प्रबंधन कर सकता हूं, तो यह प्रति सेकंड डेटा के साथ gpu को खिलाया नहीं जा सकेगा। ओपनसीएल या कुछ इसी तरह के काम की आवश्यकता होने पर सीपीयू को सीपीयू में फिट करने के लिए क्या मापदंड है?
बेशक RAM और BUS को समान तरीके से चुना जाएगा लेकिन वास्तव में कैसे?
मान लें कि प्रत्येक GPU-core एक sqrt और एक विभाजन और प्रत्येक पुनरावृत्ति के लिए 100 बार जोड़ने की गणना करेगा।
धन्यवाद।
संपादित करें: वर्षों से opencl के साथ काम करने के बाद, ऐसा लगता है कि यह ज्यादातर एल्गोरिथ्म पर निर्भर करता है, फिर संचार अनुकूलन (रीड / राइट या मैप / अनमैप) और जीपस पीक गणना मूल्यों और एक ही स्लाइस पर रीड + राइट + कंप्यूट करने की इसकी क्षमता। हार्डवेयर केवल उस पैरामीटर को गुणा करता है '(जिनमें से प्रदर्शन तेजी से बदल सकते हैं) प्रदर्शन स्तर।