एक नंबर-क्रंचिंग कंप्यूटर कोडांतरण [बंद]


0

सीपीयू द्वारा पूरी तरह से खिलाया गया एक GPU बनाने के लिए क्या आवश्यक है?

उनकी फ्लॉप्स की तुलना करना काफी है?

उदाहरण के लिए, अगर मैं Nvidia-Fermi GPU में से एक के साथ एक बहुत पुराना (पेंटियम -3) CPU बनाने का प्रबंधन कर सकता हूं, तो यह प्रति सेकंड डेटा के साथ gpu को खिलाया नहीं जा सकेगा। ओपनसीएल या कुछ इसी तरह के काम की आवश्यकता होने पर सीपीयू को सीपीयू में फिट करने के लिए क्या मापदंड है?

बेशक RAM और BUS को समान तरीके से चुना जाएगा लेकिन वास्तव में कैसे?

मान लें कि प्रत्येक GPU-core एक sqrt और एक विभाजन और प्रत्येक पुनरावृत्ति के लिए 100 बार जोड़ने की गणना करेगा।

धन्यवाद।

संपादित करें: वर्षों से opencl के साथ काम करने के बाद, ऐसा लगता है कि यह ज्यादातर एल्गोरिथ्म पर निर्भर करता है, फिर संचार अनुकूलन (रीड / राइट या मैप / अनमैप) और जीपस पीक गणना मूल्यों और एक ही स्लाइस पर रीड + राइट + कंप्यूट करने की इसकी क्षमता। हार्डवेयर केवल उस पैरामीटर को गुणा करता है '(जिनमें से प्रदर्शन तेजी से बदल सकते हैं) प्रदर्शन स्तर।

जवाबों:


2

जैसा कि लुकास कॉफ़मैन ने उल्लेख किया है , यह आपके आवेदन पर निर्भर करता है।

यदि आपको सीपीयू पर किसी भी पूर्व / पोस्ट-प्रोसेसिंग के बिना हार्ड ड्राइव से GPU बड़ी मात्रा में डेटा खिलाने की आवश्यकता है, तो सीपीयू लगभग अप्रासंगिक है। यदि पहले / बाद / GPU पर प्रसंस्करण डेटा के दौरान / बाद में इसे CPU पर भारी प्रसंस्करण की आवश्यकता होती है, तो CPU सीमित कारक बन सकता है।

अंगूठे के कई नियम:

  • आपके CPU में कम से कम N+1कोर होना चाहिए , जहां NGPU की संख्या है।

  • आपके पास आपके सभी जीपीयू के योग में कम से कम रैम होनी चाहिए।

  • आपकी PCI-Express बस को आपके GPU द्वारा समर्थित नवीनतम संस्करण होना चाहिए (ध्यान दें, कि कुछ मदरबोर्ड पर जैसे कि 2 PCI-Express स्लॉट प्रत्येक x16गति पर कार्य कर सकते हैं , लेकिन जब एक साथ उपयोग किया जाता है, तो प्रत्येक सीमित है x8)। आखिरकार, जीपीयू के लिए पीसीआई-एक्सप्रेस सबसे आम अड़चन है।

  • यदि आपको अपने बॉक्स से वीडियो आउटपुट की आवश्यकता है, तो इस एकमात्र उद्देश्य के लिए कुछ सस्ते कार्ड खरीदने पर विचार करें। ड्राइवरों के साथ किसी भी जटिलता से बचने के लिए, अपने नंबर-क्रंचिंग कार्ड के समान विक्रेता से चिपके रहें।


बस PS3 का उपयोग करें। जापान ने एक सुपर कंप्यूटर के लिए 1000+ का विश्वास किया
कोल जॉनसन

2

एक ही उत्तर नहीं है, इसमें बहुत अधिक कारक शामिल हैं क्योंकि सिर्फ फीडिंग की जानकारी भी इस बात पर निर्भर करेगी कि हाथ में क्या काम होगा।

लेकिन सिर्फ संक्षेप में, उच्च घड़ी दर के साथ अधिमानतः कई कोर।


मैं बस अलग-अलग टुकड़ों को यथासंभव फिट करना चाहता हूं। जब मैं opencl- सक्षम CPU + GPU का उपयोग करता हूं, तो C ++ की एक ओपनसीएल लाइब्रेरी सही निर्णय लेगी?
हुसैन तुगरुल बायुकिसिक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.