माइक पाउंड अपने ग्राफिक्स कार्ड द्वारा अपने कंप्यूटर की कम्प्यूटेशनल क्षमता को क्यों मापता है, न कि इसके प्रोसेसर को?


17

मैं हाल ही में पासवर्ड पर एक महान कंप्यूटरफाइल वीडियो देख रहा था जिसमें माइक पाउंड ने अपनी कंपनी के सुपर कंप्यूटर के 4 ग्राफिक्स कार्ड (टाइटन एक्स के, सटीक होने के लिए) का पुट दिया।

एक संख्यात्मक सिमुलेशन उत्साही के रूप में, मैं पूरी तरह से सिमुलेशन कार्य के लिए एक डेस्कटॉप बनाने का सपना देखता हूं। माइक पाउंड अपने ग्राफिक्स कार्डों से कंप्यूटर की कम्प्यूटेशनल क्षमता को मापता है न कि इसके प्रोसेसर को? अगर मैं एक कंप्यूटर का निर्माण कर रहा था, तो मुझे किस आइटम की अधिक परवाह करनी चाहिए?


11
मुझे नहीं लगता कि यह जरूरी गोरिल्ला बनाम शार्क का सवाल है ... एक साधारण सवाल है: "माइक पाउंड अपने ग्राफिक्स कार्ड द्वारा अपने कंप्यूटर की कम्प्यूटेशनल क्षमता को क्यों मापता है, न कि इसके प्रोसेसर को?" जिसका उत्तर दिया जा सकता है और इसके उत्तर का भविष्य के पाठकों के लिए रचनात्मक मूल्य है।
है_Factor

6
@gnat: करीब भी नहीं। बेशक, सवाल, इसके मौजूदा रूप में, वास्तव में सॉफ्टवेयर इंजीनियरिंग के बारे में नहीं है। लेकिन मुझे लगता है कि इसे सिस्टम की इंजीनियरिंग के बारे में एक सवाल के रूप में समझा जा सकता है, जहां सिस्टम = "हार्डवेयर + सॉफ्टवेयर का संयोजन"।
डॉक्टर ब्राउन

10
4 ग्राफिक्स कार्ड वाला कंप्यूटर एक सुपर कंप्यूटर की राशि नहीं है (और न ही उस मामले के लिए 10 रास्पबेरी पीएस का एक क्लस्टर करता है)।
मैटी विर्ककुनेन

10
यह सिर्फ एक बहुत महंगा पीसी सेटअप है, सुपर कंप्यूटर नहीं ...
बाकूरी

3
"माइक कार्ड अपने कंप्यूटर की कम्प्यूटेशनल क्षमता को उसके ग्राफिक्स कार्ड द्वारा क्यों मापता है" इसका सरल उत्तर नहीं है क्योंकि संदर्भ पासवर्ड क्रैकिंग है? यदि आपको समस्या है कि अंतरिक्ष कुछ और है, तो आपको जिस चीज की देखभाल करने की आवश्यकता है वह पूरी तरह से कुछ और हो सकती है।
जिम्मीजम्स

जवाबों:


32

माइक पाउंड स्पष्ट रूप से सीपीयू की कम्प्यूटेशनल क्षमता से अधिक ग्राफिक्स कार्ड की कम्प्यूटेशनल क्षमता को महत्व देता है।

क्यों? एक ग्राफिक्स कार्ड मूल रूप से MANY सरलीकृत प्रोसेसर से बना है जो सभी समानांतर में चलते हैं। कुछ सिमुलेशन कार्य के लिए, गणना का एक बहुत आसानी से समानांतर और ग्राफिक्स कार्ड में उपलब्ध हजारों कोर पर समानांतर में संसाधित किया जा सकता है, जिससे कुल प्रसंस्करण समय कम हो जाता है।

मुझे किस वस्तु की अधिक देखभाल करनी चाहिए? यह वास्तव में उस कार्यभार पर निर्भर करता है, जिसकी आप परवाह करते हैं, और वह कार्यभार ग्राफिक्स कार्ड पर उपयोग के लिए कैसे समानांतर है / है। यदि आपका कार्यभार सरल संगणना का एक शर्मनाक समानांतर सेट है, और सॉफ्टवेयर उपलब्ध ग्राफिक्स कार्ड का लाभ लेने के लिए लिखा गया है, तो अधिक ग्राफिक्स कार्ड का अधिक सीपीयू (डॉलर के लिए डॉलर) की तुलना में कहीं अधिक प्रदर्शन प्रभाव पड़ेगा।


5
कुछ संख्याएँ जोड़ना। मान लीजिए कि आपका मुख्य कंप्यूटर एक AMD एपेक सर्वर, 64 कोर, 128 हाइपरथ्रेडिंग के साथ होगा। यह भी कहते हैं कि एक ग्राफिक्स कार्ड "कोर" केवल 10% तेज है। One TitanX में अभी भी 3072 क्यूडा कोर हैं, जो सेटअप के लिए लगभग 12000 हैं। विचार प्राप्त करें? यदि आप ग्राफिक्स कार्ड पर समस्या को चला सकते हैं, तो यह "तेज" नहीं है - यह घोड़े की गाड़ी की गति को सूत्र 1 कार से तुलना करने जैसा है।
टॉम टॉम

3
+1 'सरल संगणना के शर्मनाक समानांतर सेट' के लिए, बहुत अच्छी तरह से लिखा गया है। संक्षिप्त एवं सटीक।
माइकल विक्टर स्टारबर्ग

11
@TomTom: वास्तव में मेरी पसंदीदा तुलना बुलेट ट्रेन के साथ फॉर्मूला 1 कार (आपके सीपीयू) की तुलना है। यकीन है, ट्रेन और कार लगभग एक ही गति है। लेकिन ट्रेन ए 1 से फार्मूला 1 कार की तुलना में 1000 लोगों को तेजी से घुमा सकती है।
स्लीपबेटमैन

2
@slebetman की बात यह है कि CPU आमतौर पर सिंगल-कोर परफॉर्मेंस में बहुत तेज है (लगभग समान स्पीड नहीं)। शायद हम समझौता कर सकते हैं, और भाप इंजन के साथ सुपरसोनिक जेट हवाई जहाज की तुलना कर सकते हैं।
डैरेन रिंगर

2
अगर मुझे वाहन के आधार पर एक सादृश्य चुनना है, तो मैं कहूंगा कि सीपीयू एक फाइटर जेट की तरह है (यह प्वाइंट-टू-पॉइंट ट्रांसपोर्ट के लिए बहुत तेज़ है और इसकी आस्तीन में कई तरकीबें हैं जो अन्य वाहन नहीं कर सकते, लेकिन केवल बहुत छोटे भार को ले जाना) जबकि GPU एक मालवाहक जहाज की तरह है (यह समानांतर में काफी अधिक भार ले जा सकता है, लेकिन बहुत धीमी गति से घूमता है)।
रयान

5

की जाँच करें https://developer.nvidia.com/cuda-zone (और गूगल CUDA NVIDIA बहुत अधिक जानकारी के लिए)। डेस्कटॉप सुपर कंप्यूटर के लिए कोडा आर्किटेक्चर और हाई-एंड ग्राफिक्स कार्ड का व्यापक रूप से उपयोग किया जाता है। आप आमतौर पर ऑफ-द-शेल्फ व्हाइटबॉक्स घटकों का उपयोग करके $ 10K (usd) के लिए कई-कई Tflop बॉक्स एक साथ रख सकते हैं।

इसलिए...

एक संख्यात्मक सिमुलेशन उत्साही के रूप में, मैं पूरी तरह से सिमुलेशन कार्य के लिए एक डेस्कटॉप बनाने का सपना देखता हूं

... cuda की बहुत दूर और शहर में आपके लिए सबसे अच्छा खेल है। शायद /scicomp// या किसी अन्य स्टैकएक्सचेंज वेबसाइट में फिर से पूछने की कोशिश करें, इस तरह की चीज़ से सीधे जुड़े।

(वैसे, मुझे लगता है कि आप इस विचार से सहज हैं कि हम यहां व्यापक रूप से समानांतर प्रोग्रामिंग के बारे में बात कर रहे हैं, इसलिए आपको एल्गोरिथ्म डिजाइन के लिए उस प्रतिमान से परिचित होने की आवश्यकता हो सकती है।)


और हम हमेशा की तरह ऑर्डोस वापस आ गए हैं।
माइकल विक्टर स्टारबर्ग

2
@MichaelViktorStarberg क्या मैं केवल ऑर्डोस संदर्भ को नहीं समझ रहा हूं?
MarnixKlooster

मुझे डर है कि आप ...: /
इस्माइल मिगुएल

4
@ मार्निक्स क्लोस्टर: मेरे पास Google "ऑर्डोस" था। सुनिश्चित नहीं है कि चीन में "घोस्ट सिटी" का सुपर कंप्यूटर या टेरफ्लोप्स के साथ क्या करना है।
रॉबर्ट हार्वे

@MarnixKlooster आप वास्तव में नहीं हैं।
jpmc26

2

अगर मैं एक कंप्यूटर का निर्माण कर रहा था, तो मुझे किस आइटम की अधिक परवाह करनी चाहिए?

एक व्यावहारिक दृष्टिकोण से, आपको संभवतः मदरबोर्ड पर बहुत अधिक ध्यान देना चाहिए और सीपीयू ने जीपीयू की तुलना में उन्नयन की सापेक्ष कठिनाई को देखते हुए। खरीदारी के बाद यह पता लगाने का एक भयानक समय है कि आपके पास चार जीपीयू या उन सभी को व्यस्त रखने के लिए पर्याप्त तेज़ प्रोसेसर के लिए जगह नहीं है।

आपको यह भी पता होना चाहिए कि GPU का प्रदर्शन सबसे अधिक बार एकल-परिशुद्धता FLOPs में रिपोर्ट किया जाता है, और डबल परिशुद्धता के लिए काफी कम होता है। यदि आपको अपने सिमुलेशन में अतिरिक्त सटीकता की आवश्यकता है तो आप विज्ञापित गति से अच्छी तरह से समाप्त हो जाएंगे।

सॉफ्टवेयर इंजीनियरिंग दौड़ के लिए रवाना

एक सॉफ्टवेयर दृष्टिकोण, वॉन न्यूमैन अड़चन और प्रोग्रामिंग मॉडल से वास्तव में दो प्राथमिक चिंताएं हैं। सीपीयू में मुख्य मेमोरी तक काफी अच्छी पहुंच है, जीपीयू में बड़ी मात्रा में तेज मेमोरी ऑनबोर्ड है। यह अज्ञात नहीं है कि GPU में और उसके बाहर जाने का समय किसी भी गति की जीत को पूरी तरह से नकार देता है। सामान्य तौर पर सीपीयू बड़ी मात्रा में डेटा पर मध्यम संगणना के लिए विजेता होता है जबकि जीपीयू कम मात्रा में भारी गणना पर होता है। जो सभी हमें प्रोग्रामिंग मॉडल में लाता है।

उच्च स्तर पर समस्या प्राचीन और सम्मानित MIMD / SIMD बहस है। मल्टीपल-इंस्ट्रक्शन / मल्टीपल-डेटा सिस्टम सामान्य और वाणिज्यिक कंप्यूटिंग में बड़े विजेता रहे हैं। इस मॉडल में, जिसमें SMP शामिल है, वहाँ कई प्रोसेसर प्रत्येक अपने व्यक्तिगत निर्देश धारा को निष्पादित करते हैं। यह एक फ्रांसीसी रसोई के बराबर कंप्यूटर है, जहां आप अपेक्षाकृत जटिल कार्यों को पूरा करने के लिए कम संख्या में कुशल रसोइयों को निर्देशित करते हैं।

दूसरी ओर सिंगल-इंस्ट्रक्शन / मल्टीपल-डेटा सिस्टम, अधिक बारीकी से मास्टर कंट्रोलर के निर्देशों का पालन करते हुए अपने डेस्क पर लगे क्लर्कों से भरे एक विशाल कमरे से मिलते जुलते हैं। "हर कोई ADD लाइनों 3 और 5!" इसका उपयोग अपने शुद्ध रूप में ILLIAC और कुछ "मिनी-सुपर" प्रणालियों में किया गया था, लेकिन बाजार में खो गया। वर्तमान GPU एक करीबी चचेरे भाई हैं, वे अधिक लचीले हैं, लेकिन समान सामान्य दर्शन साझा करते हैं।

सारांश में बताना:

  • किसी भी ऑपरेशन के लिए सीपीयू तेजी से होगा, जबकि GPU एक साथ कई प्रदर्शन कर सकता है। 64-बिट फ़्लोट्स के साथ अंतर सबसे स्पष्ट है।
  • सीपीयू कोर किसी भी मेमोरी पते पर काम कर सकता है, GPU के लिए डेटा को एक छोटे से क्षेत्र में पैक किया जाना चाहिए। आप केवल तभी जीतते हैं जब आप स्थानांतरण समय की भरपाई करने के लिए पर्याप्त संगणना कर रहे हों।
  • सशर्त में भारी कोड आमतौर पर CPU पर अधिक खुश होंगे।
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.