gpu पर टैग किए गए जवाब

ग्राफिकल प्रोसेसिंग यूनिट - एक विशेष, अपेक्षाकृत सस्ती हार्डवेयर इकाई, जो तेजी से ग्राफिकल कम्प्यूटेशंस और अत्यधिक डेटा-समानांतर वैज्ञानिक संगणना के लिए बनाई गई है।

10
GPU कंप्यूटिंग के लिए किस प्रकार की समस्याएं खुद को अच्छी तरह से उधार देती हैं?
इसलिए मुझे एक अच्छा सिर मिला है कि मैं किन समस्याओं के साथ काम करता हूं सीरियल में सर्वश्रेष्ठ हैं, और जो समानांतर में प्रबंधित किए जा सकते हैं। लेकिन अभी, मुझे इस बात का ज्यादा अंदाजा नहीं है कि सीपीयू-आधारित कम्प्यूटेशन के द्वारा सबसे अच्छा क्या है, और एक …
84 gpu 

1
2013 के अंत तक CUDA बनाम ओपनसीएल
प्रोग्रामर के नजरिए से 2013 के अंत तक CUDA और OpenCL एक दूसरे से तुलना कैसे करते हैं? मेरा समूह GPU कंप्यूटिंग का उपयोग करने की कोशिश करने के बारे में सोच रहा है। क्या हम हार्डवेयर का चयन करके खुद को काफी सीमित कर लेंगे जो केवल OpenCL का …
34 hpc  gpu  cuda  opencl 

4
सीपीयू की तुलना में किस सांख्यिकीय तरीके से जीपीयू तेज होते हैं?
मैंने सिर्फ अपने डेस्कटॉप पर एक एनवीडिया जीटी 660 ग्राफिक कार्ड स्थापित किया है और कुछ संघर्ष के बाद, मैं इसे आर के साथ इंटरफेस करने का प्रबंधन करता हूं। मैं कई आर पैकेजों के साथ खेल रहा हूं जो GPU का उपयोग करते हैं, विशेष रूप से gputools, और …
18 r  gpu 

3
ऑक्टेव में यूक्लिडियन दूरी
मैं जानना चाहूंगा कि क्या ओक्टेव में दो वैक्टर की यूक्लिडियन दूरी की गणना करने का एक त्वरित तरीका है। ऐसा लगता है कि उसके लिए कोई विशेष कार्य नहीं है, तो क्या मुझे सिर्फ सूत्र का उपयोग करना चाहिए sqrt?

4
क्या वर्तमान में उपलब्ध GPU दोहरी परिशुद्धता फ्लोटिंग अंक अंकगणित का समर्थन करते हैं?
मैंने एक उबंटू लिनक्स क्लस्टर पर आणविक डायनामिक्स (एमडी) कोड जीआरएमएसीएस चलाया है जिसमें 24 इंटेल एक्सॉन सीपीयू वाले नोड्स हैं। मेरी खास बात यह है कि फ्लोटिंग पॉइंट अंकगणितीय परिशुद्धता के प्रति कुछ हद तक संवेदनशील है, इसलिए मुझे डबल परिशुद्धता की उच्च कम्प्यूटेशनल लागत के बावजूद, एकल परिशुद्धता …

2
GPU पर ODE सिस्टम को हल करने के लिए विकल्प?
मैं 'trivially parallelisable' सेटिंग में, ODE के सॉल्यूशन सिस्टम को GPU पर खेती करना चाहूंगा। उदाहरण के लिए, 512 अलग-अलग पैरामीटर सेट के साथ संवेदनशीलता विश्लेषण करना। आदर्श रूप से मैं ODE को सीवीओडीई जैसे स्मार्ट एडेप्टिव टाइमस्टेप सॉल्वर के साथ फॉरवर्ड ईयलर की तरह एक निश्चित टाइमस्टेप के साथ …
16 ode  gpu 

1
डबल परिशुद्धता के साथ आधुनिक जीपीयू के साथ पायथन के साथ वैज्ञानिक कंप्यूटिंग
क्या यहां किसी ने नई पीढ़ी (जैसे K20) GPU के साथ पाइथन के माध्यम से दोहरी परिशुद्धता वैज्ञानिक कंप्यूटिंग का उपयोग किया है? मुझे पता है कि यह तकनीक तेजी से विकसित हो रही है, लेकिन वर्तमान में ऐसा करने का सबसे अच्छा तरीका क्या है? जीपीयू लोकप्रिय वैज्ञानिक पायथन …
14 python  gpu  precision 

4
अतुल्यकालिक सेलुलर ऑटोमेटा के लिए समानांतर (GPU) एल्गोरिदम
मेरे पास कम्प्यूटेशनल मॉडल का एक संग्रह है जिसे अतुल्यकालिक सेलुलर ऑटोमेटा के रूप में वर्णित किया जा सकता है। ये मॉडल ईज़िंग मॉडल से मिलते जुलते हैं, लेकिन थोड़े अधिक जटिल हैं। ऐसा लगता है जैसे सीपीयू के बजाय ऐसे मॉडल को GPU पर चलाने से लाभ होगा। दुर्भाग्य …

2
GPU सिस्टम पर BLAS / LAPACK या अन्य रैखिक बीजगणित दिनचर्या के सबसे तेजी से उपलब्ध कार्यान्वयन क्या हैं?
उदाहरण के लिए, NVidia में CUBLAS है, जो 7-14x स्पीडअप का वादा करता है। Naively, यह कहीं भी nVidia के GPU कार्ड के सैद्धांतिक थ्रूपुट के पास नहीं है। जीपीयू पर रैखिक बीजगणित को गति देने में क्या चुनौतियां हैं, और क्या पहले से उपलब्ध तेजी से रैखिक बीजगणित मार्ग …

3
जीपीजीपीयू त्वरण के लिए एनवीडिया के 20 एक्स बनाम जीफर्स टाइटन
Im शैक्षणिक कंप्यूटिंग के लिए इन दो ग्राफिक्स कार्ड के बीच अंतर को समझने की कोशिश कर रहा है, विशेष रूप से DGEMM घटक के लिए। यदि हम कच्चे आँकड़ों को देखें, तो दोनों में समान GK110 चिप है, वस्तुतः हर श्रेणी में तुलनीय आँकड़े हैं, और, मेरा मानना ​​है …

3
GPU प्रोग्रामिंग के लिए जोर
मैं GPGPU प्रोग्रामिंग के लिए बहुत नया हूं, इसलिए कृपया मुझे क्षमा करें यदि प्रश्न विशेष रूप से उपयुक्त नहीं है। सामान्य सीपीयू प्रोग्रामिंग की तुलना में जब मुझे समझ में आता है कि GPU प्रोग्रामिंग, इंजीनियरिंग कार्य का एक बहुत जटिल टुकड़ा है। विचलन मुद्दों, टाइलिंग, पिन किए गए …

2
बड़े सहसंयोजक मैट्रिक्स की समानांतर गणना
हम से लेकर आकारों के साथ गणना सहप्रसरण मैट्रिक्स की जरूरत को । हमारे पास GPU और क्लस्टर तक पहुंच है, हमें आश्चर्य है कि इन संगणनाओं को तेज करने के लिए सबसे अच्छा समानांतर दृष्टिकोण क्या है।10000 × 1000010000×1000010000\times10000100000 × 100000100000×100000100000\times100000

2
साझा मेमोरी में एक GPU पर एक छोटे nonsymmetric मैट्रिक्स के eigenpairs खोजने का सबसे तेज़ तरीका
मेरे पास एक समस्या है जहां मुझे सभी सकारात्मक खोजने की जरूरत है (जैसा कि आइगेनवल्यू पॉजिटिव है) एक छोटे (आमतौर पर 60x60 से छोटे) के नोमेनमेट्रिक मैट्रिक्स के ईजिनपेयर हैं। जब एक निश्चित दहलीज से छोटा होता है तो मैं गणना करना बंद कर सकता हूं। मुझे पता है …
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.