कम्प्यूटेशनल विज्ञान gpu

10

GPU कंप्यूटिंग के लिए किस प्रकार की समस्याएं खुद को अच्छी तरह से उधार देती हैं?

इसलिए मुझे एक अच्छा सिर मिला है कि मैं किन समस्याओं के साथ काम करता हूं सीरियल में सर्वश्रेष्ठ हैं, और जो समानांतर में प्रबंधित किए जा सकते हैं। लेकिन अभी, मुझे इस बात का ज्यादा अंदाजा नहीं है कि सीपीयू-आधारित कम्प्यूटेशन के द्वारा सबसे अच्छा क्या है, और एक …

84 gpu

1

2013 के अंत तक CUDA बनाम ओपनसीएल

प्रोग्रामर के नजरिए से 2013 के अंत तक CUDA और OpenCL एक दूसरे से तुलना कैसे करते हैं? मेरा समूह GPU कंप्यूटिंग का उपयोग करने की कोशिश करने के बारे में सोच रहा है। क्या हम हार्डवेयर का चयन करके खुद को काफी सीमित कर लेंगे जो केवल OpenCL का …

34 hpc gpu cuda opencl

4

सीपीयू की तुलना में किस सांख्यिकीय तरीके से जीपीयू तेज होते हैं?

मैंने सिर्फ अपने डेस्कटॉप पर एक एनवीडिया जीटी 660 ग्राफिक कार्ड स्थापित किया है और कुछ संघर्ष के बाद, मैं इसे आर के साथ इंटरफेस करने का प्रबंधन करता हूं। मैं कई आर पैकेजों के साथ खेल रहा हूं जो GPU का उपयोग करते हैं, विशेष रूप से gputools, और …

18 r gpu

3

ऑक्टेव में यूक्लिडियन दूरी

मैं जानना चाहूंगा कि क्या ओक्टेव में दो वैक्टर की यूक्लिडियन दूरी की गणना करने का एक त्वरित तरीका है। ऐसा लगता है कि उसके लिए कोई विशेष कार्य नहीं है, तो क्या मुझे सिर्फ सूत्र का उपयोग करना चाहिए sqrt?

18 octave discretization nonlinear-equations newton-method visualization fluid-dynamics mesh-generation finite-element finite-volume optimization algorithms approximation fluid-dynamics navier-stokes comsol modeling optimization sparse-matrix matrix condition-number visualization matlab quadrature blas intel-mkl finite-element gpu discontinuous-galerkin mathematica optimization convex-optimization algorithms reference-request matlab statistics finite-element numerical-analysis petsc molecular-dynamics machine-learning statistics visualization open-source statistics image-processing visualization python petsc finite-element fluid-dynamics stability navier-stokes incompressible

4

क्या वर्तमान में उपलब्ध GPU दोहरी परिशुद्धता फ्लोटिंग अंक अंकगणित का समर्थन करते हैं?

मैंने एक उबंटू लिनक्स क्लस्टर पर आणविक डायनामिक्स (एमडी) कोड जीआरएमएसीएस चलाया है जिसमें 24 इंटेल एक्सॉन सीपीयू वाले नोड्स हैं। मेरी खास बात यह है कि फ्लोटिंग पॉइंट अंकगणितीय परिशुद्धता के प्रति कुछ हद तक संवेदनशील है, इसलिए मुझे डबल परिशुद्धता की उच्च कम्प्यूटेशनल लागत के बावजूद, एकल परिशुद्धता …

17 hpc floating-point molecular-dynamics gpu

2

GPU पर ODE सिस्टम को हल करने के लिए विकल्प?

मैं 'trivially parallelisable' सेटिंग में, ODE के सॉल्यूशन सिस्टम को GPU पर खेती करना चाहूंगा। उदाहरण के लिए, 512 अलग-अलग पैरामीटर सेट के साथ संवेदनशीलता विश्लेषण करना। आदर्श रूप से मैं ODE को सीवीओडीई जैसे स्मार्ट एडेप्टिव टाइमस्टेप सॉल्वर के साथ फॉरवर्ड ईयलर की तरह एक निश्चित टाइमस्टेप के साथ …

16 ode gpu

1

डबल परिशुद्धता के साथ आधुनिक जीपीयू के साथ पायथन के साथ वैज्ञानिक कंप्यूटिंग

क्या यहां किसी ने नई पीढ़ी (जैसे K20) GPU के साथ पाइथन के माध्यम से दोहरी परिशुद्धता वैज्ञानिक कंप्यूटिंग का उपयोग किया है? मुझे पता है कि यह तकनीक तेजी से विकसित हो रही है, लेकिन वर्तमान में ऐसा करने का सबसे अच्छा तरीका क्या है? जीपीयू लोकप्रिय वैज्ञानिक पायथन …

14 python gpu precision

4

अतुल्यकालिक सेलुलर ऑटोमेटा के लिए समानांतर (GPU) एल्गोरिदम

मेरे पास कम्प्यूटेशनल मॉडल का एक संग्रह है जिसे अतुल्यकालिक सेलुलर ऑटोमेटा के रूप में वर्णित किया जा सकता है। ये मॉडल ईज़िंग मॉडल से मिलते जुलते हैं, लेकिन थोड़े अधिक जटिल हैं। ऐसा लगता है जैसे सीपीयू के बजाय ऐसे मॉडल को GPU पर चलाने से लाभ होगा। दुर्भाग्य …

12 parallel-computing monte-carlo gpu

2

GPU सिस्टम पर BLAS / LAPACK या अन्य रैखिक बीजगणित दिनचर्या के सबसे तेजी से उपलब्ध कार्यान्वयन क्या हैं?

उदाहरण के लिए, NVidia में CUBLAS है, जो 7-14x स्पीडअप का वादा करता है। Naively, यह कहीं भी nVidia के GPU कार्ड के सैद्धांतिक थ्रूपुट के पास नहीं है। जीपीयू पर रैखिक बीजगणित को गति देने में क्या चुनौतियां हैं, और क्या पहले से उपलब्ध तेजी से रैखिक बीजगणित मार्ग …

11 linear-algebra lapack blas gpu

3

जीपीजीपीयू त्वरण के लिए एनवीडिया के 20 एक्स बनाम जीफर्स टाइटन

Im शैक्षणिक कंप्यूटिंग के लिए इन दो ग्राफिक्स कार्ड के बीच अंतर को समझने की कोशिश कर रहा है, विशेष रूप से DGEMM घटक के लिए। यदि हम कच्चे आँकड़ों को देखें, तो दोनों में समान GK110 चिप है, वस्तुतः हर श्रेणी में तुलनीय आँकड़े हैं, और, मेरा मानना है …

10 performance gpu efficiency

3

GPU प्रोग्रामिंग के लिए जोर

मैं GPGPU प्रोग्रामिंग के लिए बहुत नया हूं, इसलिए कृपया मुझे क्षमा करें यदि प्रश्न विशेष रूप से उपयुक्त नहीं है। सामान्य सीपीयू प्रोग्रामिंग की तुलना में जब मुझे समझ में आता है कि GPU प्रोग्रामिंग, इंजीनियरिंग कार्य का एक बहुत जटिल टुकड़ा है। विचलन मुद्दों, टाइलिंग, पिन किए गए …

10 parallel-computing petsc gpu cuda

2

बड़े सहसंयोजक मैट्रिक्स की समानांतर गणना

हम से लेकर आकारों के साथ गणना सहप्रसरण मैट्रिक्स की जरूरत को । हमारे पास GPU और क्लस्टर तक पहुंच है, हमें आश्चर्य है कि इन संगणनाओं को तेज करने के लिए सबसे अच्छा समानांतर दृष्टिकोण क्या है।10000 × 1000010000×1000010000\times10000100000 × 100000100000×100000100000\times100000

9 matrix parallel-computing gpu

2

साझा मेमोरी में एक GPU पर एक छोटे nonsymmetric मैट्रिक्स के eigenpairs खोजने का सबसे तेज़ तरीका

मेरे पास एक समस्या है जहां मुझे सभी सकारात्मक खोजने की जरूरत है (जैसा कि आइगेनवल्यू पॉजिटिव है) एक छोटे (आमतौर पर 60x60 से छोटे) के नोमेनमेट्रिक मैट्रिक्स के ईजिनपेयर हैं। जब एक निश्चित दहलीज से छोटा होता है तो मैं गणना करना बंद कर सकता हूं। मुझे पता है …

9 performance eigensystem gpu

gpu पर टैग किए गए जवाब