क्यूडा और संख्यात्मक तरीके निहित समय विवेकाधिकार के साथ


10

मैं कुछ कोड को पोर्ट करना चाह रहा हूं जो कि इम्प्लिट वॉल्यूम विधि द्वारा आंशिक अंतर समीकरणों (PDE) के एक सेट को IMPLICIT फॉर्म (समय के विवेकाधिकार के लिए) में हल करता है।

परिणामस्वरूप, x, y, z दिशाओं में समीकरणों की त्रिभुज प्रणाली है जो ADI / TDMA योजना द्वारा नियंत्रित की जाती है।

मुझे CUDA के साथ PDE के निहित समाधान के बारे में कुछ भी नहीं मिल रहा है।

क्या ADI / TDMA योजना CUDA में लागू हो सकती है ?? वहाँ 2 डी गर्मी प्रसार समीकरण की तरह एक उदाहरण उपलब्ध है कहीं ??

सभी मुझे मिल सकता है परिमित अंतर में 2 डी गर्मी प्रसार समीकरण के लिए एक CUDA नमूना कोड है, लेकिन EXPLICIT रूप (कैम्ब्रिज विश्वविद्यालय) में है।

किसी भी संकेत / संदर्भ की बहुत सराहना की जाएगी।


2
आप किस तरह के पीडीई के साथ काम कर रहे हैं? क्या यह रैखिक, अशुभ है? क्या आपका पूरा सिस्टम ट्रिडियोनगल है? (मुझे समझ में नहीं आता है कि 'x, y, z दिशाओं में त्रिदोष' से आपका क्या मतलब है)। सामान्य तौर पर ग्लोबलाइज्ड इनर प्रोडक्ट्स और अनियमित संचार के कारण GPU पर विरल सॉल्वर्स या पुनरावृत्त सॉल्वरों को लागू करना कठिन होता है (लेकिन यदि यह त्रिदोषन हो तो संचार एक समस्या से कम हो सकता है)। संपादित करें: ठीक है ADI googled, खुद से पहले इसका इस्तेमाल कभी नहीं किया। ट्रिडिएगोनियल सॉल्वरों
Reid.Atcheson

लिंक के लिए आपको धन्यवाद। पीडीई संवेग, द्रव्यमान और ऊर्जा के संरक्षण समीकरणों से होते हैं इसलिए वे दृढ़ता से युग्मित और गैर-रैखिक होते हैं। ऐसा लगता है कि निकोलाई सखारनिख ने इसे पहले ही कर लिया है। यहां इच्छुक के लिए लिंक है: nvidia.com/content/GTC/documents/1058_GTC09.pdf । हालांकि एक नमूना कोड नहीं मिल सकता है, जो वास्तव में मदद करेगा।
खाइन

2
कृपया अपनी डुप्लिकेट पोस्टिंग को SO पर हटाएं, या इसे यहां स्थानांतरित करने के लिए कहें।
डेविड केचेसन

जवाबों:


1

यह समस्या खुद को एक अत्यधिक सदिश रूप में उधार देती है। जैसा कि आपने उल्लेख किया है, एडीआई पद्धति ट्राइडियोगनल प्रणालियों के कुछ चरण देती है। चूंकि यह रैखिक समीकरणों के रूप में है, इसलिए आप मानक रेखीय बीजगणित दिनचर्या के समानांतर GPU संस्करणों को कॉल करने के लिए CUsolver और CUblas का उपयोग कर सकते हैं । इनका उपयोग करते हुए, आपको स्पष्ट कोड लेने में सक्षम होना चाहिए और बस आंतरिक लूप को एक उचित सी कॉलोल्वर कॉल में बदलना चाहिए और इसे इस तरह से हल करना चाहिए जहां कोड लगभग बिल्कुल सीपीयू कार्यान्वयन जैसा दिखता है, लेकिन GPU के माध्यम से किए गए मैट्रिक्स संचालन के साथ पुस्तकालय कॉल।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.