यह प्रतिक्रिया बहुत देर हो सकती है, लेकिन यह वैसे भी ध्यान देने योग्य है। GPU Ocelot ( जिनमें से मैं कोर योगदानकर्ताओं में से एक हूं ) को CUDA डिवाइस ड्राइवर (libcuda.so) के बिना संकलित किया जा सकता है यदि आप एमुलेटर या LLVM बैकेंड का उपयोग करना चाहते हैं। मैंने NVIDIA GPU के बिना सिस्टम पर एमुलेटर का प्रदर्शन किया है।
एमुलेटर पीटीएक्स 1.4 और पीटीएक्स 2.1 विनिर्देशों को ईमानदारी से लागू करने का प्रयास करता है जिसमें पुरानी जीपीयू का समर्थन नहीं करने वाली विशेषताएं शामिल हो सकती हैं। LLVM अनुवादक सही और कुशल अनुवाद के लिए PTX से x86 तक प्रयास करता है जो CUDA को प्रोग्रामिंग मल्टीकोर सीपीयू और साथ ही GPU का एक प्रभावी तरीका बना देगा। -deviceemu
कुछ समय के लिए CUDA की पदावनत विशेषता रही है, लेकिन LLVM अनुवादक हमेशा तेज रहा है।
इसके अतिरिक्त, कई शुद्धता चेकर्स को सत्यापित करने के लिए एमुलेटर में बनाया गया है: मेमोरी एक्सेस को संरेखित करना, साझा मेमोरी तक पहुंच ठीक से सिंक्रनाइज़ किया गया है, और ग्लोबल मेमोरी डेरेफेरिंग मेमोरी के आवंटित क्षेत्रों तक पहुंचता है। हमने एक कमांड-लाइन इंटरेक्टिव डिबगर भी लागू किया है, जो काफी हद तक गडबड से प्रेरित होकर सीयूडीए गुठली, सेट ब्रेकप्वाइंट और वॉचपॉइंट, आदि के माध्यम से एकल ... इन उपकरणों को विशेष रूप से CUDA कार्यक्रमों के डिबगिंग में तेजी लाने के लिए विकसित किया गया था; आप उन्हें उपयोगी पा सकते हैं।
लिनक्स-केवल पहलू के बारे में क्षमा करें। हमने एक विंडोज शाखा ( साथ ही एक मैक ओएस एक्स पोर्ट ) शुरू किया है, लेकिन इंजीनियरिंग बोझ पहले से ही काफी बड़ा है जो हमारे शोध को आगे बढ़ाता है। यदि किसी के पास कोई समय और रुचि है, तो वे हमें विंडोज के लिए सहायता प्रदान करने में मदद करना चाहते हैं!
उम्मीद है की यह मदद करेगा।