Windows में R के लिए GPU त्वरित डेटा प्रोसेसिंग


11

मैं वर्तमान में बिग डेटा पर एक पेपर ले रहा हूं जिसमें हमें डेटा विश्लेषण के लिए आर का भारी उपयोग करना है। मैं गेमिंग कारणों से अपने पीसी में एक GTX1070 है। इस प्रकार, मैंने सोचा कि यह वास्तव में अच्छा होगा यदि मैं उपयोग कर सकता हूं कि कुछ सामानों के लिए प्रसंस्करण की गति बढ़ाने के लिए मेरे लेक्चरर मेरे पास कर रहे हैं, लेकिन यह वास्तव में ऐसा करना आसान नहीं लगता है। मैंने gpuR, CUDA, Rtools और कुछ अन्य बिट्स और बोब्स स्थापित किए हैं, और मैं इसे जीनोमिक एक्सप्रेशन डेटा से gpuMatrix ऑब्जेक्ट बनाने के लिए प्राप्त कर सकता हूं, उदाहरण के लिए, लेकिन मुझे अभी तक एक फ़ंक्शन नहीं मिला है जो दोनों gpuMatrix ऑब्जेक्ट्स के साथ काम करता है और प्रदर्शन में कोई ध्यान देने योग्य अंतर भी प्रदान करता है। शायद यह सिर्फ gpuR पैकेज के लिए निहित सीमाओं से संबंधित है - कुछ अन्य पैकेजों में कार्यों के बारे में बात करते प्रतीत होते हैं जो ध्वनि की तरह लगेंगे जैसे कि वे उस चीज की तरह हैं जो मैं देख रहा हूं,

लगभग सभी पैकेज विशेष रूप से लिनक्स के लिए हैं, क्या विंडोज़ में आर के लिए जीपीयू समर्थन को लागू करना विशेष रूप से कठिन है? या फिर कोई और कारण है कि विंडोज में ऐसा करने के लिए बहुत कम पैकेज उपलब्ध हैं? कुछ अर्थों में मैं बस जिज्ञासु हूं, लेकिन यह वास्तव में काम करने के लिए बहुत अच्छा होगा। यह मुझे आश्चर्यचकित करता है कि विंडोज के लिए बहुत कम उपलब्ध है, आमतौर पर यह दूसरा तरीका है।


1
मैंने पाया है कि प्रोग्रामिंग भाषा की परवाह किए बिना विंडोज में GPU कंप्यूटिंग चुनौतीपूर्ण है। लिनक्स या OS X में टूल को विकसित करने की प्रवृत्ति है। आप लिनक्स मिंट सिनामन (फिलहाल मेरा पसंदीदा डिस्ट्रो, क्योंकि सब कुछ बस काम करता है) के साथ एक दोहरे बूट सिस्टम की कोशिश कर सकते हैं।
एड्रियन केइस्टर

जवाबों:


4

मेरे अनुभव से आर के लिए जीपीयू प्रसंस्करण स्थापित करना कठिन है, इसे विंडोज मशीन पर स्थापित करना और भी कठिन है। इसके अतिरिक्त, GPU प्रसंस्करण का उपयोग केवल विशिष्ट प्रकार की गणनाओं के लिए किया जा सकता है।

यदि आप बस इसके लिए GPU प्रसंस्करण को सेटअप करना चाहते हैं, तो मेरा जवाब काफी बेकार है।

यदि आप अपने सिस्टम और अपने कोड के सामान्य प्रदर्शन अनुकूलन की परवाह करते हैं, तो मैं निम्नलिखित चरणों की जांच करने की सलाह देता हूं:

  • बेस आर के बजाय माइक्रोसॉफ्ट आर ओपन का उपयोग करें क्योंकि यह स्वचालित रूप से आपके मशीन पर मल्टीकोर प्रसंस्करण को सक्षम करता है।

  • अपना कोड वेक्टर करें

  • डेटाफ़्रेम के बजाय डेटाटेबल जैसे पुस्तकालयों का उपयोग करें

  • बढ़ती वस्तुओं से बचें

सामान्य तौर पर, आर का प्रदर्शन आपके कोड की गुणवत्ता पर बहुत अधिक निर्भर करता है। पैट्रिक बर्न्स द्वारा आर इनफर्नो में आपको जो कुछ भी करना चाहिए और जो करना चाहिए, उस पर एक बहुत अच्छा सारांश ।


टिप्पणी के लिए धन्यवाद। मैंने तदनुसार उत्तर बदल दिया।
jd1338

फिर मेरी टिप्पणी अब उपयोगी नहीं है।
४२-
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.