डेटा विज्ञान परियोजनाओं के लिए वीएम छवि


24

चूंकि डेटा विज्ञान कार्यों के लिए कई उपकरण उपलब्ध हैं, और यह सब कुछ स्थापित करने और एक आदर्श प्रणाली बनाने के लिए बोझिल है।

क्या पायथन, आर और अन्य ओपन-सोर्स डेटा विज्ञान उपकरण के साथ लिनक्स / मैक ओएस छवि स्थापित है और लोगों को तुरंत उपयोग करने के लिए उपलब्ध है? पाइथन, आर (आईडीई सहित) के नवीनतम संस्करण के साथ एक उबंटू या एक हल्के वजन वाला ओएस, और स्थापित अन्य खुले स्रोत डेटा विज़ुअलाइज़ेशन उपकरण आदर्श होंगे। मैं Google पर अपनी त्वरित खोज में एक नहीं आया हूं।

कृपया मुझे बताएं कि क्या कोई है या यदि आप में से किसी ने अपने लिए एक बनाया है? मुझे लगता है कि कुछ विश्वविद्यालयों में अपनी स्वयं की VM छवियां हो सकती हैं। कृपया इस तरह के लिंक साझा करें।


हालांकि इस सवाल को बॉर्डरलाइन ऑफटॉपिक के रूप में देखा जा सकता है लेकिन मुझे किसी तरह यह साइट IMHO के लिए अच्छा लगता है।
सीन ओवेन

3
भयानक टिप्पणियों के अलावा, कई अलग-अलग समाधानों की तुलना करने वाला एक (कुछ पुराना) ब्लॉग पोस्ट है: jeroenjanssens.com/2013/12/07/…
लॉरीके

जवाबों:


13

एक और विकल्प है जो हाल ही में लोकप्रिय है: docker ( https://www.docker.com )। डॉकर एक कंटेनर है और आपको काम के माहौल को बहुत आसानी से और तेजी से बनाने / बनाए रखने की सुविधा देता है।

आशा है कि आपकी मदद करेगा।


12

यदि आप पहले से इंस्टॉल किए गए उपकरणों के एक समूह के साथ वीएम की तलाश कर रहे हैं, तो डेटा साइंस टूलबॉक्स का प्रयास करें ।


दिलचस्प परियोजना (+1)। साझा करने के लिए धन्यवाद! यह जानना आसान हो सकता है कि डॉकर मेरे विन 7 लैपटॉप (ऊपर देखें) पर काम क्यों नहीं करना चाहते। हालाँकि, हाल के रुझानों को देखते हुए, डॉकर को सीखना अभी भी एक अच्छा विचार हो सकता है।
१३:४५

अच्छी जानकारी। वीएम टूल्स की तुलना में, यह समझने के लिए कुछ समय की आवश्यकता है कि डॉक कैसे संचालित होता है। यदि आप vm से पहले से परिचित हैं, तो इस टूलबॉक्स का उपयोग करना एक अच्छा विचार है। साझा करने के लिए धन्यवाद।
फैंसिया

साझा करने के लिए धन्यवाद। यह निश्चित रूप से दिलचस्प है। लेकिन मैं यह नहीं देखता कि कोई बिना ग्राफ़िकल इंटरफ़ेस के इसका उपयोग कैसे कर सकता है। मुझे आर-स्टूडियो की आवश्यकता होगी, और पायथन के लिए PyCharm। (iPython नोटबुक वहां है)। मुझे इसे पूरी तरह समझने के लिए थोड़ा खेलने की जरूरत होगी।
जीनवुडा

1
@AleksandrBlekh मैं अंततः अपने विंडोज 7 मशीन पर काम करने के लिए डॉक्यूमेंट प्राप्त करने में सक्षम था, docker-machine regenerate-certsजो मुझे उम्मीद है कि प्रमाण पत्र को पुनः प्राप्त करके :) :)
RK

@ आरके: मुझे बताने के लिए धन्यवाद। जब मुझे मौका मिलेगा, मैं इसे आज़माऊंगा (हालांकि इसमें कुछ समय लग सकता है, हालांकि, कुछ उच्च प्राथमिकता वाले मामले हैं जिनका ध्यान रखा जाना है)।
अलेक्सांद्र ब्लेक

8

जबकि डॉकर छवियां अब अधिक चलन में हैं, मैं व्यक्तिगत रूप से डॉकर तकनीक को उपयोगकर्ता के अनुकूल नहीं पाता, यहां तक ​​कि उन्नत उपयोगकर्ताओं के लिए भी। यदि आप गैर-स्थानीय वीएम छवियों का उपयोग करने के साथ ठीक हैं और अमेज़ॅन वेब सर्विसेज (एडब्ल्यूएस) ईसी 2 का उपयोग कर सकते हैं , तो डेटा साइंस प्रोजेक्ट्स के लिए आर-केंद्रित छवियों पर विचार करें, लुई एसलेट द्वारा पूर्व-निर्मित। चित्र बहुत हाल के हैं, यदि नवीनतम नहीं हैं, तो Ubuntu LTS , R और RStudio सर्वर के संस्करण । आप उन्हें यहाँ पहुँच सकते हैं

मुख्य घटकों के अलावा मैंने ऊपर सूचीबद्ध किया है, छवियों में कई उपयोगी डेटा विज्ञान उपकरण हैं जो अंतर्निहित हैं। उदाहरण के लिए, चित्र LaTeX, ODBC, OpenGL, Git, अनुकूलित संख्यात्मक पुस्तकालयों और बहुत कुछ का समर्थन करते हैं।


इस विकल्प का उल्लेख करने के लिए बहुत बहुत धन्यवाद। मैं इसे जरूर आजमाऊंगा। हालाँकि, मैं एक ऐसी छवि चाहता हूं, जिसमें यह एएमआई जैसा हो, लेकिन मेरे लैपटॉप पर वर्चुअलबॉक्स के साथ चलाया जा सकता है।
जीनवुडा

मैंने हाल ही में डॉकर के बारे में एक ट्यूटोरियल देखा, इसका परीक्षण किया और समझने में आसान पाया। आपको उपयोगकर्ता के अनुकूल कौन सा भाग नहीं मिला?
रॉबर्ट स्मिथ

@ जीनवीड्स: आपका बहुत बहुत स्वागत है। मैं एक स्थानीय वीएम रखने की आपकी इच्छा को समझता हूं - यही कारण था कि मैंने अपने कंप्यूटर पर डॉकर की कोशिश की है। मैं आपको बता दूंगा, अगर मुझे एक वर्चुअलबॉक्स वीएम छवि डेटा विज्ञान (उम्मीद है, आर-आधारित) पर केंद्रित लगती है।
अलेक्सांद्र ब्लेक

1
@RobertSmith: मैं समझता हूं। शायद, समस्या यह थी कि मैं इसे अपने विंडोज मशीन पर स्थापित करने की कोशिश कर रहा था। वैसे भी, मैं इसे कुछ समय बाद कोशिश करूँगा। आपकी टिप्पणियों के लिए आभार।
Aleksandr Blekh

1
@AleksandrBlekh हाँ, यह मुख्य समस्या हो सकती है। दुर्भाग्य से विंडोज पर इस तरह की चीज स्थापित करते समय कई मुद्दे हैं।
रॉबर्ट स्मिथ

5

क्या आपने Cloudera की क्विकस्टार्ट वीएम की कोशिश की ?:

मुझे इसे चलाना बहुत आसान लगा और इसमें ओपन सोर्स सॉफ्टवेयर जैसे महतो और स्पार्क शामिल हैं


5

आज मैंने इस रिपॉजिटरी का उपयोग https://github.com/fterenceiq/docker-spark से किया और इसे डॉकटर के साथ बनाया। यह उसी मालिक की हडूप छवि पर आधारित एक डॉक इमेज बिल्डिंग स्पार्क है। यदि आप चिंगारी का उपयोग करते हैं, तो इसके पास एक python api है, जिसे pyspark http://spark.apache.org/docs/latest/api/python/ कहा जाता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.