अन्य मानदंडों को ध्यान में रखते हुए, मुझे लगता है कि कुछ मामलों में पायथन का उपयोग करके बिग डेटा के लिए आर से बेहतर हो सकता है। मैं डेटा विज्ञान शैक्षिक सामग्री में आर के व्यापक प्रसार का उपयोग और इसके लिए उपलब्ध अच्छे डेटा विश्लेषण पुस्तकालयों को जानता हूं, लेकिन कभी-कभी यह सिर्फ टीम पर निर्भर करता है।
मेरे अनुभव में, पहले से ही प्रोग्रामिंग से परिचित लोगों के लिए, पायथन का उपयोग आर जैसी भाषा की तुलना में बहुत अधिक लचीलापन और उत्पादकता को बढ़ावा देता है, जो प्रोग्रामिंग भाषा के संदर्भ में पायथन की तुलना में अच्छी तरह से डिज़ाइन और शक्तिशाली नहीं है। मेरे विश्वविद्यालय में एक डाटा माइनिंग कोर्स में साक्ष्य के रूप में, सबसे अच्छा अंतिम प्रोजेक्ट पायथन में लिखा गया था, हालांकि अन्य में आर के समृद्ध डेटा विश्लेषण पुस्तकालय तक पहुंच है। यही है, कभी-कभी अजगर के लिए समग्र उत्पादकता (शिक्षण सामग्री, प्रलेखन आदि पर विचार करते हुए), पायथन के लिए विशेष प्रयोजन डेटा विश्लेषण पुस्तकालयों की कमी में भी आर से बेहतर हो सकता है। इसके अलावा, डेटा साइंस में अजगर की तेज गति को समझाते हुए कुछ अच्छे लेख हैं: पायथन में आर और रिच साइंटिफिक डेटा स्ट्रक्चर को विस्थापित करना वह जल्द ही आर के लिए उपलब्ध पुस्तकालयों का अंतर भर सकता है।
R का उपयोग न करने का एक और महत्वपूर्ण कारण है जब वास्तविक दुनिया बिग डेटा की समस्याओं के साथ काम करना, केवल अकादमिक समस्याओं के विपरीत, डेटा पार्सिंग, सफाई, विज़ुअलाइज़ेशन, वेब स्क्रैपिंग, और बहुत से अन्य जैसे अन्य उपकरणों और तकनीकों की बहुत आवश्यकता है एक सामान्य प्रयोजन प्रोग्रामिंग भाषा का उपयोग करना बहुत आसान है। यह हो सकता है कि कई Hadoop पाठ्यक्रमों में उपयोग की गई डिफ़ॉल्ट भाषा (उदासी के ऑनलाइन पाठ्यक्रम सहित ) पायथन है।
संपादित करें:
हाल ही में DARPA ने बड़ी डेटा नौकरियों के लिए अजगर की डेटा प्रोसेसिंग और विज़ुअलाइज़ेशन क्षमताओं को निधि देने में मदद करने के लिए $ 3 मिलियन का निवेश किया है, जो स्पष्ट रूप से बिग डेटा में पायथन के भविष्य का संकेत है। ( विवरण )