डेटा विश्लेषण के लिए MongoDB जैसे NoSQL डेटाबेस का उपयोग कैसे किया जा सकता है? उनमें ऐसी कौन सी विशेषताएँ हैं जो डेटा विश्लेषण को तेज़ और शक्तिशाली बना सकती हैं?
डेटा विश्लेषण के लिए MongoDB जैसे NoSQL डेटाबेस का उपयोग कैसे किया जा सकता है? उनमें ऐसी कौन सी विशेषताएँ हैं जो डेटा विश्लेषण को तेज़ और शक्तिशाली बना सकती हैं?
जवाबों:
पूरी तरह से ईमानदार होने के लिए, अधिकांश NoSQL डेटाबेस बड़े डेटा में अनुप्रयोगों के लिए बहुत अच्छी तरह से अनुकूल नहीं हैं। सभी बड़े डेटा अनुप्रयोगों के विशाल बहुमत के लिए, के प्रदर्शन MongoDB एक संबंधपरक डेटाबेस की तुलना की तरह MySQL है काफी वारंट करने के लिए गरीब पर्याप्त MongoDB पूरी तरह से की तरह कुछ से दूर रहने के लिए है।
उस के साथ, NoSQL डेटाबेस के वास्तव में उपयोगी गुणों के एक जोड़े हैं जो निश्चित रूप से आपके पक्ष में काम करते हैं जब आप बड़े डेटा सेट के साथ काम कर रहे होते हैं, हालांकि उन लाभों की संभावना को पढ़ने के लिए SQL की तुलना में NoSQL के आमतौर पर खराब प्रदर्शन को पछाड़ते हैं- सघन संचालन (विशिष्ट बड़े डेटा उपयोग के मामलों के समान) कम है।
व्यक्तिगत रूप से मैं आपको सुझाव दे सकता हूं कि आप निवल डेटाबेस जैसे कि Neo4j की भी जाँच करें, जो कुछ विशेष प्रकार के प्रश्नों के लिए वास्तव में अच्छा प्रदर्शन दिखाते हैं, यदि आप अपने डेटा विज्ञान अनुप्रयोगों के लिए बैकएंड निकाल रहे हैं।
json
पूरी तरह से संरचित डेटा है। आप तकनीकी रूप से उस पर किसी भी तरह का डेटा विश्लेषण कर सकते हैं, एनओएसक्यूएल डेटाबेस का उपयोग करना वास्तव में संबंधित नहीं है। हालांकि मैंगो के ऊपर टूल बनाए गए हैं , जैसे कि एनालिटिका।
स्कीमा-रहित NoSQL दृष्टिकोण का एक लाभ यह है कि आप समय से पहले प्रतिबद्ध नहीं होते हैं और आप अपाचे ड्रिल जैसे उपयुक्त उपकरण का उपयोग करके क्वेरी समय पर सही स्कीमा लागू कर सकते हैं । देखें इस प्रस्तुति जानकारी के लिए। MySQL एक बड़े डेटा सेटिंग में मेरी पहली पसंद नहीं होगी।
विचार करें, प्रयास करें, और शायद कई डेटाबेस का उपयोग करें। यहां खेलना केवल "प्रदर्शन" का मुद्दा नहीं है। यह वास्तव में आपकी आवश्यकताओं के लिए आने वाला है। आप कितने डेटा की बात कर रहे हैं? किस तरह का डेटा? आपको कितनी जल्दी इसकी आवश्यकता है? क्या आप अधिक पढ़े लिखे हैं या भारी लिखते हैं?
यहां एक बात आप SQL डेटाबेस में नहीं कर सकते हैं: भावना की गणना करें। http://www.slideshare.net/shift8/mongodb-machine-learning
बेशक उस मामले में गति आपकी आवश्यकताओं के लिए पर्याप्त तेज नहीं हो सकती है, लेकिन यह कुछ ऐसा है जो संभव है। विशिष्ट कुल मूल्यों के कुछ कैशिंग के साथ, यह काफी स्वीकार्य भी था। आप ऐसा क्यों करेंगे? सुविधा।
सुविधा वास्तव में एक ऐसी चीज है जिसे आप मनाने वाले हैं। यही कारण है कि (मेरी राय में) NoSQL डेटाबेस बनाए गए थे। प्रदर्शन भी निश्चित रूप से, लेकिन मैं बेंचमार्क छूटने और अन्य चिंताओं पर अधिक ध्यान केंद्रित करने की कोशिश कर रहा हूं।
MongoDB (और कुछ अन्य NoSQL) डेटाबेस में कुछ बहुत शक्तिशाली विशेषताएं हैं जैसे कि अंतर्निहित मानचित्र / कम करना। यह लागत और समय दोनों में Hadoop जैसी किसी चीज का उपयोग करने पर बचत कर सकता है। या यह एक बड़ा व्यवसाय शुरू करने के लिए एक प्रोटोटाइप या एमवीपी प्रदान कर सकता है।
ग्राफ़ डेटाबेस के बारे में क्या? वे "NoSQL" भी हैं। OrientDB जैसे डेटाबेस को देखें। यदि आप प्रदर्शन पर बहस करना चाहते हैं ... मुझे नहीं लगता कि आप मुझे एक SQL डेटाबेस दिखाने जा रहे हैं जो कि वहां तेज है =) ... और ग्राफ़ डेटाबेस के पास वास्तव में आश्चर्यजनक अनुप्रयोग है जो आपको करने की आवश्यकता है।
प्रौद्योगिकी का नियम (और इंटरनेट) एक चीज के साथ बहुत सहज नहीं है। आप सीमित होने जा रहे हैं और विफलता के लिए खुद को स्थापित करें।