Google क्लाउड बिगटेबल बनाम Google क्लाउड डेटास्टोर


124

Google क्लाउड बिगटेबल और Google क्लाउड डेटास्टोर / ऐप इंजन डेटास्टोर में क्या अंतर है , और मुख्य व्यावहारिक लाभ / नुकसान क्या हैं? AFAIK क्लाउड डेटास्टोर बिगटेबल के शीर्ष पर बना है।


8
कृपया बंद न करें। वर्तमान में इन पर कोई आधिकारिक दस्तावेज़ीकरण नहीं है और Google संभवतः यहां टिप्पणी करेगा।
जिग मंडेल

यह बाहर की जाँच करें terenceryan.com/blog/index.php/…
Zig Mandel

जवाबों:


97

डेटास्टोर के साथ अनुभव और बिगटेबल डॉक्स पढ़ने के आधार पर , मुख्य अंतर हैं:

  • Bigtable मूल रूप से HBase संगतता के लिए डिज़ाइन किया गया था, लेकिन अब कई भाषाओं में क्लाइंट लाइब्रेरी हैं । डेटास्टोर मूल रूप से पायथन / जावा / गो वेब ऐप डेवलपर्स (मूल रूप से ऐप इंजन) की ओर अधिक सक्षम था
  • बिगटेबल डेटास्टर की तुलना में bit थोड़ा अधिक IaaS ’है कि इसमें but सिर्फ वहां’ नहीं है, लेकिन एक क्लस्टर को कॉन्फ़िगर करने की आवश्यकता है ।
  • Bigtable केवल एक इंडेक्स का समर्थन करता है - 'पंक्ति कुंजी' (डेटास्टोर में इकाई कुंजी)
    • इसका मतलब है कि दातास्तूर की अनुक्रमित संपत्तियों के विपरीत, कुंजी पर प्रश्न हैं
  • Bigtable केवल एक पंक्ति में परमाणुता का समर्थन करता है - कोई लेनदेन नहीं है
  • उत्परिवर्तन और विलोपन बिगिटेबल में परमाणु नहीं दिखते हैं, जबकि डाटस्टोर रीड / क्वेरी विधि के आधार पर अंतिम और मजबूत स्थिरता प्रदान करता है।
  • बिलिंग मॉडल बहुत अलग है:
    • पढ़ने / लिखने के संचालन, भंडारण और बैंडविड्थ के लिए डेटास्टोर शुल्क
    • 'नोड्स' , स्टोरेज और बैंडविड्थ के लिए बिगटेबल शुल्क

98

Bigtable डेटा और एनालिटिक्स के उच्च संस्करणों के लिए अनुकूलित है

  • क्लाउड बिगिटेबल ज़ोन या क्षेत्रों में डेटा की प्रतिकृति नहीं करता है (एकल क्लस्टर के भीतर डेटा प्रतिकृति और टिकाऊ है), जिसका अर्थ है कि बिगटेबल तेज़ और अधिक कुशल है, और लागत बहुत कम है, हालांकि यह कम टिकाऊ है और डिफ़ॉल्ट कॉन्फ़िगरेशन में उपलब्ध है
  • यह HBase API का उपयोग करता है - सीखने के लिए इसमें लॉक-इन या नए प्रतिमानों का कोई जोखिम नहीं है
  • यह ओपन-सोर्स बिग डेटा टूल्स के साथ एकीकृत है, जिसका अर्थ है कि आप बिग एनालिटिक्स में स्टोर किए गए डेटा का विश्लेषण कर सकते हैं जो कि अधिकांश एनालिटिक्स टूल ग्राहकों द्वारा उपयोग किया जाता है (Hadoop, Spark, आदि)
  • Bigtable एक एकल पंक्ति कुंजी द्वारा अनुक्रमित है
  • Bigtable एक ही क्षेत्र में है

क्लाउड बिगटेबल को बड़ी कंपनियों और उद्यमों के लिए डिज़ाइन किया गया है जिनके पास जटिल बैकएंड वर्कलोड के साथ अक्सर बड़ी डेटा ज़रूरतें होती हैं।

Datastore अनुप्रयोगों के लिए उच्च मूल्य लेनदेन डेटा की सेवा करने के लिए अनुकूलित है

  • क्लाउड डेटास्टोर में प्रतिकृति और डेटा सिंक्रनाइज़ेशन के साथ बहुत अधिक उपलब्धता है
  • डेटास्टोर, इसकी बहुमुखी प्रतिभा और उच्च उपलब्धता के कारण, अधिक महंगा है
  • समकालिक प्रतिकृति के कारण डेटास्टोर धीमा लेखन डेटा है
  • डेटास्टोर में लेन-देन और प्रश्नों के आसपास बेहतर कार्यक्षमता है (चूंकि द्वितीयक सूचकांक मौजूद हैं)

3
Bigtable अब ज़ोनल आउटेज के चेहरे पर उपलब्धता प्रदान करने के लिए ज़ोन भर में प्रतिकृति बनाता है
ब्रैंडन ड्यूरेट

मैंने सोचा कि डेटासटोर के लिए लेनदेन एक मजबूत बिक्री बिंदु नहीं है। इसके [डॉक्टर से | Cloud.google.com/datastore/docs/concepts/transactions] "एक लेनदेन 25 इकाई समूहों में एक या एक से अधिक संस्थाओं पर Google क्लाउड डेटास्टोर संचालन का एक सेट है।" इसके अलावा, डेटास्टर बिगटेबल के शीर्ष पर बनाया गया है, है ना?
zyxue

19

Bigtable और Datastore बेहद अलग हैं। हां, डेटास्टर बिगटेबल के ऊपर बना हुआ है, लेकिन इससे ऐसा कुछ नहीं होता है। यह एक तरह से कह रहा है जैसे कार पहियों के शीर्ष पर बनाई गई है, और इसलिए कार पहियों से बहुत अलग नहीं है।

Bigtable और Datastore बहुत अलग डेटा मॉडल और बहुत अलग शब्दार्थ प्रदान करते हैं कि डेटा कैसे बदला जाता है।

मुख्य अंतर यह है कि डेटास्टोर इकाई समूहों के रूप में ज्ञात डेटा के सबसेट पर SQL-डेटाबेस-जैसे ACID लेनदेन प्रदान करता है (हालांकि क्वेरी भाषा GQL SQL की तुलना में बहुत अधिक प्रतिबंधक है)। बिगटेबल सख्ती से NoSQL है और बहुत कमजोर गारंटी के साथ आता है।


4
आप अंतिम पैराग्राफ तक अच्छा कर रहे थे। डेटास्टोर लेनदेन प्रदान करता है, लेकिन वे एसक्यूएल की तरह कुछ भी नहीं हैं और निश्चित रूप से एसीआईडी ​​नहीं हैं।
डेनियल रोजमैन

4
@DanielRoseman वास्तव में, यह बहुत कुछ करता है। यहाँ मेगास्टॉर पर पेपर से एक उद्धरण दिया गया है (जिस पर डेटास्टोर का निर्माण किया गया है): "प्रत्येक मेगास्टोर इकाई समूह एक मिनी-डेटाबेस के रूप में कार्य करता है जो धारावाहिक योग्य ACID शब्दार्थ प्रदान करता है।" "हम डेटास्टोर को विभाजित करते हैं और प्रत्येक विभाजन को अलग से दोहराते हैं, विभाजन के भीतर पूर्ण ACID शब्दार्थ प्रदान करते हैं"। (research.google.com/pubs/pub36971.html)
user2771609

मुझे लगता है कि इसे गुमराह करने के लिए इसे Sql कहा जाता है। एक सबसेट। कोई कुशल गणना / समूह नहीं है, सभी प्रश्नों को अनुक्रमित आदि का उपयोग करना चाहिए
Zig Mandel

4
क्वेरी भाषा और लेन-देन अलगाव अलग-अलग चीजें हैं , आप उन्हें मिलाते हुए प्रतीत होते हैं। मैं बाद वाले (एसीआईडी लेनदेन ) के बारे में दावा कर रहा हूं । अपनी टिप्पणी में आप मान रहे हैं कि मैं पूर्व की बात कर रहा हूं। शायद कुछ हाइफ़न स्पष्ट करेंगे? मैं स्पष्ट रूप से किसी भी संदेह को दूर करने के लिए क्वेरी भाषा के मुद्दे का उल्लेख करूंगा।
user2771609

8

यदि आप कागजात पढ़ते हैं, तो बिगटेबल यह है और डेटास्टोर मेगास्टोर है । Datastore BigTable प्लस प्रतिकृति, लेनदेन और सूचकांक है। (और अधिक महंगा है)।


क्या यह वास्तव में अधिक महंगा है? BigTable के लिए न्यूनतम 3 नोड है, 10GB HDD पर यह $ 1400 / मो है। लगता है बहुत उच्च नहीं?
बेन्जी

@बेन, मेरे पिछले अनुभव में यह था। डाटास्टोर को प्रति घंटे के बजाय प्रति-ऑपरेशन चार्ज किया जाता है। (यदि आप इसका इतना उपयोग नहीं करते हैं, तो हाँ आप डेटास्टर का अधिक भुगतान नहीं करते हैं। लेकिन अगर आपके पास उच्च ट्रैफ़िक है और फिर मुझे लगता है कि बिगटेबल बहुत सस्ता है।) मुझे लगता है कि बिगटेबल प्रति सेकंड 10k ऑप्स का दावा करता है? वास्तव में मैंने इसे कम पाया, जैसे कि लगभग 1-2k, लेकिन फिर भी 3 नोड्स> 5k / s है। यदि आप एक महीने के लिए उस थ्रूपुट को बनाए रखते हैं और डेटासोर मूल्य निर्धारण के लिए मैप करते हैं, तो यह संभवतः 1.4k से बहुत अधिक है।
जस्टिन झांग

मेगास्टोर का लिंक टूटा हुआ है
gstackoverflow

7

मैं ऊपर दिए गए सभी उत्तरों को संक्षेप में बताने की कोशिश करने जा रहा हूं, जो कि कर्सिया Google क्लाउड प्लेटफॉर्म बिग डेटा और मशीन लर्निंग फंडामेंटल में दिए गए हैं

+---------------------+------------------------------------------------------------------+------------------------------------------+--+
|      Category       |                             BigTable                             |                Datastore                 |  |
+---------------------+------------------------------------------------------------------+------------------------------------------+--+
| Technology          | Based on HBase(uses HBase API)                                   | Uses BigTable itself                     |  |
| ----------------    |                                                                  |                                          |  |
| Access Mataphor     | Key/Value (column-families) like Hbase                           | Persistent hashmap                       |  |
| ----------------    |                                                                  |                                          |  |
| Read                | Scan Rows                                                        | Filter Objects on property               |  |
| ----------------    |                                                                  |                                          |  |
| Write               | Put Row                                                          | Put Object                               |  |
| ----------------    |                                                                  |                                          |  |
| Update Granularity  | can't update row ( you should write a new row, can't update one) | can update attribute                     |  |
| ----------------    |                                                                  |                                          |  |
| Capacity            | Petabytes                                                        | Terbytes                                 |  |
| ----------------    |                                                                  |                                          |  |
| Index               | Index key only (you should properly design the key)              | You can index any property of the object |  |
| Usage and use cases | High throughput, scalable flatten data                           | Structured data for Google App Engine    |  |
+---------------------+------------------------------------------------------------------+------------------------------------------+--+

इस छवि को भी देखें: यहाँ छवि विवरण दर्ज करें

यहाँ छवि विवरण दर्ज करें


2

एक अपेक्षाकृत मामूली बात पर विचार करें, नवंबर 2016 तक, बिगिटेबल पायथन क्लाइंट लाइब्रेरी अभी भी अल्फा में है, जिसका अर्थ है कि भविष्य में परिवर्तन पिछड़े संगत नहीं हो सकता है। इसके अलावा, बिगबैट पायथन लाइब्रेरी ऐप इंजन के मानक वातावरण के अनुकूल नहीं है। आपको लचीले एक का उपयोग करना होगा।


नवंबर 2016 तक, जावा के लिए समान है
अराम पारोनिक्यन

2

यह Google क्लाउड बिगटेबल और Google क्लाउड डेटास्टोर के साथ अन्य सेवाओं के बीच महत्वपूर्ण अंतर का एक और सेट हो सकता है। नीचे दी गई छवि में दिखाई गई सामग्री आपको सही सेवा का चयन करने में भी मदद कर सकती है।

यहाँ छवि विवरण दर्ज करें

यहाँ छवि विवरण दर्ज करें


1

यहाँ छवि विवरण दर्ज करें

Cloud Datastore is a highly-scalable NoSQL database for your applications.
Like Cloud Bigtable, there is no need for you to provision database instances.
Cloud Datastore uses a distributed architecture to automatically manage
scaling. Your queries scale with the size of your result set, not the size of your
data set.
Cloud Datastore runs in Google data centers, which use redundancy to
minimize impact from points of failure. Your application can still use Cloud
Datastore when the service receives a planned upgrade.

यहाँ छवि विवरण दर्ज करें

 Choose Bigtable if the data is:
Big
● Large quantities (>1 TB) of semi-structured or structured data
Fast
● Data is high throughput or rapidly changing
NoSQL
● Transactions, strong relational semantics not required
And especially if it is:
Time series
● Data is time-series or has natural semantic ordering
Big data
● You run asynchronous batch or real-time processing on the data
Machine learning
● You run machine learning algorithms on the data
Bigtable is designed to handle massive workloads at consistent low latency
and high throughput, so it's a great choice for both operational and analytical
applications, including IoT, user analytics, and financial data analysis.

0

Datastore सेवाओं की एक विस्तृत श्रृंखला के लिए अधिक तैयार और उपयुक्त है, विशेष रूप से माइक्रोसिस्टर्स के लिए।

डेटास्टोर की अंतर्निहित तकनीक बिग टेबल है, इसलिए आप कल्पना कर सकते हैं कि बिग टेबल अधिक शक्तिशाली है।

डेटासटोर प्रति दिन 20K मुफ्त ऑपरेशन के साथ आते हैं, आप शून्य लागत वाले विश्वसनीय DB के साथ एक सर्वर की मेजबानी करने की उम्मीद कर सकते हैं।

आप इस डाटस्टोर ओआरएम लाइब्रेरी को भी देख सकते हैं, यह बहुत बड़ी सुविधा के साथ आता है https://www.npmjs.com/package/ts-datastore-orm

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.