सुअर और छत्ता के बीच अंतर? क्यों है दोनों? [बन्द है]


256

मेरी पृष्ठभूमि - हाडोप दुनिया में 4 सप्ताह पुरानी है। Cloudera के Hadoop VM का उपयोग करके Hive, Pig और Hadoop में थोड़ा सा थपका। मैप-रिड्यूस और जीएफएस ( पीडीएफ लिंक ) पर Google का पेपर पढ़ा है ।

मैं समझता हूँ कि-

  • पिग की भाषा पिग लैटिन से एक बदलाव है (जिस तरह प्रोग्रामर सोचते हैं) एसक्यूएल प्रोग्रामिंग की घोषणात्मक शैली और हाइव की क्वेरी भाषा एसक्यूएल जैसा दिखता है।

  • सुअर Hadoop के शीर्ष पर बैठता है और सिद्धांत रूप में Dryad के शीर्ष पर भी बैठ सकता है। मैं गलत हो सकता हूं, लेकिन हाइव को हडोप के करीब रखा गया है।

  • पिग लैटिन और हाइव दोनों कमांड मैप और नौकरियों को कम करते हैं।

मेरा प्रश्न - जब एक (सुअर कहो) उद्देश्य पूरा कर सकता है तो दोनों होने का लक्ष्य क्या है। यह सिर्फ इसलिए है क्योंकि सुअर याहू द्वारा प्रचारित है! और हाइव फेसबुक द्वारा?


24
छत्ता संरचित डेटा के लिए है। सुअर असंरचित डेटा के लिए है।
डेड प्रोग्रामर

जवाबों:


151

एलन गेट्स, याहू पर सुअर वास्तुकार से इस पोस्ट को देखें!, जो कि तुलना करता है जब सुअर के बजाय हाइव जैसी एसक्यूएल का उपयोग करेगा। वह एक प्रक्रियात्मक भाषा जैसे सुअर (बनाम घोषित एसक्यूएल) की उपयोगिता और डेटाफ्लो डिजाइनरों के लिए इसकी उपयोगिता के रूप में एक बहुत ही ठोस मामला बनाता है।


एलन विशेष रूप से हाइव की चर्चा करते हुए एक लेख भी करते हैं, जैसा कि नीचे साझा j03m है। उससे अच्छा सामान!
डोलन एंटेनुची

14
छत्ता संरचित डेटा के लिए है। सुअर बिना डेटा के है।
डेड प्रोग्रामर

7
मैं उलझन में हूं। क्या आपके कहने का मतलब "[...] सुअर की तरह एक प्रक्रियात्मक भाषा की उपयोगिता है "? क्योंकि लेख बार-बार दावा करता है कि "पिग लैटिन प्रोसेडुरल है"।
मैट फेनविक

4
मुझे यकीन नहीं है कि यह अस्थायी है, लेकिन लगता है कि लेख समाप्त हो गया है। क्या आप लिंक को अपडेट कर सकते हैं (मैं इसे त्वरित खोज के साथ नहीं खोज सका)?
पीटर क्लीफेल

1
एलन गेट्स पोस्ट यहाँ है .. कृपया इसके माध्यम से जाएँ .. डेवलपर
yahoo.com/blogs/hadoop/…

57

हाइव को SQL के साथ सहज समुदाय के लिए अपील करने के लिए डिज़ाइन किया गया था। इसका दर्शन यह था कि हमें दूसरी स्क्रिप्टिंग भाषा की आवश्यकता नहीं है। हाइव मानचित्र का समर्थन करता है और उपयोगकर्ता की पसंद की भाषा में रूपांतरित लिपियों को कम करता है (जिसे एसक्यूएल क्लॉस के भीतर एम्बेड किया जा सकता है)। यह व्यापक रूप से फेसबुक में विश्लेषकों द्वारा एसक्यूएल के साथ-साथ पायथन में डेटा खनिक प्रोग्रामिंग द्वारा आराम से उपयोग किया जाता है। सुअर में एसक्यूएल संगतता प्रयासों को एएफएआईके छोड़ दिया गया है - इसलिए दोनों परियोजनाओं के बीच अंतर बहुत स्पष्ट है।

SQL सिंटैक्स का समर्थन करने का अर्थ यह भी है कि माइक्रोस्ट्रैटे जैसे मौजूदा बीआई उपकरण के साथ एकीकृत करना संभव है। हाइव में एक ODBC / JDBC ड्राइवर है (जो कि एक कार्य प्रगति पर है) जो इसे निकट भविष्य में होने दे। यह उन अनुक्रमणिकाओं के लिए समर्थन जोड़ना शुरू कर रहा है, जिन्हें ऐसे वातावरण में आम तौर पर ड्रिल-डाउन प्रश्नों के लिए समर्थन की अनुमति देनी चाहिए।

अंत में - यह सीधे सवाल के अनुकूल नहीं है - हाइव विश्लेषणात्मक प्रश्नों के प्रदर्शन के लिए एक रूपरेखा है। हालांकि इसका प्रमुख उपयोग फ्लैट फ़ाइलों को क्वेरी करना है, कोई कारण नहीं है कि यह अन्य दुकानों को क्वेरी नहीं कर सकता है। वर्तमान में Hive का उपयोग Hbase में संग्रहीत डेटा को क्वेरी करने के लिए किया जा सकता है (जो कि अधिकांश RDBMSes के हिम्मत में पाए जाने वाले की तरह एक महत्वपूर्ण-मूल्य की दुकान है), और HadoopDB परियोजना ने एक फ़ेडरेटेड RDBMS टीयर को क्वेरी करने के लिए Hive का उपयोग किया है।


37

मुझे यह सबसे उपयोगी लगा (हालांकि, यह एक साल पुराना है) - http://yahoohadoop.tumblr.com/post/98256601751/pig-and-hive-at-yahoo

यह विशेष रूप से सुअर बनाम हाइव के बारे में बात करता है और वे याहू पर कब और कहां कार्यरत हैं। मुझे यह बहुत ही व्यावहारिक लगा। कुछ दिलचस्प नोट:

वृद्धिशील परिवर्तन / डेटा सेट के अपडेट:

इसके बजाय, नए वृद्धिशील डेटा के खिलाफ जुड़ना और पिछले पूर्ण सम्मिलित होने के परिणामों के साथ परिणामों का उपयोग करना सही दृष्टिकोण है। इसमें कुछ ही मिनट लगेंगे। सुअर के लैटिन में इस वृद्धिशील तरीके से मानक डेटाबेस संचालन को लागू किया जा सकता है, जिससे सुअर इस उपयोग के मामले में एक अच्छा उपकरण बन जाएगा।

स्ट्रीमिंग के माध्यम से अन्य उपकरणों का उपयोग करने पर:

स्ट्रीमिंग के साथ सुअर एकीकरण भी शोधकर्ताओं के लिए एक पर्ल या पायथन स्क्रिप्ट लेना आसान बनाता है जो उन्होंने पहले ही एक छोटे डेटा सेट पर डीबग कर दी है और इसे एक विशाल डेटा सेट के खिलाफ चलाते हैं।

डेटा वेयरहाउसिंग के लिए हाइव का उपयोग करने पर:

दोनों मामलों में, रिलेशनल मॉडल और एसक्यूएल सबसे उपयुक्त हैं। दरअसल, डेटा वेयरहाउसिंग अपने इतिहास के अधिकांश माध्यमों से SQL के लिए मुख्य उपयोग मामलों में से एक रहा है। यह उन प्रकार के प्रश्नों और उपकरणों का समर्थन करने के लिए सही निर्माण करता है जो विश्लेषकों का उपयोग करना चाहते हैं। और यह पहले से ही क्षेत्र में उपकरण और उपयोगकर्ताओं दोनों द्वारा उपयोग में है।

Hadoop सबप्रोजेक्ट Hive, Hadoop के लिए एक SQL इंटरफ़ेस और रिलेशनल मॉडल प्रदान करता है। हाइव टीम ने ओडीबीसी जैसे इंटरफेस के माध्यम से बीआई उपकरण के साथ एकीकृत करने के लिए काम शुरू कर दिया है।


1
+1 महान याहू से तुलना करने के लिए, जो है, जो मैं सुअर के मूल निर्माता को समझता हूं, या कम से कम एक बहुत बड़ा प्रस्तावक हूं। संपादित करें: ऊपर जैकब से, मैं देखता हूं कि लेखक (एलन गेट्स) याहू पर सुअर वास्तुकार हैं - इतना बड़ा हिस्सा :)
Dolan Antenucci

3
लिंक मर चुका है। मुझे लगता है कि इस समय सही URL है: https://developer.yahoo.com/blogs/hadoop/pig-hive-yahoo-464.html
एग्री सिप 29'14

1
प्रति अद्यतित लिंक
j03m


ऊपर साझा किए गए 2 लिंक अधिक नहीं मिले हैं।
केशव प्रदीप रमानाथ

28

एक "dezyre" लेख से अखरोट के खोल में सुअर बनाम हाइव तुलना पर एक नज़र डालें

Hive PIG से बेहतर है : विभाजन, सर्वर, वेब इंटरफ़ेस और JDBC / ODBC समर्थन।

कुछ अंतर:

  1. हाइव है के लिए सबसे अच्छा संरचित डेटा और सुअर के लिए सबसे अच्छा है अर्द्ध संरचित डेटा

  2. हाइव का उपयोग प्रोग्रामिंग के लिए रिपोर्टिंग और पीआईजी के लिए किया जाता है

  3. हाइव को एक प्रक्रियात्मक भाषा के रूप में एक घोषणात्मक SQL और PIG के रूप में उपयोग किया जाता है

  4. छत्ता विभाजन का समर्थन करता है और PIG नहीं करता है

  5. हाइव एक वैकल्पिक थ्रिफ़ आधारित सर्वर और पीआईजी शुरू कर सकता है नहीं कर सकता

  6. हाइव तालिकाओं को पहले से परिभाषित करता है ( स्कीमा ) + एक डेटाबेस और पीआईजी में स्कीमा जानकारी संग्रहीत करता है करता है में डेटाबेस का एक समर्पित मेटाडेटा नहीं होता है

  7. हाइव एवरो नहीं बल्कि पीआईजी का समर्थन करता है करता है। संपादित करें: हाइव एवरो का समर्थन करता है, org.apache.hadoop.hive.serde2.avro के रूप में निर्दिष्ट करें

  8. सुअर बाहरी जोड़ो के प्रदर्शन के लिए अतिरिक्त COGROUP सुविधा का भी समर्थन करता है लेकिन छत्ता नहीं करता है। लेकिन हाइव और पीआईजी दोनों गतिशील रूप से शामिल, ऑर्डर और सॉर्ट कर सकते हैं ।


17

मुझे विश्वास है कि आपके प्रश्न का वास्तविक उत्तर यह है कि वे स्वतंत्र परियोजनाएं थीं / हैं और कोई केंद्रीय समन्वित लक्ष्य नहीं था। वे जल्दी ही अलग-अलग जगहों पर थे और दोनों परियोजनाओं के विस्तार के साथ समय के साथ ओवरलैप हो गए।

Hadoop O'Reilly पुस्तक से प्रकाशित:

सुअर: बहुत बड़े डेटासेट की खोज के लिए डेटाफ्लो भाषा और वातावरण।

छत्ता: एक वितरित डेटा वेयरहाउस


22
हाइव आरडीबीएमएस जैसा कुछ नहीं है। यह पिग की तरह सपाट फाइलों को प्रोसेस करता है। वे दोनों मूल रूप से एक ही काम करते हैं। आशावादी को देखें कि वे नौकरी का संकलन करते समय उपयोग करते हैं क्योंकि यह सबसे बड़ा वास्तविक अंतर है।
स्टीव सेवरेंस जूल

12

आप सुअर / छत्ता प्रश्नों के साथ समान परिणाम प्राप्त कर सकते हैं। मुख्य अंतर प्रश्नों को समझने / लिखने / बनाने के दृष्टिकोण के भीतर है।

सुअर डेटा के प्रवाह को बनाने के लिए जाता है: छोटे कदम जहां प्रत्येक में आप कुछ प्रसंस्करण करते हैं
हाइव आपको अपने डेटा पर काम करने के लिए SQL जैसी भाषा देता है, इसलिए RDBMS से परिवर्तन बहुत आसान है (सुअर उन लोगों के लिए आसान हो सकता है जिन्हें पहले अनुभव नहीं था SQL के साथ)

यह भी ध्यान देने योग्य है, कि Hive के लिए आप इस डेटा के साथ काम करने के लिए अच्छा इंटरफ़ेस (Beeswax for HUE, या Hive वेब इंटरफ़ेस) कर सकते हैं, और यह आपको अपने डेटा (स्कीमा, आदि) के बारे में जानकारी के लिए मेटास्टोर भी देता है, जो एक के रूप में उपयोगी है आपके डेटा के बारे में केंद्रीय जानकारी।

मैं अलग-अलग प्रश्नों के लिए हाइव और पिग दोनों का उपयोग करता हूं (मैं उस का उपयोग करता हूं जहां मैं क्वेरी को तेजी से / आसान लिख सकता हूं, मैं इसे इस तरह से अधिकतर तदर्थ प्रश्नों के लिए करता हूं) - वे इनपुट के रूप में एक ही डेटा का उपयोग कर सकते हैं। लेकिन वर्तमान में मैं अपना बहुत काम बीस्वाक्स के माध्यम से कर रहा हूं।


12

सुअर पाइपलाइन में किसी भी बिंदु पर डेटा और उपयोगकर्ता कोड लोड करने की अनुमति देता है। यह विशेष रूप से महत्वपूर्ण हो सकता है यदि डेटा स्ट्रीमिंग डेटा है, उदाहरण के लिए उपग्रहों या उपकरणों से डेटा।

Hive, जो RDBMS आधारित है, डेटा को पहले आयात (या लोड) किया जाना चाहिए और इसके बाद इस पर काम किया जा सकता है। इसलिए यदि आप स्ट्रीमिंग डेटा पर हाइव का उपयोग कर रहे थे, तो आपको नई बाल्टी डेटा को स्टोर करने के लिए अन्य बकेट्स का उपयोग करते समय बाल्टी (या फ़ाइलों) को भरना होगा और प्रत्येक भरे हुए बाल्टी पर हाइव का उपयोग करना होगा।

सुअर भी आलसी मूल्यांकन का उपयोग करता है। यह प्रोग्रामिंग की अधिक आसानी देता है और कोई इसका उपयोग हाइव जैसी भाषा जैसी SQL में अधिक स्वतंत्रता के साथ विभिन्न तरीकों से डेटा का विश्लेषण करने के लिए कर सकता है। इसलिए यदि आप वास्तव में आपके पास मौजूद कुछ डेटा में मैट्रिसेस या पैटर्न का विश्लेषण करना चाहते थे, और उन पर दिलचस्प गणना करना चाहते थे, तो सुअर के साथ आप कुछ उचित दूरी पर जा सकते हैं, जबकि हाइव के साथ, आपको परिणामों के साथ खेलने के लिए कुछ और चाहिए।

सुअर डेटा आयात में तेज है लेकिन हाइव जैसी RDBMS अनुकूल भाषा की तुलना में वास्तविक निष्पादन में धीमी है।

सुअर समानांतर रूप से अच्छी तरह से अनुकूल है और इसलिए संभवतः सिस्टम के लिए एक किनारे है जहां डेटासेट विशाल होते हैं, अर्थात उन प्रणालियों में जहां आप विलंबता की तुलना में अपने परिणामों के थ्रूपुट के बारे में अधिक चिंतित हैं (परिणाम का कोई विशेष डेटा प्राप्त करने का समय)।


10

छत्ता बनाम सुअर-

हाइव एसक्यूएल इंटरफ़ेस के रूप में है जो एसक्यूएल प्रेमी उपयोगकर्ताओं या टेबलू / माइक्रोस्ट्रैटी / किसी भी अन्य टूल या भाषा जैसे एसक्यूएल इंटरफेस की अनुमति देता है।

पीआईजी एक ईटीएल पाइपलाइन की तरह है..जबकि चरणबद्ध तरीके से कदम जैसे कि चर घोषित करना, लूपिंग, पुनरावृत्ति, सशर्त विभाजन आदि।

जब मैं स्टेप लॉजिक द्वारा जटिल कदम लिखना चाहता हूं तो हाइव QL पर पिग स्क्रिप्ट लिखना पसंद करता हूं। जब मैं डेटा को खींचने के लिए एक एकल वर्ग लिखने में सहज होता हूं, तो मैं चाहता हूं कि मैं हाइव का उपयोग करूं। हाइव के लिए आपको क्वेरी करने से पहले टेबल को परिभाषित करना होगा (जैसा कि आप RDBMS में करते हैं)

दोनों का उद्देश्य अलग-अलग है, लेकिन हुड के तहत, दोनों एक ही करते हैं, नक्शे को कम करने वाले कार्यक्रमों में परिवर्तित करते हैं। अपाचे ओपन सोर्स समुदाय के अलावा दोनों परियोजनाओं में अधिक से अधिक सुविधाओं को जोड़ते हैं


8

इस लिंक में PIG और HIVE के बीच का अंतर पढ़ें।

http://www.aptibook.com/Articles/Pig-and-hive-advantages-disadvantages-features

सभी पहलुओं को दिया गया है। यदि आप इस भ्रम में हैं कि किसे चुनना है तो आपको वह वेब पेज देखना होगा।


2
अच्छा लेख है, लेकिन आपको इसका उत्तर संक्षेप में देना चाहिए: meta.stackexchange.com/questions/8231/…
Gruber

7
  1. सुअर-लैटिन डेटा प्रवाह शैली है, सॉफ्टवेयर इंजीनियर के लिए अधिक उपयुक्त है। जबकि sql एनालिटिक्स व्यक्ति के लिए अधिक उपयुक्त है, जिन्हें sql की आदत होती है। जटिल कार्य के लिए, हाइव के लिए आपको मध्यवर्ती डेटा को संग्रहीत करने के लिए अस्थायी रूप से तालिका बनाना होगा, लेकिन यह सुअर के लिए आवश्यक नहीं है।

  2. सुअर-लैटिन जटिल डेटा संरचना (जैसे छोटे ग्राफ) के लिए उपयुक्त है। सुअर में एक डेटा संरचना होती है जिसे डेटाबाग कहा जाता है जो टुपल का एक संग्रह है। कभी-कभी आपको ऐसे मैट्रिक्स की गणना करने की आवश्यकता होती है, जिसमें कई ट्यूपल शामिल होते हैं (ट्यूपल्स के बीच एक छिपा हुआ लिंक होता है, इस मामले में मैं इसे ग्राफ कहूंगा)। इस मामले में, मेट्रिक्स की गणना करने के लिए एक यूडीएफ लिखना बहुत आसान है जिसमें कई ट्यूपल शामिल हैं। बेशक यह छत्ते में किया जा सकता है, लेकिन यह इतना सुविधाजनक नहीं है जितना कि सुअर में है।

  3. यूडीएफ को सुअर में लिखना मेरे विचार में हाइव की तुलना में अधिक आसान है।

  4. सुअर का कोई मेटाडेटा समर्थन नहीं है, (या यह वैकल्पिक है, भविष्य में यह hcatalog एकीकृत कर सकता है)। हाइव के पास टेबल्स मेटाडेटा डेटाबेस में संग्रहीत है।

  5. आप सूअर की स्क्रिप्ट को स्थानीय परिवेश में डीबग कर सकते हैं, लेकिन ऐसा करना हाइव के लिए कठिन होगा। कारण है बिंदु 3. आपको अपने स्थानीय वातावरण में, बहुत समय लेने वाले हाइव मेटाडेटा को स्थापित करने की आवश्यकता है।




4

लिंक से: http://www.aptibook.com/discuss-technical?uid=tech-hive4&question=What-kind-of-datawarehouse-application-is-suitable-for-Hive ?

हाइव एक पूर्ण डेटाबेस नहीं है। डिजाइन बाधा और Hadoop और HDFS की सीमाएं हाइव जो कर सकती हैं, उस पर सीमाएं लगाती हैं।

हाइव डेटा वेयरहाउस अनुप्रयोगों के लिए सबसे अनुकूल है, जहां

1) अपेक्षाकृत स्थिर डेटा का विश्लेषण किया जाता है,

2) तेजी से प्रतिक्रिया समय की आवश्यकता नहीं है, और

3) जब डेटा तेजी से नहीं बदल रहा है।

हाइव ओएलटीपी, ऑनलाइन ट्रांजेक्शन प्रोसेसिंग के लिए आवश्यक महत्वपूर्ण सुविधाएँ प्रदान नहीं करता है। यह एक ओएलएपी उपकरण, ऑनलाइन एनालिटिक प्रोसेसिंग के करीब है। तो, हाइव डेटा वेयरहाउस अनुप्रयोगों के लिए सबसे उपयुक्त है, जहां एक बड़ा डेटा सेट बनाए रखा जाता है और अंतर्दृष्टि, रिपोर्ट आदि के लिए खनन किया जाता है।


4

सरल शब्दों में, सुअर Hadoop के साथ उपयोग किए जाने वाले MapReduce प्रोग्राम बनाने के लिए एक उच्च-स्तरीय प्लेटफ़ॉर्म है, सुअर स्क्रिप्ट का उपयोग करके हम डेटा की बड़ी मात्रा को वांछित प्रारूप में संसाधित करेंगे।

एक बार संसाधित डेटा प्राप्त करने के बाद, यह संसाधित डेटा वांछित परिणाम प्राप्त करने के लिए बाद के प्रसंस्करण के लिए एचडीएफएस में रखा जाता है।

संग्रहित संसाधित डेटा के ऊपर हम वांछित परिणाम प्राप्त करने के लिए HIVE SQL कमांड लागू करेंगे, आंतरिक रूप से यह hive sql कमांड MAP Reduce प्रोग्राम चलाता है।


यह वास्तव में ज्ञान के आधार के लिए एक सार्थक अतिरिक्त नहीं है। अधिक जानकारी जोड़ने का प्रयास करें
agconti

4

संक्षेप में दोनों का बहुत उच्च स्तरीय अवलोकन देने के लिए:

1) सुअर हडूप पर एक संबंधपरक बीजगणित है

2) हाइव हूप पर एक एसक्यूएल है (सुअर से ऊपर का एक स्तर)


बीजगणित की तुलना दिलचस्प है
रवींद्र बाबू

3

HIVE क्या कर सकता है जो PIG में संभव नहीं है?

विभाजन HIVE का उपयोग करके किया जा सकता है लेकिन PIG में नहीं, यह आउटपुट को दरकिनार करने का एक तरीका है।

वह क्या कर सकता है जो HIVE में संभव नहीं है?

स्थिति-संबंधी संदर्भ - यहां तक ​​कि जब आपके पास फ़ील्ड नाम नहीं हैं, तो हम $ 0 जैसी स्थिति का उपयोग करके संदर्भ ले सकते हैं - पहले क्षेत्र के लिए, दूसरे के लिए $ 1 और इसी तरह।

और एक अन्य मूलभूत अंतर यह है कि PIG को मान लिखने के लिए स्कीमा की आवश्यकता नहीं होती है लेकिन HIVE को स्कीमा की आवश्यकता होती है।

आप JDBC और अन्य का उपयोग करके HIVE किसी भी बाहरी एप्लिकेशन से कनेक्ट कर सकते हैं लेकिन PIG के साथ नहीं।

नोट: दोनों HDFS के ऊपर चलता है (हडॉप वितरित फ़ाइल सिस्टम) और स्टेटमेंट को मैप रिड्यूस प्रोग्राम में बदल दिया जाता है।


3

जब हम Hadoopइस अर्थ में उपयोग कर रहे हैं तो इसका मतलब है कि हम बड़ी डेटा प्रोसेसिंग की कोशिश कर रहे हैं की । का अंतिम लक्ष्य सामग्री / रिपोर्ट तैयार करना होगा।

इसलिए इसमें आंतरिक रूप से 2 प्रमुख गतिविधियाँ शामिल हैं:

1) डेटा प्रोसेसिंग लोड हो रहा है

2) सामग्री उत्पन्न करें और इसका उपयोग रिपोर्टिंग / आदि के लिए करें।

लोड हो रहा है / डेटा प्रोसेसिंग -> सुअर इसमें मददगार होगा।

यह ईटीएल के रूप में मदद करता है (हम सुअर स्क्रिप्ट का उपयोग करके ईटीएल संचालन कर सकते हैं।)।

एक बार परिणाम संसाधित होने के बाद हम संसाधित परिणाम के आधार पर रिपोर्ट तैयार करने के लिए हाइव का उपयोग कर सकते हैं।

छत्ता: इसकी गोदाम प्रसंस्करण के लिए hdfs के शीर्ष पर बनाया गया है।

हम सुअर से उत्पन्न सामग्री से छत्ते का उपयोग करके आसानी से एडहॉक रिपोर्ट उत्पन्न कर सकते हैं।


1

सुअर कुछ भी खाता है! मतलब यह असंरचित डेटा का उपभोग कर सकता है।

हाइव को एक स्कीमा की आवश्यकता होती है।


1

सुअर आम तौर पर बोलने वाले ईटीएल तरह के वर्कलोड के लिए उपयोगी है। उदाहरण के लिए परिवर्तनों का सेट आपको हर दिन अपने डेटा पर करना होगा।

जब आपको एडहॉक क्वेरीज़ चलाने की ज़रूरत होती है या केवल डेटा एक्सप्लोर करना होता है, तो हाइव चमकता है। यह कभी-कभी आपके विज़ुअलाइज़ेशन लेयर (Tableau / Qlikview) के इंटरफ़ेस के रूप में कार्य कर सकता है।

दोनों आवश्यक हैं और अलग-अलग उद्देश्य हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.