ईटीएल पर ईएलटी प्रक्रिया का उपयोग करने के पक्ष में तर्क क्या हैं?


19

मैंने महसूस किया कि मेरी कंपनी ईटीएल (एक्सट्रैक्ट-ट्रांसफॉर्म-लोड) प्रक्रिया का उपयोग करने के बजाय एक ईएलटी (एक्सट्रैक्ट-लोड-ट्रांसफॉर्म) प्रक्रिया का उपयोग करती है।
दो दृष्टिकोणों में क्या अंतर हैं और किन स्थितियों में एक दूसरे से "बेहतर" होगा? यदि आप कुछ उदाहरण प्रदान कर सकें तो बहुत अच्छा होगा।

जवाबों:


13

ईटीएल बनाम ईएलटी के बारे में बहुत सारी चर्चाएँ।

ईटीएल बनाम ईएलटी के बीच मुख्य अंतर यह है कि प्रसंस्करण होता है ईटीएल डेटा का प्रसंस्करण ईटीएल टूल में होता है (आमतौर पर रिकॉर्ड-ऑन-ए-टाइम और मेमोरी में) डेटा का ईएलटी प्रसंस्करण डेटाबेस इंजन में होता है

डेटा समान है और डेटा के अंतिम परिणाम दोनों तरीकों से प्राप्त किए जा सकते हैं।

यह बहुत कुछ आप और आपके पर्यावरण पर निर्भर करता है यदि आपके पास एक मजबूत डेटाबेस इंजन और अच्छा हार्डवेयर है और आप इस पर भारी प्रसंस्करण कर सकते हैं, तो ईएलटी आपके लिए अच्छा है, यदि आपके पास एक व्यस्त डेटावेयर इंजन है और आपको इसे प्रसंस्करण से मुक्त करने की आवश्यकता है ETL के लिए।

ध्यान दें कि ETL टूल होने से आपको दोनों विकल्प मिलते हैं, जैसे ETL (T), आप ETL टूल में परिवर्तन कर सकते हैं और आप डेटाबेस इंजन में भी परिवर्तन कर सकते हैं

लेकिन ईएलटी में आपके पास केवल डेटाबेस इंजन में परिवर्तन का विकल्प होता है, लेकिन आपको पता होना चाहिए कि डेटाबेस डेटाबेस पर आधारित ईटीएल उपकरणों के रिकॉर्ड से बेहतर है।

इसी तरह के सवाल एसओ पर पूछे गए लेकिन ईटीएल का समर्थन करते हुए और ईटीएल बनाम ईएलटी की तुलना करते हुए एक अच्छा लेख भी है , लेकिन ईएलटी के पक्ष में


10

यह लगभग शब्दार्थ की बात है। इस बारे में चर्चाओं में बहुत गर्म हवा निकलती है लेकिन मुझे वास्तव में यकीन नहीं है कि दोनों के बीच अंतर करने के लिए कोई वास्तविक दार्शनिक गहराई है।

कुछ स्तर पर आप ETL को क्लाइंट-साइड टूल में डेटा को अंतिम रूप से लोड करने से पहले ट्रांसलेट करने के रूप में देख सकते हैं, ईएलटी का अर्थ है कि डेटा को किसी प्रकार के स्टेजिंग एरिया में अपेक्षाकृत कम बदलाव के साथ ट्रांसफर किया जाता है। 'परिवर्तन' बाद में होता है।

ये बहुत शराबी परिभाषाएं हैं और इसे कई तरह के तकनीकी आर्किटेक्चर पर लागू किया जा सकता है, और कई संभावित डिजाइन हैं जिनका वर्णन करने के लिए या तो शब्द का उपयोग किया जा सकता है।

मैं एक वास्तुकला के पक्ष में बहुत दृढ़ता से हूं जहां सभी परिवर्तन और व्यावसायिक तर्क को अधिक या कम सजातीय कोड आधार में बनाया जा सकता है, और मैंने बहुत सारे सिस्टम किए हैं जहां परिवर्तन तर्क काफी जटिल था। यह डेटा को लैंड करने के लिए केवल ETL टूल का उपयोग करने के लिए किया गया था और फिर सभी परिवर्तन को संग्रहीत प्रक्रियाओं में किया गया था। संभवतः इसे ईटीएल या ईएलटी के रूप में वर्णित किया जा सकता है, जिसमें अंतर केवल शब्दार्थ में से एक है।

कुछ उपकरण बहुत डेटाबेस केंद्रित हैं, हालांकि (ओरेकल डेटा इंटीग्रेटर, उदाहरण के लिए, अक्सर एक ईएलटी उपकरण के रूप में जाना जाता है)। यदि आप इस दृश्य की सदस्यता लेते हैं, तो डेटा निकालने से पहले 'एक्सट्रैक्ट' और 'लोड' हो रहे हैं क्योंकि वे एक स्टेजिंग क्षेत्र में उतारे जा रहे हैं और फिर SQL या PL / SQL कोड (जो टूल द्वारा उत्पन्न हो सकते हैं) द्वारा क्रंच किए गए हैं हस्तलिखित)। कई लोगों ने मुझे ODI के प्रमुख गुण के संबंध में बात करने के लिए कहा है क्योंकि यह OWB नहीं है।

यदि आप Informatica Powercentre या MS SQL Server एकीकरण सेवाओं जैसे क्लाइंट-साइड टूल का उपयोग करते हैं तो टूल डेटा क्लाइंट-साइड में व्यापक परिवर्तन कर सकता है। कुछ ईटीएल उपकरण, जैसे कि एस्केन्शियल डेटास्टेज और एब इनिटियो को गति के लिए फ्लैट फ़ाइलों और इन-मेमोरी डेटा संरचनाओं के साथ बहुत काम करने के लिए डिज़ाइन किया गया है। इस तरह की वास्तुकला में परिवर्तन लोड होने से पहले ही किया जा चुका है। शायद इस प्रकार की वास्तुकला को निश्चित रूप से 'ईटीएल' के रूप में वर्गीकृत किया जा सकता है, हालांकि मैंने कई उपकरण-केंद्रित परियोजनाएं देखी हैं, जहां सभी वास्तविक कार्य संग्रहीत प्रक्रिया कोड के एक समूह द्वारा किए जाते हैं।

विभिन्न औजारों और स्थापत्य दृष्टिकोणों के फायदे हैं, लेकिन कोई भी 'ईटीएल' बनाम 'ईएलटी' दृष्टिकोण के गुणों के बारे में कंबल बयान नहीं कर सकता है क्योंकि शब्द इतने व्यापक हैं कि अंतर लगभग अर्थहीन है। कुछ टूल और आर्किटेक्चर के विशिष्ट लाभ हो सकते हैं - उदाहरण के लिए, एब इनिटियो की फ्लैट फ़ाइलों का भारी उपयोग इसे अन्य डेटा संस्करणों पर एक महत्वपूर्ण प्रदर्शन लाभ देता है।

व्यवहार में, 'ईटीएल' और 'ईएलटी' के बीच का अंतर बनाना सिस्टम की आवश्यकताओं, प्लेटफॉर्म और तकनीकी वास्तुकला की बहुत गहरी चर्चा में जाने के बिना बहुत अर्थहीन है।


1

यह पैसे की बात भी है। जहां डेटा वॉल्यूम अधिक होता है, जैसे कि आप इंगित करते हैं, एब इनिटियो और डेटास्टेज पैरेलल एक्सटेंडर जैसे फ्लैट-फाइल आधारित समाधान वास्तव में तेज़ होते हैं, लेकिन मध्य-से-उच्च छह-आंकड़ा प्रस्ताव हो सकते हैं। IRI CoSort बहुत ईटीएल-केंद्रित (उनकी ईएलटी तुलना के अनुसार) है, और एकमात्र किफायती तरीका मैंने फ़ाइल-सिस्टम गति के साथ परिवर्तन की मात्रा को संबोधित करने के लिए देखा है, इसके अलावा एक जटिल हडॉप कार्यान्वयन भी है। मुझे भी लगता है कि समस्या पर हार्डवेयर फेंकना आम तौर पर (जो ईएलटी उपकरण और इन-मेमोरी डीबी भी करते हैं), या तो लागत-वार नहीं है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.