सीधे घोड़े के मुंह से :
Hadoop कमोडिटी हार्डवेयर से निर्मित बड़े क्लस्टर पर एप्लिकेशन चलाने के लिए एक रूपरेखा है। Hadoop फ्रेमवर्क पारदर्शी रूप से विश्वसनीयता और डेटा प्रस्ताव दोनों को प्रदान करता है। Hadoop मैप / रिड्यूस नामक एक कम्प्यूटेशनल प्रतिमान को लागू करता है, जहां एप्लिकेशन को काम के कई छोटे टुकड़ों में विभाजित किया जाता है, जिनमें से प्रत्येक को क्लस्टर में किसी भी नोड पर निष्पादित या पुन: निष्पादित किया जा सकता है। इसके अलावा, यह एक वितरित फ़ाइल सिस्टम (HDFS) प्रदान करता है जो गणना नोड पर डेटा संग्रहीत करता है, जो क्लस्टर में बहुत अधिक कुल बैंडविड्थ प्रदान करता है। मैप / कम और वितरित फ़ाइल सिस्टम दोनों को डिज़ाइन किया गया है ताकि नोड विफलताओं को स्वचालित रूप से फ्रेमवर्क द्वारा नियंत्रित किया जा सके।
मैप / रिड्यूस एक प्रोग्रामिंग प्रतिमान है जिसे Google द्वारा लोकप्रिय बनाया गया था जहां एक कार्य को छोटे भागों में विभाजित किया जाता है और प्रसंस्करण (मानचित्र) के लिए बड़ी संख्या में नोड्स को वितरित किया जाता है, और फिर परिणामों को अंतिम उत्तर में संक्षेपित किया जाता है (कम करें )। Google और याहू इसका उपयोग अपनी खोज इंजन प्रौद्योगिकी के लिए, अन्य चीजों के बीच करते हैं।
इस प्रकार की प्रसंस्करण योजना को लागू करने के लिए Hadoop एक सामान्य रूपरेखा है। जैसे कि यह गधे को क्यों मारता है, ज्यादातर इसलिए क्योंकि यह गलत सहिष्णुता जैसी साफ-सुथरी सुविधाएँ प्रदान करता है और आपको प्रोसेसिंग करने के लिए किसी भी तरह के हार्डवेयर को एक साथ लाने की सुविधा देता है। यह भी बहुत अच्छी तरह से तराजू, बशर्ते आपकी समस्या प्रतिमान फिट बैठती है।
आप वेबसाइट पर इसके बारे में सब पढ़ सकते हैं ।
कुछ उदाहरणों के अनुसार, पॉल ने कुछ दिए, लेकिन यहां कुछ और भी आप कर सकते हैं जो इतने वेब केंद्रित नहीं हैं:
- एक 3 डी फिल्म का प्रतिपादन। "मैप" चरण हर फ्रेम के लिए ज्यामिति को एक अलग नोड में वितरित करता है, नोड्स इसे प्रस्तुत करते हैं, और प्रदान किए गए फ़्रेम "कम" चरण में पुनर्संयोजित होते हैं।
- एक आणविक मॉडल में एक प्रणाली में ऊर्जा की गणना। सिस्टम प्रक्षेपवक्र के प्रत्येक फ्रेम को "मैप" चरण में नोड में वितरित किया जाता है। नोड्स प्रत्येक फ्रेम के लिए ऊर्जा की गणना करते हैं,
और फिर परिणामों को "कम" चरण में संक्षेपित किया जाता है।
अनिवार्य रूप से मॉडल एक समस्या के लिए बहुत अच्छी तरह से काम करता है जिसे समान असतत संगणना में तोड़ा जा सकता है जो पूरी तरह से स्वतंत्र हैं, और अंतिम परिणाम का उत्पादन करने के लिए पुनर्संयोजित किया जा सकता है।