मुख्य उदाहरणों में से एक है जो MapReduce की शक्ति का प्रदर्शन करने में उपयोग किया जाता है, वह है टेरासॉर्ट बेंचमार्क । मुझे MapReduce वातावरण में उपयोग किए जाने वाले सॉर्टिंग एल्गोरिदम की मूल बातें समझने में परेशानी हो रही है।
मुझे छाँटने के लिए बस अन्य सभी तत्वों के संबंध में एक तत्व की सापेक्ष स्थिति का निर्धारण करना शामिल है। इसलिए छंटाई में "सब कुछ" की तुलना "सब कुछ" से करना शामिल है। आपका औसत छँटाई एल्गोरिथ्म (त्वरित, बुलबुला, ...) बस यह एक स्मार्ट तरीके से करता है।
मेरे दिमाग में कई टुकड़ों में डेटासेट को विभाजित करने का मतलब है कि आप एक टुकड़े को सॉर्ट कर सकते हैं और फिर आपको अभी भी इन टुकड़ों को 'पूर्ण' पूरी तरह से छंटे हुए डेटासेट में एकीकृत करना होगा। हजारों प्रणालियों पर वितरित टेराबाइट डेटासेट को देखते हुए मुझे उम्मीद है कि यह एक बहुत बड़ा काम होगा।
तो यह वास्तव में कैसे किया जाता है? यह MapReduce छँटाई एल्गोरिथ्म कैसे काम करता है?
मुझे समझने में मदद करने के लिए धन्यवाद।