क्या उपयोगी एल्गोरिदम मौजूद हैं जो विशाल डेटा धाराओं पर काम करते हैं और साथ ही उनके परिणाम काफी छोटे होते हैं और एक दो धाराओं के मिश्रण के लिए परिणाम की गणना किसी भी तरह से अपने परिणामों को मर्ज कर सकता है?
मैं कुछ नाम दे सकता हूं:
- योग, न्यूनतम, अधिकतम, गिनती, शीर्ष-के आदि जैसी स्पष्ट बातें।
- अनुमानित रूप से तथाकथित "स्केच-आधारित" स्ट्रीम एल्गोरिदम हिस्टोग्राम के लिए, अलग-अलग वस्तुओं की गणना या क्वांटिल की गणना करता है
अन्य क्या हैं?
(मुझे दिलचस्पी है क्योंकि मैं वितरित सिस्टम की निगरानी के लिए एक शौक परियोजना लिख रहा हूं जिसकी उपयोगिता सीधे इस तरह के एल्गोरिदम की उपयोगिता से निर्धारित होती है)