वर्तमान में, मैं दो डेटा सेटों की तुलना कर रहा हूं, जिनमें अद्वितीय StoreKey/ProductKey
संयोजन होते हैं ।
StoreKey/ProductKey
जनवरी 2012 से शुरू होकर मई 2014 के बीच बिक्री के लिए 1 डेटा सेट का अद्वितीय संयोजन है (परिणाम = 450K लाइनें)। 2 डी डेटा सेट में अद्वितीय StoreKey/ProductKey
संयोजन होते हैं, बिक्री के लिए जून 2014 से शुरू होता है, आज तक (परिणाम = 190K लाइनें)।
मैं उन StoreKey/ProductKey
संयोजनों को ढूंढना चाह रहा हूं जो 2 सेट में हैं, लेकिन 1 सेट में नहीं - यानी जून की शुरुआत से बेचे गए नए उत्पाद।
अब तक, मैंने दो डेटा सेट्स को टेम्प टेबल में डंप कर दिया है, दोनों कीज़ पर दोनों टेबलों के लिए इंडेक्स बनाए हैं, और EXCEPT
यूनीक आइटम खोजने के लिए स्टेटमेंट का उपयोग किया है ।
ऐसे बड़े डेटा सेट की तुलना करने का सबसे कुशल तरीका क्या है? क्या इस प्रकार की बड़ी तुलना करने का एक अधिक कुशल तरीका है?