SQL सर्वर 2012 में दो बड़े परिणाम सेट की तुलना करने के लिए सबसे प्रभावी तरीका क्या है


9

दो बड़े परिणाम / पंक्ति सेट की तुलना करने के सबसे कुशल तरीके के लिए वर्तमान सलाह EXCEPTऑपरेटर का उपयोग करने के लिए प्रतीत होती है । पंक्ति आकार बढ़ने (@last मानों में परिवर्तन) के रूप में नीचे दी गई यह स्वयं की SQL स्क्रिप्ट बहुत अक्षम है। मैंने एक संयुक्त तालिका में अद्वितीय प्रविष्टियां खोजने की कोशिश की है लेकिन कोई सुधार नहीं हुआ है।

DECLARE @first AS INT, @step AS INT, @last AS INT; 

-- This script is comparing two record sets using EXCEPT
-- I want to find additions from OLD to NEW
-- As number of rows increase performance gets terrible
-- I don't have to use two tables. I could use one combined table but I want the same result as quickly as possible

-- Compare 100 to 110 rows - 0 seconds
-- Compare 1000 to 1010 rows - 1 seconds
-- Compare 10000 to 10010 rows - 16 seconds
-- Compare 100000 to 100010 rows - ABORT after 8 minutes (tables are populated in 18 seconds)

DECLARE @temptableOLD TABLE ([Result1] int);
SET @step = 1;  SET @first = 1; SET @last = 100000
WHILE(@first <= @last) BEGIN INSERT INTO @temptableOLD VALUES(@first) SET @first += @step END

DECLARE @temptableNEW TABLE ([Result1] int);
SET @step = 1;  SET @first = 1; SET @last = 100010
WHILE(@first <= @last) BEGIN INSERT INTO @temptableNEW VALUES(@first) SET @first += @step END

select * from @temptableNEW
except
select * from @temptableOLD

जवाबों:


8

EXCEPTएक DISTINCTऑपरेशन का मतलब है ।

NOT EXISTSअगर वास्तव में इसकी आवश्यकता नहीं है तो मैं इसका उपयोग करूंगा ।

हालाँकि आपको जो समस्या हो रही है, संभावना है कि टेबल वेरिएबल से जुड़ी खराब कार्डिनैलिटी के अनुमानों के कारण आपको एक अनिर्दिष्ट टेबल पर नेस्टेड लूप मिल रहे हैं।

select * from @temptableNEW
except
select * from @temptableOLD
OPTION (RECOMPILE)

खाते लेने में सक्षम होंगे कि तालिकाओं में प्रत्येक 100K पंक्तियाँ हैं और एक अलग योजना देती हैं।

SQL सर्वर 2012 में आप केवल अवरोधों के माध्यम से तालिका चर में अनुक्रमित जोड़ सकते हैं। यदि मूल्य अद्वितीय हैं, तो आप उपयोग कर सकते हैं

DECLARE @temptableOLD TABLE ([Result1] int UNIQUE CLUSTERED);

एक सूचकांक जोड़ने के लिए। यदि दोनों तालिकाओं पर योजना बनाई जाती है (recompile hint जोड़े जाने के बाद) संभवतः इसके बजाय मर्ज ज्वाइन का उपयोग करेगी। बिना किसी इंडेक्स के मुझे हैश ज्वाइन करने की उम्मीद होगी।


धन्यवाद मार्टिन। यह उत्तर है। विकल्प (RECOMPILE) ने मदद की (5 मिनट में 100,000), लेकिन दोनों तालिकाओं पर आधारित बड़े सुधार ने बड़ा सुधार किया (7 सेकंड में 100,000 !!!)। मैंने केवल एक वास्तविक जीवन की समस्या को प्रदर्शित करने के लिए इन तालिकाओं का निर्माण किया है जहाँ दो अलग-अलग SQL सर्वरों पर तालिका अनुक्रमण पर मेरा कोई नियंत्रण नहीं है, लेकिन मैं इसे ऐसे तालिका चर के माध्यम से प्रबंधित करूँगा।
विल हीली

4
@WillHealey #tempटेबल में टेबल वैरिएबल (आंकड़े, समानता, अधिक लचीली अनुक्रमणिका) पर बहुत अधिक फायदे हैं, इसलिए यदि आप इसका उपयोग इस संदर्भ में नहीं कर रहे हैं, जहां आप टेबल वैरिएबल तक सीमित हैं तो आप उन लोगों को भी आज़मा सकते हैं।
मार्टिन स्मिथ
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.