डेटा कितना बड़ा है और डेटाबेस और एक-दूसरे (और आप) के बीच के लिंक कितने तेज़ हैं? विचारों की एक संख्या है:
यदि डेटा इतना छोटा है कि यह व्यावहारिक है, तो SELECT * FROM <table> ORDER BY <pk>
प्रत्येक DB पर चलाएं , परिणामों को एक टैब या अल्पविराम सीमांकित फ़ाइल में सहेजें (संरेखित नहीं किया गया जो कि परिणामस्वरूप फ़ाइल आकार को बड़े पैमाने पर उड़ाता है) और आपके पसंदीदा भिन्न प्रकार के साथ परिणामी आउटपुट की तुलना करें विनमर जैसे उपयोगिता। इस तरह से आप बिल्कुल सभी डेटा की तुलना कर रहे हैं ।
यदि डेटाबेस एक दूसरे को देख सकते हैं (सबसे अधिक संभावना है कि वे प्रतिकृति भागीदारों के रूप में काम करने में सक्षम हैं) और उनके बीच की कड़ी उच्च बैंडविड्थ और कम पर्याप्त विलंबता है, तो आप लिंक किए गए सर्वर कार्यक्षमता का उपयोग कर सकते हैं (देखें http://msdn.microsoft .com / en-us / पुस्तकालय / ms190479.aspx और संबंधित प्रलेखन) एसक्यूएल बयानों की एक जोड़ी में तालिकाओं की सामग्री की तुलना करने के लिए (पंक्तियों को सूचीबद्ध <table>
करना जिसमें समान पंक्तियाँ नहीं हैं <linked_server>.<db>..<table>
और इसके विपरीत) आप दो स्थानीय तालिकाओं की सामग्री की तुलना करेंगे। यह संभावित रूप से धीमा विकल्प है, लेकिन स्वचालित करने के लिए काफी शक्तिशाली जांच हो सकती है।
यदि आपको चेकसम का उपयोग करने की आवश्यकता है क्योंकि आप स्थानांतरित किए जाने वाले डेटा की मात्रा को बहुत कम करना चाहते हैं, HASHBYTES
तो CHECKSUM
फ़ंक्शंस के परिवार के बजाय उपयोग करें क्योंकि आप बेहतर गुणवत्ता वाले हैश का उपयोग कर सकते हैं ताकि आप उनके द्वारा बराबर आने का अधिक आश्वासन दें। यह अधिक सीपीयू इंटेंसिव है, लेकिन बड़ी मात्रा में डेटा के लिए आप I / O बाध्य होंगे, सीपीयू बाध्य नहीं होगा, इसलिए कई चक्रों को छोड़ दिया जाएगा (और छोटी मात्रा के लिए बस कोई फर्क नहीं पड़ेगा)।
सभी डेटा कैरेक्टर-फॉर-कैरेक्टर की तुलना करने और सभी डेटा को कवर करने वाले एकल चेकसम की तुलना करने के बीच एक मध्य-मैदान के रूप में, आप SELECT <pk>, HASHBYTES('SHA1', <all-other-fields-concatenated>) ORDER BY <pk>
प्रत्येक डेटाबेस से निर्यात कर सकते हैं और उन परिणामों की तुलना करके देख सकते हैं कि क्या वे समान हैं (या SELECT HASHBYTES('SHA1', <all-other-fields-concatenated>) ORDER BY <pk>
डेटा की मात्रा कम करने के लिए बहती है, लेकिन आउटपुट में पीके होने का मतलब है कि आप उन पंक्तियों की पहचान कर सकते हैं जो अलग-अलग हैं, यदि कोई हो, कम प्रश्नों के साथ)। बेशक यह अंतिम विकल्प व्यर्थ है यदि औसत पंक्ति में डेटा परिणामी हैश से छोटा है, तो उस स्थिति में " सब कुछ की तुलना करें " विकल्प अधिक कुशल होगा।