मैं निम्नलिखित समस्या में आया हूं, कि मैं समेट रहा हूं बल्कि विशिष्ट है।
मेरे पास कुछ बड़े आंकड़े हैं, कहते हैं, कुछ मिलियन पंक्तियाँ। मैं इस पर कुछ गैर-तुच्छ विश्लेषण चलाता हूं, जैसे एक SQL क्वेरी जिसमें कई उप-प्रश्न शामिल हैं। मुझे कुछ परिणाम मिलता है, उदाहरण के लिए, बताते हैं कि समय के साथ संपत्ति X बढ़ती जा रही है।
अब, दो संभावित चीजें हैं जो उस तक ले जा सकती हैं:
- एक्स वास्तव में समय के साथ बढ़ रहा है
- मेरे विश्लेषण में एक बग है
मैं कैसे परीक्षण कर सकता हूं कि पहले हुआ, दूसरे के बजाय? एक चरण-वार डिबगर, भले ही कोई मौजूद हो, मदद नहीं करेगा, क्योंकि मध्यवर्ती परिणाम में अभी भी लाखों लाइनें शामिल हो सकती हैं।
केवल एक चीज जिसके बारे में मैं सोच सकता था, वह यह था कि संपत्ति के साथ एक छोटा, सिंथेटिक डेटा तैयार किया जाए जिसे मैं एक इकाई परीक्षण के रूप में उस पर विश्लेषण और चलाना चाहता हूं। क्या ऐसा करने के लिए उपकरण हैं? विशेष रूप से, लेकिन SQL तक सीमित नहीं है।