मैं आमतौर पर इनपुट के रूप में कुछ ज्ञात डेटा का उपयोग करके अपना स्वयं का उत्पादन करता हूं - यदि यह बहुत यादृच्छिक है, तो यह हमेशा एक अच्छा परीक्षण नहीं होता है; मुझे अपने अंतिम उत्पाद के समान डेटा वितरित करने की आवश्यकता है।
सभी बड़े डेटाबेस जिन्हें मुझे ट्यून करना है वे प्रकृति में वैज्ञानिक हैं - इसलिए मैं आमतौर पर इनपुट के रूप में कुछ अन्य जांच कर सकता हूं, और इसे फिर से जोड़ सकता हूं और घबराना जोड़ सकता हूं। (उदाहरण के लिए, ऐसा डेटा लेना जो मिलीसेकंड परिशुद्धता के साथ 5 मिनट के ताल पर था, और इसे 10 सेकंड के ताल w / मिलिसकंड की सटीकता में बदल दिया गया था, लेकिन समय के लिए एक +/- 100 एमएस घबराना)
...
लेकिन, एक अन्य विकल्प के रूप में, यदि आप अपना स्वयं का लिखना नहीं चाहते हैं, तो कुछ बेंचमार्किंग टूल को देखना है - क्योंकि वे प्रशिक्षण सेट के आधार पर चीजों को बार-बार दोहरा सकते हैं, आप उन्हें बहुत से सम्मिलित करने के लिए उपयोग कर सकते हैं अभिलेखों का (और उसके बाद रिपोर्ट को केवल इस बात पर ध्यान न दें कि यह कितनी तेजी से हुआ) ... और फिर आप परीक्षण के लिए उसी टूल का उपयोग कर सकते हैं कि एक बार पॉपुलेट होने के बाद डेटाबेस कितनी तेजी से कार्य करता है।