परीक्षण डेटा के बड़े डेटासेट उत्पन्न करने के लिए उपकरण [बंद]


25

कई बार जब एक कुशल डेटाबेस डिजाइन के साथ आने का प्रयास किया जाता है, तो कार्रवाई का सबसे अच्छा कोर्स दो नमूना डेटाबेस का निर्माण करना होता है, उन्हें डेटा से भरना होता है, और उनके खिलाफ कुछ क्वेरीज़ चलाने के लिए यह देखना होता है कि कौन सा बेहतर प्रदर्शन करता है।

क्या कोई ऐसा टूल है जो (डेटा को डेटाबेस में सीधे) उत्पन्न करेगा (अपेक्षाकृत ~ 10,000 रिकॉर्ड) अपेक्षाकृत तेज़ी से परीक्षण डेटा के सेट? मुझे कम से कम MySQL के साथ काम करने वाली चीज़ की तलाश है।

जवाबों:


12

सबसे अच्छा उपकरण (यदि आप इसे पा सकते हैं) DataFactory है। (प्रिंट से दुखी)। मैंने इसमें से बिल्कुल रमणीय (और काफी प्रामाणिक दिखने वाला) डेटासेट उत्पन्न किया है।

Generatedata.com ... स्वीकार्य है, लेकिन बहुत अच्छे पैमाने पर नहीं है।

DataGenerator पर नज़र रखने के लिए कुछ है।

और जबकि DTM डेटा जेनरेटर क्लंकी है और DataFactory के लिए एक खराब विकल्प है, यह मौजूद है और बेचा जा रहा है, और मैंने इसका उपयोग हल्के से स्वीकार्य डेटा उत्पन्न करने के लिए किया है।


9

RedGate में एक उपकरण है जो आप खोज रहे हैं, लेकिन यह गंतव्य MS SQL सर्वर होना है।

http://www.red-gate.com/products/sql-development/sql-data-generator

आप निम्नलिखित लेख को भी देख सकते हैं:

http://www.sqlservercentral.com/articles/Advanced+Querying/jointestdata/197/


Redgate sql डेटा जनरेटर के लिए +1
Aim Kai

4

मैं आमतौर पर इनपुट के रूप में कुछ ज्ञात डेटा का उपयोग करके अपना स्वयं का उत्पादन करता हूं - यदि यह बहुत यादृच्छिक है, तो यह हमेशा एक अच्छा परीक्षण नहीं होता है; मुझे अपने अंतिम उत्पाद के समान डेटा वितरित करने की आवश्यकता है।

सभी बड़े डेटाबेस जिन्हें मुझे ट्यून करना है वे प्रकृति में वैज्ञानिक हैं - इसलिए मैं आमतौर पर इनपुट के रूप में कुछ अन्य जांच कर सकता हूं, और इसे फिर से जोड़ सकता हूं और घबराना जोड़ सकता हूं। (उदाहरण के लिए, ऐसा डेटा लेना जो मिलीसेकंड परिशुद्धता के साथ 5 मिनट के ताल पर था, और इसे 10 सेकंड के ताल w / मिलिसकंड की सटीकता में बदल दिया गया था, लेकिन समय के लिए एक +/- 100 एमएस घबराना)

...

लेकिन, एक अन्य विकल्प के रूप में, यदि आप अपना स्वयं का लिखना नहीं चाहते हैं, तो कुछ बेंचमार्किंग टूल को देखना है - क्योंकि वे प्रशिक्षण सेट के आधार पर चीजों को बार-बार दोहरा सकते हैं, आप उन्हें बहुत से सम्मिलित करने के लिए उपयोग कर सकते हैं अभिलेखों का (और उसके बाद रिपोर्ट को केवल इस बात पर ध्यान न दें कि यह कितनी तेजी से हुआ) ... और फिर आप परीक्षण के लिए उसी टूल का उपयोग कर सकते हैं कि एक बार पॉपुलेट होने के बाद डेटाबेस कितनी तेजी से कार्य करता है।


3

मैं mysqlslap का उपयोग कर रहा हूं। यह खुद के बाद भी सफाई करता है।

यहां मैंने वह लेख पढ़ा है जब मैंने इसका उपयोग करना शुरू किया था।



2

इस फ़ंक्शन पर एक नज़र डालें। आप नाम, फोनोन्स एड्रेस, ज़िपकोड आदि उत्पन्न कर सकते हैं। यह पूरी तरह से MYSQL में किया जाता है, अन्य अनुप्रयोगों की कोई आवश्यकता नहीं है। http://moinne.com/blog/ronald/mysql/howto-generate-meaningful-test-data-using-a-mysql-function


1

सबसे अधिक लागत प्रभावी तरीका शायद एक खुले स्रोत या वाणिज्यिक डेटा जनरेटर का उपयोग करना है। मैं ऐसा करता था।

अब, मेरे स्वर्णिम वर्षों में, मैं एक और स्क्रिप्टिंग भाषा सीखने के लिए जनादेश के रूप में परीक्षण डेटा की प्रत्येक आवश्यकता को मानता हूं।


1

इस समस्या का एक अलग समाधान खोजने वाले किसी भी व्यक्ति के लिए ... मैंने डेटा सिंक्रोनाइज़ेशन स्टूडियो के लिए एक परीक्षण डेटा जनरेटर प्रोजेक्ट लिखा। यह यथार्थवादी परीक्षण डेटा की लाखों पंक्तियों के 1 से 100 के दशक तक बड़े डेटासेट उत्पन्न कर सकता है। यहाँ इसके बारे में एक ब्लॉग पोस्ट है। http://www.simego.com/Blog/2012/02/Test-Data-Generator-Download-for-Data-Sync यह 15 दिनों के लिए उपयोग करने के लिए (जब आप अपने परीक्षण डाटा है, तुम्हारे पास है) मुफ़्त है

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.