परीक्षण डेटा के बड़े डेटासेट उत्पन्न करने के लिए उपकरण [बंद]

25

बन्द है। यह सवाल ऑफ टॉपिक है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है।

इस प्रश्न को सुधारना चाहते हैं? प्रश्न अपडेट करें तो यह है विषय पर डाटाबेस प्रशासक स्टैक एक्सचेंज के लिए।

5 साल पहले बंद हुआ ।

कई बार जब एक कुशल डेटाबेस डिजाइन के साथ आने का प्रयास किया जाता है, तो कार्रवाई का सबसे अच्छा कोर्स दो नमूना डेटाबेस का निर्माण करना होता है, उन्हें डेटा से भरना होता है, और उनके खिलाफ कुछ क्वेरीज़ चलाने के लिए यह देखना होता है कि कौन सा बेहतर प्रदर्शन करता है।

क्या कोई ऐसा टूल है जो (डेटा को डेटाबेस में सीधे) उत्पन्न करेगा (अपेक्षाकृत ~ 10,000 रिकॉर्ड) अपेक्षाकृत तेज़ी से परीक्षण डेटा के सेट? मुझे कम से कम MySQL के साथ काम करने वाली चीज़ की तलाश है।

mysql tools performance-testing

— BenV
स्रोत

12

सबसे अच्छा उपकरण (यदि आप इसे पा सकते हैं) DataFactory है। (प्रिंट से दुखी)। मैंने इसमें से बिल्कुल रमणीय (और काफी प्रामाणिक दिखने वाला) डेटासेट उत्पन्न किया है।

Generatedata.com ... स्वीकार्य है, लेकिन बहुत अच्छे पैमाने पर नहीं है।

DataGenerator पर नज़र रखने के लिए कुछ है।

और जबकि DTM डेटा जेनरेटर क्लंकी है और DataFactory के लिए एक खराब विकल्प है, यह मौजूद है और बेचा जा रहा है, और मैंने इसका उपयोग हल्के से स्वीकार्य डेटा उत्पन्न करने के लिए किया है।

— ब्रायन बॉसुन-स्टैंटन
स्रोत

9

RedGate में एक उपकरण है जो आप खोज रहे हैं, लेकिन यह गंतव्य MS SQL सर्वर होना है।

http://www.red-gate.com/products/sql-development/sql-data-generator

आप निम्नलिखित लेख को भी देख सकते हैं:

http://www.sqlservercentral.com/articles/Advanced+Querying/jointestdata/197/

— जेफ
स्रोत

Redgate sql डेटा जनरेटर के लिए +1

— Aim Kai

4

मैं आमतौर पर इनपुट के रूप में कुछ ज्ञात डेटा का उपयोग करके अपना स्वयं का उत्पादन करता हूं - यदि यह बहुत यादृच्छिक है, तो यह हमेशा एक अच्छा परीक्षण नहीं होता है; मुझे अपने अंतिम उत्पाद के समान डेटा वितरित करने की आवश्यकता है।

सभी बड़े डेटाबेस जिन्हें मुझे ट्यून करना है वे प्रकृति में वैज्ञानिक हैं - इसलिए मैं आमतौर पर इनपुट के रूप में कुछ अन्य जांच कर सकता हूं, और इसे फिर से जोड़ सकता हूं और घबराना जोड़ सकता हूं। (उदाहरण के लिए, ऐसा डेटा लेना जो मिलीसेकंड परिशुद्धता के साथ 5 मिनट के ताल पर था, और इसे 10 सेकंड के ताल w / मिलिसकंड की सटीकता में बदल दिया गया था, लेकिन समय के लिए एक +/- 100 एमएस घबराना)

...

लेकिन, एक अन्य विकल्प के रूप में, यदि आप अपना स्वयं का लिखना नहीं चाहते हैं, तो कुछ बेंचमार्किंग टूल को देखना है - क्योंकि वे प्रशिक्षण सेट के आधार पर चीजों को बार-बार दोहरा सकते हैं, आप उन्हें बहुत से सम्मिलित करने के लिए उपयोग कर सकते हैं अभिलेखों का (और उसके बाद रिपोर्ट को केवल इस बात पर ध्यान न दें कि यह कितनी तेजी से हुआ) ... और फिर आप परीक्षण के लिए उसी टूल का उपयोग कर सकते हैं कि एक बार पॉपुलेट होने के बाद डेटाबेस कितनी तेजी से कार्य करता है।

— जो
स्रोत

3

मैं mysqlslap का उपयोग कर रहा हूं। यह खुद के बाद भी सफाई करता है।

यहां मैंने वह लेख पढ़ा है जब मैंने इसका उपयोग करना शुरू किया था।

— SteveHarville
स्रोत

2

सलामी बल्लेबाज पर एक नज़र है

इसे शुरू करना आसान नहीं है, लेकिन यह काफी शक्तिशाली है।

— बिना नाम का घोड़ा
स्रोत

2

इस फ़ंक्शन पर एक नज़र डालें। आप नाम, फोनोन्स एड्रेस, ज़िपकोड आदि उत्पन्न कर सकते हैं। यह पूरी तरह से MYSQL में किया जाता है, अन्य अनुप्रयोगों की कोई आवश्यकता नहीं है। http://moinne.com/blog/ronald/mysql/howto-generate-meaningful-test-data-using-a-mysql-function

— सीन थॉम्पसन
स्रोत

1

सबसे अधिक लागत प्रभावी तरीका शायद एक खुले स्रोत या वाणिज्यिक डेटा जनरेटर का उपयोग करना है। मैं ऐसा करता था।

अब, मेरे स्वर्णिम वर्षों में, मैं एक और स्क्रिप्टिंग भाषा सीखने के लिए जनादेश के रूप में परीक्षण डेटा की प्रत्येक आवश्यकता को मानता हूं।

— माइक शेरिल 'कैट रिकॉल'
स्रोत

1

इस समस्या का एक अलग समाधान खोजने वाले किसी भी व्यक्ति के लिए ... मैंने डेटा सिंक्रोनाइज़ेशन स्टूडियो के लिए एक परीक्षण डेटा जनरेटर प्रोजेक्ट लिखा। यह यथार्थवादी परीक्षण डेटा की लाखों पंक्तियों के 1 से 100 के दशक तक बड़े डेटासेट उत्पन्न कर सकता है। यहाँ इसके बारे में एक ब्लॉग पोस्ट है। http://www.simego.com/Blog/2012/02/Test-Data-Generator-Download-for-Data-Sync यह 15 दिनों के लिए उपयोग करने के लिए (जब आप अपने परीक्षण डाटा है, तुम्हारे पास है) मुफ़्त है

— त्रेमेने मसीह
स्रोत