नकली डेटा उत्पन्न करने के लिए उपकरण? [बन्द है]


104

मैं परीक्षण डेटाबेस में लोड करने के उद्देश्य से नमूना डेटा उत्पन्न करने के लिए एक अच्छे, मुफ्त टूल की सिफारिशों की तलाश कर रहा हूं। सादृश्य से, ऐसा कुछ जो किसी भी RDBMS के लिए " लोरेम इप्सम " पाठ का उत्पादन करता है । वे सुविधाएँ जिनमें मैं शामिल हूँ:

  • मौजूदा तालिका परिभाषा के लिए डेटा उत्पन्न करने की लचीलापन।
  • छोटे और बड़े डेटा सेट (> 1 मिलियन पंक्तियाँ या अधिक) उत्पन्न करने की क्षमता।
  • SQL स्क्रिप्ट फॉर्मेट ( INSERTस्टेटमेंट) में जनरेट करें या फ़्लैट फ़ाइल फॉर्मेट में आयात के लिए उपयुक्त (जो आमतौर पर तेज़ हो)।
  • आसान स्क्रिप्टिंग के लिए एक कमांड-लाइन इंटरफ़ेस।
  • एक गतिशील भाषा में लिखे गए एक्स्टेंसिबल, ओपन सोर्स (ये अच्छे-से-शौकीन हैं, मजबूत आवश्यकताएं नहीं)।

पुनश्च: मैं StackOverflow पर एक नकली सवाल के लिए खोज की, लेकिन मैं एक नहीं मिला। अगर वहाँ एक है, तो मैं इसके लिए एक संकेतक प्राप्त करने के लिए आभारी रहूंगा।


महान प्रतिक्रियाओं के लिए सभी को धन्यवाद! मुझे अपनी आवश्यकताओं में संशोधन करना चाहिए कि मैं अपने प्राथमिक विकास वातावरण के रूप में मैक ओएस एक्स का उपयोग करता हूं, न कि विंडोज (हालांकि मैंने कहा था कि कमांड-लाइन इंटरफ़ेस वांछनीय है, और यह व्यावहारिक रूप से विंडोज को नियंत्रित करता है)। विंडोज-विशिष्ट सुझाव इस सवाल के अन्य पाठकों के लिए उपयोगी नहीं होंगे, हालांकि, धन्यवाद।


यहाँ मेरा निष्कर्ष है:

  • GenerateData:
    • PHP वेब ऐप इंटरफ़ेस, कमांड लाइन नहीं
    • 200 रिकॉर्ड बनाने के लिए सीमित (या 5,000 रिकॉर्ड बनाने के लिए लाइसेंस के लिए $ 20 का भुगतान करें)
  • SQL डेटा जेनरेटर को RedGate करें
    • मुक्त नहीं, कीमत $ 295
    • विंडोज, .NET, SQL सर्वर की आवश्यकता है
  • दृश्य स्टूडियो 2008 डेटाबेस संस्करण
    • विंडोज की आवश्यकता है
    • महँगा MSDN या ISV सदस्यता की आवश्यकता है
  • बैनर दातादक्ट
    • मुक्त नहीं, कीमत $ 595
    • विंडोज (?) की आवश्यकता है
    • MySQL (?) के लिए कोई समर्थन नहीं
    • GUI, कमांड लाइन या स्क्रिप्ट योग्य नहीं
  • माणिक रत्न मणि
    • बल्क डेटा लोड के लिए ActiveRecord का उपयोग करने का तरीका बहुत धीमा है
  • सुपर स्मैक
    • मुख्य रूप से एक लोड-टेस्टिंग टूल, जिसमें एक यादृच्छिक डेटा जनरेटर बनाया गया है
    • फिर भी उपयोग करने के लिए बहुत आसान है
    • कुल मिलाकर एक अच्छा रनर-अप टूल
  • दाताबने बेनेरेटर
    • मेरी जरूरतों के लिए सबसे अच्छा समाधान
    • XML स्क्रिप्ट, DbUnit के साथ संगत है
    • खुला स्रोत (GPL) जावा कोड
    • कमांड-लाइन उपयोग
    • सीधे JDBC के माध्यम से कई डेटाबेस तक पहुँचें

यह प्रकृति में समान है, और अपने स्वयं के प्रकाश में दिलचस्प है: en.wikipedia.org/wiki/Fuzz_testing
शोक

GenerateData php एप्लिकेशन है। आप जितनी चाहें उतने डेटा रिकॉर्ड बनाने के लिए कोड को हैक कर सकते हैं। V2.x के लिए। मुझे नहीं पता कि 3.x लाइसेंस बदलता है या नहीं।
हान झेंग

जवाबों:


41

डेटाबेस जेनरेटर , एक परीक्षण डेटा जनरेटर पर एक नज़र डालें जो आपकी आवश्यकताओं के करीब दिखता है।

  • यह मौजूदा तालिका परिभाषा के लिए डेटा उत्पन्न कर सकता है (या उत्पादन डेटा को भी अनाम कर सकता है)
  • यह लार्ज डेटा सेट (असीमित आकार) उत्पन्न कर सकता है
  • यह विभिन्न इनपुट (CSV, फ़्लैट फ़ाइल्स, DBUnit) और आउटपुट फॉर्मेट (CSV, फ़्लैट फ़ाइल्स, DBUnit, XML, Excel, Scripts) का समर्थन करता है
  • यह कमांड लाइन पर या मावेन प्लगइन के माध्यम से उपयोग किया जा सकता है
  • यह खुला स्रोत और अनुकूलन योग्य है

मैं इसे आजमाऊंगा।

BTW, इसी तरह के उत्पादों की एक सूची databene benerator की वेब साइट पर उपलब्ध है।


किसी को भी इसके उपयोग के साथ सफलता मिली थी? मैंने इसे आजमाया, लेकिन benerator-विज़ार्ड अमान्य pom.xml फ़ाइल ("पॉप्युलेट डेटाबेस" विकल्प के लिए) उत्पन्न करता है। इसके अलावा डेमो (hsqldb) में से एक के लिए जा रहे हैं और साथ ही त्रुटियों में भी परिणाम हैं। मेरे लिए यह एक अच्छा आकार में नहीं उपकरण की तरह लगता है, इस प्रकार इसके साथ समय खोने के लायक नहीं है।
पीटर बुटकोविक

23

यह काफी आशाजनक है: Generata.com । ओपन-सोर्स, में बहुत सारे अंतर्निहित डेटा प्रकार हैं।

यहां कई अन्य सूचीबद्ध हैं: टेस्ट (नमूना) डेटा जेनरेटर । मुझे उनमें से किसी के साथ अनुभव नहीं है, लेकिन उस सूची में कुछ ऐसे दिखते हैं जैसे वे बहुत सभ्य हो सकते हैं।


6

Http://www.mockaroo.com आज़माएं

यह एक उपकरण है जिसे मेरी कंपनी हमारे स्वयं के अनुप्रयोगों का परीक्षण करने में मदद करने के लिए बनाई गई है। हमने इसे किसी को भी उपयोग करने के लिए स्वतंत्र कर दिया है। यह मूल रूप से फोर्जरी माणिक रत्न है जिसके चारों ओर एक वेब ऐप लिपटा है। आप CSV, txt या SQL स्वरूपों में डेटा उत्पन्न कर सकते हैं। उम्मीद है की यह मदद करेगा।


टिप के लिए धन्यवाद, मैं इसे देखूंगा!
बिल कार्विन

5

मुझे पता है कि आपने कहा था कि आप एक मुफ्त टूल की तलाश कर रहे हैं, लेकिन यह एक ऐसा मामला है जहां मैं सुझाव दूंगा कि $ 295 खर्च करने से आप समय की बचत में जल्दी से वापस भुगतान करेंगे। मैं पिछले वर्ष के लिए RedGate टूल SQL डेटा जेनरेटर का उपयोग कर रहा हूं और यह छोटा है, एक भयानक उपकरण है। यह स्तंभों के बीच निर्भरता स्थापित करने की अनुमति देता है, व्यावसायिक वस्तुओं जैसे फोन नंबर, यूआरएल, नाम, आदि के लिए यथार्थवादी डेटा उत्पन्न करता है। मैं ईमानदारी से कह सकता हूं कि इस उपकरण ने स्वयं और समय के लिए फिर से भुगतान किया है।


हाँ, मैं विकास के समय में कई सैकड़ों को बचाने के लिए $ 295 खर्च करने से पीछे नहीं हूं। नेतृत्व के लिए धन्यवाद!
बिल करविन

2

यदि आप कुछ MySQL-विशिष्ट का उपयोग करने के लिए देख रहे हैं या चाहते हैं, तो आप सुपर स्मैक पर एक नज़र डाल सकते हैं । वर्तमान में इसका रखरखाव टोनी बोर्के द्वारा किया जाता है।

सुपर स्मैक आपको अपने डेटाबेस तालिकाओं में सम्मिलित करने के लिए यादृच्छिक डेटा उत्पन्न करने की अनुमति देता है। यह अनुकूलन योग्य है, जिससे आप पैक किए गए शब्दों का उपयोग कर सकते हैं। फ़ाइल, या अपनी पसंद का कोई भी परीक्षण डेटा।

इसके बारे में एक अच्छी बात यह है कि यह कमांड-लाइन उच्च अनुकूलन योग्य है। उच्च प्रदर्शन MySQL पुस्तक में उपयोग के कुछ काफी सभ्य उदाहरण हैं जो यहां भी प्रस्तुत किए गए हैं

यकीन नहीं है कि अगर आप क्या देख रहे हैं की तर्ज पर है, लेकिन सिर्फ एक विचार है।


उम्मीद तो दिखती है! कहते हैं, यह PostgreSQL और साथ ही MySQL का समर्थन करता है। लिंक के लिए धन्यवाद।
बिल कार्विन

2

उपलब्ध नकली डेटा जनरेटर में से एक के साथ एक रूबी स्क्रिप्ट आपको ठीक करना चाहिए।

http://faker.rubyforge.org/ ऐसा ही एक रत्न है। दुर्भाग्य से, यह आपकी सभी आवश्यकताओं को पूरा नहीं करता है।

यहाँ एक और है: http://random-data.rubyforge.org/

और Faker का उपयोग करने के लिए एक ट्यूटोरियल: http://www.rubyandhow.com/how-to-generate-fake-names-addresses-in-ruby/


पुन: एक मौजूदा तालिका परिभाषा के लिए डेटा उत्पन्न करने के लिए लचीलापन। उपलब्ध ओआरएम में से एक के साथ फ़ेकर मणि को मिलाएं। ActiveRecord शायद सबसे आसान होगा।


क्या आपने ActiveRecord इंटरफ़ेस के माध्यम से एक बार में 1 मिलियन पंक्तियों, एक पंक्ति का एक बल्क लोड करने का प्रयास किया है? समय पूरा होने के बारे में मैं आशावादी नहीं हूं।
बिल करविन

इसके अलावा, मैंने कुछ ककड़ी फ़ीचर स्टेप्स और इसके SLO W. So में आज Faker रत्न का उपयोग किया, मेरा स्कोर अब तक: ActiveRecord -1; Faker -1 मैं इतना महान नहीं कर रहा हूँ। :)
ब्रेंडनजर्विन

2

आम तौर पर बहुत महंगा है, लेकिन यदि आप एक छोटे से आईएसवी हैं, तो आप बहुत सस्ते में विजुअल स्टूडियो 2008 डेटाबेस संस्करण प्राप्त कर सकते हैं, सशक्त और बिज़स्पार्क पदोन्नति देखें। यह एक बहुत अधिक कार्यक्षमता प्रदान करता है, तो बस परीक्षण डेटा उत्पन्न कर रहा है (SCC के साथ एकीकरण, यूनिट परीक्षण, DB Refactoring, आदि)

जैसा कि मुझे यह तथ्य पसंद है कि Red-Grate टूल सीखना बहुत आसान है, फिर भी मैं SQL डेटा जेनरेटर देखूंगा


हाँ, यह RedGate के उपकरण के समान मूल्य के आदेश पर कम खर्चीला है, लेकिन इसके अलावा आपको ISV के रूप में अर्हता प्राप्त करनी है और इसका मतलब है कि अन्य सामान खरीदना। वैसे भी लिंक के लिए धन्यवाद, इसमें कोई संदेह नहीं है कि यह किसी के लिए उपयोगी होगा। +1
बिल कार्विन

2

एक उपकरण जो वास्तव में सूची से गायब नहीं होना चाहिए, डेटा जनरेटर से डेटा जेनरेटर है जो सीधे डेटाबेस को पॉप्युलेट करता है या सम्मिलित स्क्रिप्ट उत्पन्न करता है, जिसमें पूर्व-स्थापित जनरेटर का एक बड़ा संग्रह होता है (और कई डेटाबेस का समर्थन करता है ...

http://www.datanamic.com/datagenerator/index.html


सलाह के लिये धन्यवाद। यह ध्यान दिया जाना चाहिए कि यह केवल विंडोज प्लेटफॉर्म के लिए है, और इसकी कीमत $ 799 है।
बिल करविन

1

मुझे पता है कि आप वास्तविक लोरेम इप्सम पाठ की तलाश नहीं कर रहे हैं; लेकिन अगर किसी और ने वास्तविक लोरेम इप्सम जनरेटर की खोज की और इस धागे को खोजा : लिप्स.कॉम इसके लिए बहुत अच्छा काम करता है।


लिंक के लिए धन्यवाद, लेकिन हाँ, वह नहीं है जो मैं देख रहा था।
बिल कार्विन

फ़ायरफ़ॉक्स के लिए एक प्लगइन भी है जिसे डमी लिपसम कहा जाता है, यह उपयोगी है! क्षमा करें, मैं बिल की मदद नहीं कर सकता :(
एलेक्स

1

मुक्त नहीं है, लेकिन विजुअल स्टूडियो 2008 डेटाबेस संस्करण एक अच्छा विकल्प है और यह बहुत अधिक कार्यक्षमता प्रदान करता है (एससीसी, यूनिट परीक्षण, डीबी रिफैक्टिंग, आदि ... के साथ एकीकरण)


केवल एक MSDN सदस्यता के माध्यम से उपलब्ध होने लगता है जिसकी लागत प्रति वर्ष $ 5469 है। उस राशि के लिए, मैं कुछ कॉलेज के छात्रों को टेस्ट डेटा बनाने और इसे टाइप करने के लिए किराए पर ले सकता था।
बिल करविन

1

मैं एक उपकरण का उपयोग करता हूं जिसे डाटेटक्ट कहा जाता है :

  1. फ्लैट फ़ाइलों या किसी ODBC अनुरूप डेटाबेस के लिए डेटा उत्पन्न करता है।
  2. VBScript के माध्यम से एक्स्टेंसिबल।
  3. प्रासंगिक रूप से जागरूक; मूल तालिका से मानों के साथ विदेशी कुंजियों को आबाद करेगा।
  4. डेटा संदर्भ से अवगत है; दिए गए ज़िप कोड के लिए शहर, राज्य और फोन नंबर, लिंग के साथ पहले नाम और शीर्षक।
  5. कस्टम, जटिल डेटा प्रकार बना सकते हैं।
  6. 2 बिलियन से अधिक उचित नाम, व्यावसायिक नाम, सड़क के पते, शहर, राज्य और ज़िप कोड उत्पन्न करें।

मैंने इस उपकरण का उपयोग SQLServer डेटाबेस के लिए 40,000,000 पंक्तियों के रूप में, और Oracle डेटाबेस के लिए डेटा की 8,000,000 पंक्तियों को उत्पन्न करने के लिए किया है।

मैं बैनर सिस्टम से किसी भी तरह से संतुष्ट नहीं हूं, सिर्फ एक संतुष्ट ग्राहक हूं।


यह एक आशाजनक विकल्प की तरह दिखता है। लिंक के लिए धन्यवाद। +1 हालाँकि, मैं अपने प्राथमिक मंच के रूप में विंडोज पर विकसित नहीं होता, क्षमा करें कि मैंने अपने प्रश्न में यह निर्दिष्ट नहीं किया है।
बिल कार्विन


1

ओएस एक्स के लिए डेटा क्रिएटर (यूएस $ 7) है। डाउनलोड परीक्षण उद्देश्य के लिए स्वतंत्र है। आप इसका उपयोग सॉफ्टवेयर और इसकी विशेषताओं का मूल्यांकन करने के लिए कर सकते हैं।

इसके लिए OS X शेर या क्रमिक की आवश्यकता होती है। यह बहुत सारे विभिन्न प्रकार के क्षेत्र उत्पन्न कर सकता है और इसमें एक कस्टम निर्यात मोड और कुछ पूर्व-सेट (TSV, CSV, Html तालिका, तालिका के अंदर वेब पेज) है।

http://www.tensionsoftware.com/osx/datacreator/

यहां ऐप स्टोर पर:

https://itunes.apple.com/us/app/data-creator/id491686136?mt=12


1

आप DbSchema, www.dbschema.com का उपयोग कर सकते हैं यह एक डेटाबेस प्रबंधन उपकरण है और इसमें अपने डेटाबेस को पॉप्युलेट करने के लिए रैंडम डेटा जनरेटर है।


0

आपके सवाल का सीधा जवाब नहीं है लेकिन यह कुछ खास तरह के डेटा के लिए मददगार हो सकता है:

नकली नाम जनरेटर उपयोगी हो सकता है - http://www.fakenamegenerator.com/ , सब कुछ के लिए नहीं, लेकिन उपयोगकर्ता खाते या उस तरह सामान। AFAIK वे थोक आदेश के लिए समर्थन प्रदान करते हैं।


हाँ, मैंने देख लिया, लेकिन यह उस लचीलेपन की पेशकश नहीं करता जो मैं देख रहा हूँ। वैसे भी लिंक के लिए धन्यवाद।
बिल करविन

0

Benerator के लिए +1: मैंने ऑफ़र (dbmonster सहित) पर अन्य उपकरणों के 3 या 4 की कोशिश की, लेकिन यथार्थवादी डेटा देने और लचीला होने के लिए Benerator को बहुत जल्दी, मिला। जब मैंने मंच पर पोस्ट किया तो मुझे टूल के निर्माता से बहुत त्वरित और उपयोगी प्रतिक्रिया मिली।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.