डेटा-माइनिंग सॉफ्टवेयर टूल का एक सर्वेक्षण


15

यद्यपि मुझे एक इंजीनियर के रूप में प्रशिक्षित किया गया था, लेकिन मुझे लगता है कि मैं डेटा खनन में अधिक दिलचस्पी ले रहा हूं। अभी मैं आगे क्षेत्र की जांच करने की कोशिश कर रहा हूं। विशेष रूप से, मैं सॉफ्टवेयर टूल्स की विभिन्न श्रेणियों को समझना चाहूंगा जो मौजूद हैं और प्रत्येक श्रेणी में कौन से उपकरण उल्लेखनीय हैं और क्यों। (ध्यान दें कि मैंने "सर्वश्रेष्ठ" उपकरण नहीं कहा था, बस उल्लेखनीय लोग ऐसा नहीं करते हैं कि हम एक लौ युद्ध शुरू करते हैं।) विशेष रूप से उन उपकरणों पर ध्यान दें जो खुले स्रोत और स्वतंत्र रूप से उपलब्ध हैं - हालांकि इसका मतलब यह नहीं है कि मुझे केवल ओपन-सोर्स और फ्री में दिलचस्पी है।


1
मैं इसे एक समुदाय विकी होने की सलाह देता हूं।
ताल गैली

एक होमवर्क प्रश्न की तरह लगता है
नील मैकगिन

@ ताल निश्चित रूप से, अब रूपांतरित हो गया।

@ प्रमुख - यह एक बहुत व्यापक और सामान्य प्रश्न है ... लेकिन मुझे डर है कि यह एक होमवर्क प्रश्न नहीं है।
जॉन बेरीमैन

जवाबों:


7

यह संभवतः सबसे व्यापक सूची आपको मिलेगी: mloss.org


यह मशीन-लर्निंग पर केंद्रित है, जिसे एआई की तरह ही डेटा-माइनिंग के संबंधित क्षेत्र के रूप में देखा जा सकता है। हालांकि आमतौर पर यह पर्यायवाची शब्द है, क्योंकि "भविष्यवाणी" डेटा खनन में महत्वपूर्ण चुनौतियों में से एक है। लेकिन डेटा खनन के लिए "सीखने" से अधिक है।
QUIT - Anony-Mousse

7

अच्छी तरह से देखिए

और डेटा सेट के लिए यूसीआई मशीन लर्निंग रिपॉजिटरी


1
आप सूची में Red-R को जोड़ सकते हैं (R में ऑरेंज के एक क्लोन का प्रकार): red-r.org
Amro

मैंने R डाउनलोड किया है और मैं अब इसके साथ खेल रहा हूं।
जॉन बेरीमैन

@ अमरो थैंक्स! हालाँकि, यह मैक प्लेटफ़ॉर्म पर उपलब्ध नहीं है, जब तक कि मैं गलत नहीं हूँ?
23'10

मैं मैक उपयोगकर्ता नहीं हूं, लेकिन मुझे लगता है कि लिनक्स बिल्ड आपके लिए काम कर सकता है (आपको मैन्युअल रूप से सभी अजगर निर्भरता स्थापित करने की आवश्यकता है): red-r.org/forum/topic.php?id=22#post-76
Amro

@ अमरो मैं इसे आज़माऊंगा; अतीत में मैं रानालिटिकफ्लो ( j.mp/bYF8xs ) का परीक्षण कर रहा हूं, लेकिन आश्वस्त नहीं हुआ: मैं मूल रूप से एक CLI उपयोगकर्ता हूं :-)
chl


3

KNIME पर एक नज़र डालें

सीखना बहुत आसान है। आगे की प्रगति के लिए बहुत गुंजाइश के साथ। वीका और आर के साथ अच्छी तरह से एकीकृत करता है।




2

नहीं है ELKI , एक खुला स्रोत विश्वविद्यालय परियोजना के लिए कुछ हद तक WEKA करने के लिए तुलनीय है, लेकिन बहुत मजबूत है जब यह क्लस्टरिंग और बाहरी का पता लगाने के लिए आता है। WEKA वास्तव में डेटा-माइनिंग नहीं है, लेकिन मशीन लर्निंग सॉफ्टवेयर है।


1

यह रेड-आर है जिसमें एक अच्छा जीयूआई और दृश्य प्रोग्रामिंग इंटरफ़ेस है। यह विभिन्न डेटा विश्लेषण को संसाधित करने के लिए आर का उपयोग करता है।



0

SQL सर्वर डेटा माइनिंग (SSDM) को लंबे समय में अपडेट नहीं किया गया है, लेकिन यदि आप बड़े रिलेशनल डेटाबेस और क्यूब्स का खनन कर रहे हैं तो यह अभी भी काफी प्रतिस्पर्धी है। मैं धीरे-धीरे लेकिन व्यवस्थित रूप से कई खनन उपकरणों के परीक्षणों के माध्यम से अपना रास्ता तय कर रहा हूं क्योंकि मैं और SQL सर्वर का विंडोज इंटरफ़ेस सबसे अधिक उत्पादक और स्थिर है जो मैंने आज तक पाया है (विशेषकर जब यह उद्यम डेटाबेस की बात आती है, जिनमें से कुछ आश्चर्यजनक रूप से हैं इसकी उम्र के बावजूद मैला इंटरफेस)। मैं एक आधुनिक विंडोज प्रेजेंटेशन फाउंडेशन (WPF) इंटरफ़ेस पसंद करूंगा लेकिन यह अगली सबसे अच्छी बात है।

जब मैं कुछ बुनियादी खनन कौशल हासिल करने की कोशिश कर रहा था, तो मैंने उस पर विस्तृत शौकिया ट्यूटोरियल की एक पूरी श्रृंखला को SQL सर्वर डेटा माइनिंग के लिए रिक्टी सीढ़ी के नाम से लिखा । मेरी अनुभवहीनता के बावजूद वे पहले से कुछ "गोच" की पहचान करने में मदद करने में उपयोगी हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.