हेन,
उपलब्ध कार्यक्षमता के साथ बहुत सारे उपकरण और कार्य हैं।
कौन सा चुनना है यह निर्भर करता है कि आप अपने काम के लिए एक गुई का उपयोग करना चाहते हैं या यदि आप इसे किसी अन्य कार्यक्रम में एम्बेड करना चाहते हैं।
स्टैंडअलोन डेटा माइनिंग टूल्स (जावा इंटरफेस के साथ WEKA जैसे ओहर्स हैं):
- तेजी से खान
- संतरा
- R के लिए खड़खड़ गुइ
- KNIME
पाठ आधारित:
libs:
- पायथन के लिए स्किट
- हाडोप पर महावत
यदि आप एक प्रोग्रामिंग लैंग्वेज को अच्छी तरह से जानते हैं तो मैं उस भाषा के लिए एक लिब का उपयोग करूंगा या आर को आजमाऊंगा। यदि नहीं, तो आप गिनी के साथ किसी एक उपकरण को आजमा सकते हैं।
R में एक पेड़ का उदाहरण:
# we are using the iris dataset
data(iris)
# for our tree based model we use the rpart package
# to download it type install.packages("rpart")
library(rpart)
# Building the tree
fit <- rpart(Species ~ Petal.Length + Petal.Width, method="class", data=iris)
# Plot the tree
plot(fit)
text(fit)
जैसा कि आर के साथ विश्लेषण में सुझाव दिया गया है कि आपको अपने आप को कोड करने की आवश्यकता है, लेकिन आपको अधिकांश वर्गीकरण कार्यों के लिए एक पैकेज मिलेगा जो बॉक्स से बाहर काम करेगा। यहां मशीन लर्निंग टास्क व्यू का अवलोकन किया जा सकता है
RapidMinder के साथ आरंभ करने के लिए आपको Youtube पर एक नज़र डालनी चाहिए। निर्णय पेड़ों के लिए भी कुछ पेंचकस हैं।