मुझे यह कहना होगा कि मशीन लर्निंग और नॉनपैरेमेट्रिक मॉडलिंग के लिए सबसे पूर्ण सॉफ्टवेयर वातावरण आर है। यह आंकड़ों का एक बड़ा क्षेत्र है, जिसमें के-एनएन, कर्नेल स्मूथिंग, जनरल एडिटिव मॉडल, कमजोर शिक्षार्थी, सपोर्ट वैक्टर, न्यूरल नेट, सेमी फैले हुए हैं। -पार्टमेट्रिक स्पलाइन रिग्रेशन, इंप्यूटेशन इत्यादि ... मैं अत्यधिक पढ़ने की सलाह दूंगा: हस्ती, टी।, आर। तिब्शिरानी, जे। फ्रीडमैन (2009) द एलिमेंट्स ऑफ़ स्टैटिस्टिकल लर्निंग: डेटा माइनिंग, इन्वेंशन एंड प्रेडिक्शन। सांख्यिकी में स्प्रिंगर श्रृंखला।
R के अलावा, Salford Systems के वाणिज्यिक सॉफ़्टवेयर में GUI वातावरण में रैंडम फ़ॉरेस्ट्स, बहुभिन्नरूपी अनुकूली प्रतिगमन स्प्लिन्स, CART और ग्रेडिएंट बूस्टिंग (ट्रीनेट) उपलब्ध हैं। RuleQuest अभी भी See5 / C5 बेच रहा है जो C4 / ID3 CART एल्गोरिथ्म का अद्यतन संस्करण है। वाइकाटो यूनिवर्सिटी के वीका 3 एक खुला स्रोत जीयूआई / कमांडलाइन जावा प्रयास है जिसमें बड़ी संख्या में मॉडल उपलब्ध हैं।