आर बहुत सारे डेटासेट के साथ आता है, और ऐसा लगता है कि कोड के कुछ लाइनों के साथ आपके द्वारा उद्धृत अधिकांश उदाहरणों को पुन: पेश करना कोई बड़ी बात नहीं होगी। आपको मिलीबैंक पैकेज भी उपयोगी मिल सकता है , विशेष रूप से सिंथेटिक डेटासेट में mlbench.*
। कुछ चित्र नीचे दिए गए हैं।
CRAN पर क्लस्टर टास्क व्यू को देखकर आपको अतिरिक्त उदाहरण मिलेंगे। उदाहरण के लिए, fpc पैकेज में "फेस-शेप्ड" क्लस्टर बेंचमार्क डेटासेट ( rFace
) के लिए एक अंतर्निहित जनरेटर है ।
इसी तरह के विचार पायथन पर भी लागू होते हैं, जहां आपको स्किकिट-लर्न के साथ क्लस्टरिंग के लिए दिलचस्प बेंचमार्क परीक्षण और डेटासेट मिलेंगे ।
यूसीआई मशीन लर्निंग रिपॉजिटरी बहुत सारे डेटासेट को होस्ट करती है , लेकिन आप अपनी पसंद की भाषा के साथ डेटा का स्वयं अनुकरण करना बेहतर समझते हैं।