हालाँकि, प्रोजेक्ट यूलर की तुलना में दांव अधिक हैं, जैसा कि आपने बताया है, कागले आपके खुद के प्रयोगों में उपयोग के लिए डेटा का एक उत्कृष्ट स्रोत है। उनके कई प्रतियोगिताओं के लिए आपको डेटासेट (कानूनी समझौतों और आगे के लिए) तक पहुंचने के लिए साइन इन होना पड़ता है, लेकिन यदि आप वास्तव में प्रविष्टि समाप्त नहीं करते हैं, तो कोई दंड नहीं है जो मुझे पता है।
कहा जा रहा है, यदि आप डेटा सेट की तलाश करते हैं जो सांख्यिकी प्रक्रियाओं के परीक्षण के लिए विशिष्ट हैं, जैसे प्रिंसटन में , आप विभिन्न नेटवर्क आर्किटेक्चर पर डेटा का परीक्षण कर सकते हैं और इसे बेंचमार्क के रूप में सादे प्रतिगमन, आदि से तुलना कर सकते हैं।
एक व्यापक सूची के लिए यहां भी देखें , जिसमें Google प्राकृतिक भाषा संसाधन डेटा सभी शामिल हैं ।
तो, प्रोजेक्ट यूलर विशिष्ट समस्याओं के साथ एक शानदार सेवा प्रदान करता है, लेकिन मशीन सीखने के मामले में, आप अपनी रचना की वास्तुकला के साथ मौजूदा डेटासेट का उपयोग कर सकते हैं और "जवाब" की तुलना ऑनलाइन या अनुसंधान पत्रों में प्रस्तुत किए गए निष्कर्षों से कर सकते हैं।