1000 से अधिक सुविधाओं के साथ वर्गीकरण के लिए स्वतंत्र रूप से उपलब्ध डेटा सेट क्या हैं (या नमूना अंक यदि इसमें वक्र हैं)?
मुफ्त डेटा सेट के बारे में पहले से ही एक समुदाय विकि है: स्वतंत्र रूप से उपलब्ध डेटा नमूनों का पता लगाना
लेकिन यहाँ, एक और अधिक ध्यान केंद्रित करने वाली सूची का उपयोग करना अच्छा होगा जिसे मैं और अधिक आसानी से उपयोग कर सकता हूं, साथ ही मैं निम्नलिखित नियमों का प्रस्ताव करता हूं:
- प्रति पोस्ट एक डेटासेट
- डेटासेट के सेट का कोई लिंक नहीं
प्रत्येक डेटा सेट के साथ संबद्ध होना चाहिए
एक नाम (यह पता लगाने के लिए कि यह क्या है) और डेटासेट के लिए एक लिंक (आर डेटासेट को पैकेज नाम के साथ नाम दिया जा सकता है)
सुविधाओं की संख्या (मान लें कि यह p है ) डेटासेट का आकार (मान लें कि यह n है ) और लेबल / वर्ग की संख्या (कहने दें कि यह k है )
आपके अनुभव से एक सामान्य त्रुटि दर (शब्दों के लिए प्रयुक्त एल्गोरिदम को राज्य) या लिटरेचर से (इस अंतिम मामले में पेपर लिंक करें)