सहयोगी फ़िल्टरिंग के लिए बेंचमार्क डेटासेट


9

मैं सहयोगी फ़िल्टरिंग के लिए एक नए एल्गोरिथ्म का परीक्षण करना चाहूंगा । एक विशिष्ट उपयोग का मामला विशिष्ट उपयोगकर्ताओं के समान उपयोगकर्ताओं की वरीयताओं के आधार पर फिल्मों की सिफारिश करना है।

कुछ सामान्य बेंचमार्क डेटासेट क्या हैं जो शोधकर्ताओं अक्सर अपने एल्गोरिदम का परीक्षण करने के लिए उपयोग करते हैं? मुझे पता है कि कंप्यूटर विज़न के भीतर लोग अक्सर MNIST या CIFAR का उपयोग करते हैं, लेकिन मुझे सहयोगी फ़िल्टरिंग के लिए समान डेटासेट नहीं मिले हैं।


1
क्या आपने नेटफ्लिक्स प्राइज डाटासेट पर एक नज़र डाली? हां, प्रतियोगिता लंबी है और इसे कुछ गोपनीयता कारणों के कारण आधिकारिक वेबसाइट से खींच लिया गया है। आप अभी भी इसे अन्य स्थानों पर खोजने का प्रयास कर सकते हैं।
व्लादिस्लाव्स डोवलगेस

Kaggle.com का एक गुच्छा है। बस 'सिफ़ारिश: डेटासेट' या 'सिफारिश: प्रतियोगिता' में खोजें।
13

जवाबों:


8

स्पष्ट उत्तर नेटफ्लिक्स प्राइज़ डेटासेट होगा, इसमें बहुत सारे शोध हैं और अधिकांश सीएफ एल्गोरिदम ने इसमें स्कोर ज्ञात किए हैं।

अन्य उपलब्ध डेटासेट हैं जो आमतौर पर बेंचमार्क के रूप में उपयोग किए जाते हैं:

  • मूवी लेंस डेटासेट : CF एल्गोरिदम बेंचमार्किंग के लिए उपयोग की जाने वाली 20 मिलियन रेटिंग वाले डेटासेट;

  • जस्टर डेटसेट : 6 मिलियन से अधिक रेटिंग के साथ एक मजाक सिफारिश वाला डेटासेट;

  • आप इस लिंक में कई और डेटासेट पा सकते हैं


1

मेरे पास एक भंडार है जो आपकी मदद कर सकता है।

https://github.com/ArthurFortes/Datasets-for-Recommneder-Systems/


3
कृपया लिंक-केवल उत्तर पोस्ट न करें, उत्तर स्व-निहित होना चाहिए। मैं आपके उत्तर को संपादित करने की सलाह देता हूं जो लिंक प्रदान करता है कम से कम कुछ जानकारी जोड़ने के लिए, और फिर आगे की खोज के लिए लिंक प्रदान करें।
Mephy
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.