अनुशंसात्मक प्रणाली कैसे बनाएं जो सहयोगी फ़िल्टरिंग और सामग्री सुविधाओं दोनों को एकीकृत करती है?


10

मैं एक अनुशंसा प्रणाली बना रहा हूं और "समान" उपयोगकर्ताओं की रेटिंग और वस्तुओं की विशेषताओं दोनों को शामिल करना चाहता हूं। आउटपुट एक अनुमानित रेटिंग है [0-1]। मैं एक न्यूरल नेटवर्क (साथ शुरू करने के लिए) पर विचार कर रहा हूं।

तो, इनपुट वस्तुओं की सुविधाओं और प्रत्येक उपयोगकर्ता की रेटिंग का एक संयोजन है। आइटम ए और उपयोगकर्ता 1 के लिए, सिस्टम को संयुक्त डेटा, ए 1 पर प्रशिक्षित किया जा सकता है। यह एक प्रशिक्षण उदाहरण होगा।

क्या होगा यदि उपयोगकर्ता 1 ने भी फिल्म बी को रेट किया है? फिर डेटा बी 1 भी एक प्रशिक्षण उदाहरण होगा? इस तरह से उपयोगकर्ता 1 की सुविधाओं के साथ प्रशिक्षण को दोहराने में कोई समस्या है?

क्या आपके पास समस्या से निपटने के बेहतर तरीके के बारे में कोई सुझाव है?

जवाबों:


11

समस्या को पूरी तरह से समझने से पहले आप एक तंत्रिका नेटवर्क पर क्यों विचार कर रहे हैं?

सहयोगी फ़िल्टरिंग के लिए मानक मैट्रिक्स फैक्टराइजेशन विधि सामग्री सुविधाओं का आसानी से लाभ उठाने में सक्षम हैं। एक बेयसियन सेटिंग में यह कैसे किया जा सकता है इसका एक उदाहरण के लिए माचिस पेपर देखें


6

सामग्री विशेषताओं के साथ मैट्रिक्स फैक्टराइजेशन को एकीकृत करने के बारे में तीन पेपर (यहां, विशेष रूप से विषय मॉडल):

  • दीपक अग्रवाल और बी-चुंग चेन। 2010. एफएलडीए: अव्यक्त डाइरिक्लेट आवंटन के माध्यम से मैट्रिक्स का कारक। वेब खोज और डेटा खनन (WSDM '10) पर तीसरे एसीएम अंतर्राष्ट्रीय सम्मेलन की कार्यवाही में। एसीएम, न्यूयॉर्क, एनवाई, यूएसए, 91-100।
  • हनुहाई शान और अरिंदम बनर्जी। 2010. सहयोगात्मक छानने के लिए सामान्यीकृत संभाव्य मैट्रिक्स कारक। डेटा माइनिंग (ICDM '10) पर 2010 IEEE अंतर्राष्ट्रीय सम्मेलन की कार्यवाही में। आईईईई कंप्यूटर सोसाइटी, वाशिंगटन, डीसी, यूएसए, 1025-1030।
  • चोंग वांग और डेविड एम। ब्लेई। 2011. वैज्ञानिक लेखों की सिफारिश के लिए सहयोगात्मक विषय मॉडलिंग। ज्ञान की खोज और डेटा खनन (केडीडी 11) पर 17 वें एसीएम एसआईजीकेडी अंतर्राष्ट्रीय सम्मेलन की कार्यवाही में। एसीएम, न्यूयॉर्क, एनवाई, यूएसए, 448-456।

मैं अपनी खुद की ब्लॉग प्रविष्टि को भी बढ़ावा दूंगा जो इस मुद्दे पर थोड़ी चर्चा करता है: टॉपिक मॉडल लैंटेंट फैक्टर मॉडल से मिलते हैं


3

तंत्रिका नेटवर्क दृष्टिकोण की कोई आवश्यकता नहीं है, सहयोगी फ़िल्टरिंग स्वयं पर एक एल्गोरिथ्म है। आपकी समस्या के लिए विशेष रूप से, cf और recomender system का अच्छा वर्णन है:

ml-class.org

(XVI के लिए देखें: अनुशंसाकर्ता सिस्टम)। यह सुरुचिपूर्ण, सरल है, और यदि आप इसे सही करते हैं (यानी, वेक्टराइज्ड फॉर्म, फास्ट मिनिमाइज़र और तैयार ग्रेडिएंट का उपयोग करें) तो यह काफी तेज हो सकता है।


मैंने उस दृष्टिकोण का उपयोग किया, लेकिन यह वस्तुओं की सुविधाओं का उपयोग नहीं करता है। मैं सुविधाओं को भी शामिल करना चाहूंगा।
बी सेवन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.