सहयोगी फ़िल्टरिंग / सिफ़ारिश प्रणाली के लिए गैर-नकारात्मकता क्यों महत्वपूर्ण है?


11

सभी आधुनिक सिफारिशकर्ता प्रणालियों में जो मैंने देखा है कि मैट्रिक्स फैक्टराइजेशन पर भरोसा करते हैं, उपयोगकर्ता-मूवी मैट्रिक्स पर एक गैर-नकारात्मक मैट्रिक्स फैक्टराइजेशन किया जाता है। मैं समझ सकता हूं कि व्याख्या के लिए गैर-नकारात्मकता क्यों महत्वपूर्ण है और / या यदि आप विरल कारक चाहते हैं। लेकिन अगर आप केवल भविष्यवाणी प्रदर्शन के बारे में परवाह करते हैं, उदाहरण के लिए नेटफ्लिक्स पुरस्कार प्रतियोगिता में, तो गैर-नकारात्मकता प्रतिबंध क्यों लगाया जाए? यह आपके कारक में नकारात्मक मूल्यों को भी अनुमति देने की तुलना में कड़ाई से बदतर प्रतीत होगा।

यह पेपर सहयोगी फ़िल्टरिंग में गैर-नकारात्मक मैट्रिक्स फैक्टराइजेशन के उपयोग का एक अत्यधिक उद्धृत उदाहरण है।


1
मैं अनुशंसाकर्ता प्रणालियों से बहुत परिचित नहीं हूं (शायद आप अपने प्रश्न में कुछ उदाहरण पत्र शामिल कर सकते हैं?)। यदि आपके द्वारा अनुमानित एनएनएमएफ-वरीयता का पैटर्न सही है, तो सामान्य संभावना में सुधार करने के लिए सबसे अधिक संभावना है। दूसरे शब्दों में, यह हो सकता है कि आनुभविक रूप से "व्याख्यात्मकता / विरलता" की कमी ओवर-फिटिंग से जुड़ी हो । हालाँकि विरल कोडिंग (यानी L1 नियमितिकरण / LASSO) इन आवश्यकताओं को भी पूरा कर सकता है जहाँ तक मुझे पता है। (यह NNMF उच्च व्याख्या हालांकि हो सकता है।)
GeoMatt22

जवाबों:


14

मैं सिफारिश करने वाली प्रणालियों का विशेषज्ञ नहीं हूं, लेकिन जहां तक ​​मैं समझता हूं, इस सवाल का आधार गलत है।

गैर-नकारात्मकता सहयोगी फ़िल्टरिंग के लिए महत्वपूर्ण नहीं है।

नेटफ्लिक्स का पुरस्कार 2009 में बेल्कोर टीम ने जीता था। यहां उनके एल्गोरिदम का वर्णन करने वाला पेपर है: द बेल्कोर 2008 सॉल्यूशन टू द नेटफ्लिक्स प्राइज । जैसा कि देखना आसान है, वे एसवीडी-आधारित दृष्टिकोण का उपयोग करते हैं:

2008 के दौरान हमारी प्रगति की नींव केडीडी 2008 के पेपर [4] में रखी गई है। [...] कागज में [४] हम तीन कारक मॉडल का विस्तृत विवरण देते हैं। पहला एक सरल एसवीडी है [...] दूसरा मॉडल [...] हम इस मॉडल को "असममित एसवीडी" के रूप में संदर्भित करेंगे। अंत में, अधिक सटीक कारक मॉडल, जिसका नाम "एसवीडी ++" है [...]

यह भी सिफारिश की प्रणालियों के लिए एक ही टीम मैट्रिक्स फैक्टराइजेशन तकनीकों द्वारा इस अधिक लोकप्रिय लेखन को देखें । वे एसवीडी के बारे में बहुत सारी बातें करते हैं लेकिन एनएनएमएफ का उल्लेख नहीं करते हैं।

यह लोकप्रिय ब्लॉग पोस्ट नेटफ्लिक्स अपडेट भी देखें : 2006 से होम पर यह कोशिश करें , एसवीडी के विचारों को भी समझाएं।

बेशक आप सही हैं और सहयोगी फ़िल्टरिंग के लिए NNMF का उपयोग करने पर भी कुछ काम कर रहे हैं। तो क्या बेहतर काम करता है, एसवीडी या एनएनएमएफ? मुझे पता नहीं है, लेकिन यहां 2012 से ए तुलनात्मक अध्ययन के सहयोगात्मक फ़िल्टरिंग एल्गोरिदम का निष्कर्ष है :

मैट्रिक्स-फैक्टराइजेशन-आधारित विधियों में आमतौर पर उच्चतम सटीकता होती है। विशेष रूप से, एसवीडी, पीएमएफ और इसकी विविधताएं नियमित रूप से एमएई और आरएमएसई के रूप में बहुत ही विरल स्थितियों को छोड़कर सर्वश्रेष्ठ प्रदर्शन करती हैं, जहां एनएमएफ सबसे अच्छा प्रदर्शन करता है।


2
सामान्य तौर पर यह एक अच्छा जवाब है। लेकिन सिर्फ कुछ तथ्यों को सही करने के लिए, बेल्कोर 2008 के समाधान ने प्रगति पुरस्कार जीता। समग्र विजेता एल्गोरिथ्म 100 से अधिक भविष्यवक्ताओं (टोशर एट अल। 2009) का मिश्रण था। NMF भी इसका हिस्सा था।
dpelisek
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.