महतो में आइटम आधारित और उपयोगकर्ता आधारित अनुशंसा अंतर


15

मैं जानना चाहता हूं कि उपयोगकर्ता आधारित और आइटम आधारित अनुशंसा बिल्कुल एक दूसरे से कैसे भिन्न हैं।

यह परिभाषित करता है

उपयोगकर्ता-आधारित : समान उपयोगकर्ताओं को ढूंढकर आइटम सुझाएं। उपयोगकर्ताओं की गतिशील प्रकृति के कारण इसे मापना कठिन है।

आइटम-आधारित : वस्तुओं के बीच समानता की गणना करें और सिफारिशें करें। आइटम आमतौर पर ज्यादा नहीं बदलते हैं, इसलिए इसे अक्सर लाइन से गणना की जा सकती है।

लेकिन यद्यपि दो तरह की सिफारिशें उपलब्ध हैं, लेकिन मैं समझता हूं कि ये दोनों कुछ डेटा मॉडल (जैसे 1,2, 1,2, .5 को आइटम 1, आइटम 2, मूल्य या उपयोगकर्ता 1, उपयोगकर्ता 2, मान के रूप में लेंगे जहां मूल्य नहीं है। अनिवार्य) और सभी गणना को एकरूपता के रूप में मापेगा और अनुशंसाकर्ता बिल्ड-इन फ़ंक्शन को हमने चुना और हम एक ही डेटा पर उपयोगकर्ता / आइटम आधारित अनुशंसा दोनों को चला सकते हैं (क्या यह एक सही धारणा है?)।

इसलिए मैं जानना चाहता हूं कि इन दोनों प्रकार के एल्गोरिथ्म में वास्तव में कैसे और किन पहलुओं में भिन्नता है।

जवाबों:


11

आप सही हैं कि दोनों मॉडल बिना किसी समस्या के एक ही डेटा पर काम करते हैं। दोनों आइटम उपयोगकर्ता-आइटम रेटिंग के मैट्रिक्स पर काम करते हैं।

उपयोगकर्ता-आधारित दृष्टिकोण में एल्गोरिथ्म iएक उपयोगकर्ता uद्वारा एक आइटम के लिए एक रेटिंग का उत्पादन करता है जो अन्य उपयोगकर्ताओं की रेटिंग के u'समान है u। यहां समान का मतलब है कि दो उपयोगकर्ता की रेटिंग में एक उच्च पियरसन सहसंबंध या कोसाइन समानता या कुछ समान है।

आइटम आधारित दृष्टिकोण में हम के लिए रेटिंग के उत्पादन iसे uआइटमों के समूह को देखकर i'के समान हैं i(एक ही अर्थ में अब सिवाय इसके बाद के संस्करण के रूप में हम रेटिंग्स कि आइटम उपयोगकर्ताओं से प्राप्त हुआ है पर विचार करना होता) है कि uरेट किया है और फिर से रेटिंग को जोड़ती है uके i'द्वारा एक भविष्यवाणी की रेटिंग में uके लिए i

आइटम-आधारित दृष्टिकोण का आविष्कार Amazon ( http://dl.acm.org/citation.cfm?id=642471 ) पर किया गया था ताकि उपयोगकर्ता-आधारित फ़िल्टरिंग के साथ उनकी स्केल चुनौतियों का समाधान किया जा सके। उनके द्वारा बेची जाने वाली चीजों की संख्या उपयोगकर्ताओं की संख्या की तुलना में बहुत कम और बहुत कम गतिशील होती है, इसलिए आवश्यक होने पर आइटम-आइटम समानताएं ऑफ़लाइन गणना और एक्सेस की जा सकती हैं।


21

आइटम आधारित एल्गोरिथम

for every item i that u has no preference for yet

  for every item j that u has a preference for

    compute a similarity s between i and j

    add u's preference for j, weighted by s, to a running average

 return the top items, ranked by weighted average

उपयोगकर्ता आधारित एल्गोरिथम

for every item i that u has no preference for yet

 for every other user v that has a preference for i

   compute a similarity s between u and v

   add v's preference for i, weighted by s, to a running average

 return the top items, ranked by weighted average

आइटम बनाम उपयोगकर्ता आधारित:

1) अनुशंसाकर्ताओं को उन वस्तुओं या उपयोगकर्ताओं की संख्या के साथ स्केल करना चाहिए जिनसे उन्हें निपटना चाहिए, इसलिए ऐसे परिदृश्य हैं जिनमें प्रत्येक प्रकार एक दूसरे से बेहतर प्रदर्शन कर सकता है

2) वस्तुओं के बीच समानता का अनुमान उपयोगकर्ताओं के बीच समानता की तुलना में समय के साथ अभिसरण करने की अधिक संभावना है

3) हम अभिकलन कर सकते हैं और समानताओं को कैश कर सकते हैं, जो आइटम आधारित अनुशंसाओं को एक प्रदर्शन लाभ दे सकते हैं

4) आइटम आधारित सिफारिशें एक उपयोगकर्ता की पसंदीदा वस्तुओं की सूची से शुरू होती हैं और इसलिए उपयोगकर्ता आधारित अनुशंसाओं के रूप में निकटतम आइटम पड़ोस की आवश्यकता नहीं होती है


निष्पक्ष चेतावनी: लिंक इस साइट पर उत्तर के रूप में स्वीकार नहीं किए जाते हैं। आपके द्वारा किसी भी डाउनवोट प्राप्त करने से पहले मैं संपादन या हटाने की सलाह देता हूं!
शेल्डोन्क्रेगर 18

1
सबसे अधिक संभावना है कि "उपयोगकर्ता-आधारित एल्गोरिथ्म" में एक टाइपो है - चौथी पंक्ति को "यू के लिए यू की वरीयता जोड़ें ..." के साथ शुरू होना चाहिए
बर्नार्डो अफ़लोलो

@BernardoAflalo मुझे इसका टाइपो नहीं लगता, आप सभी वी के लिए वरीयता जोड़ते हैं, और फिर एक औसत भार उठाते हैं
ओसवाल्ड
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.