गतिशील सिफारिश प्रणाली


14

एक सिफ़ारिश प्रणाली विभिन्न उपयोगकर्ताओं की रेटिंग के बीच संबंध को मापेगी और किसी दिए गए उपयोगकर्ता के लिए सिफारिशों की पैदावार करेगी जो उसके लिए ब्याज हो सकती है।

हालांकि, समय के साथ स्वाद बदल जाता है इसलिए पुरानी रेटिंग वर्तमान वरीयताओं को प्रतिबिंबित नहीं कर सकती है और इसके विपरीत। आप एक बार "उत्कृष्ट" को एक पुस्तक में रख सकते हैं जिसे आप अब "बहुत घृणित नहीं" और इतने पर रेट करेंगे। इसके अलावा, रुचियां खुद भी बदलती हैं।

बदलते परिवेश में सिफारिश करने वाले सिस्टम को कैसे काम करना चाहिए?

  1. एक विकल्प "पुरानी" रेटिंग्स को काट देना है, जो ठीक-ठीक यह मानकर काम कर सकती है कि आप "पुराने" को सही ढंग से परिभाषित करते हैं (आप यह भी कह सकते हैं कि रेटिंग कभी भी समाप्त नहीं होती है और यह दिखावा करती है कि समस्या मौजूद नहीं है)। लेकिन यह सबसे अच्छा संभव विकल्प नहीं है: बेशक स्वाद विकसित होता है, यह एक सामान्य जीवन प्रवाह है, और कोई कारण नहीं है कि हम पिछली बार की रेटिंग के अतिरिक्त ज्ञान का उपयोग नहीं कर सकते।
  2. एक अन्य विकल्प किसी भी तरह इस अतिरिक्त ज्ञान को समायोजित करना है। इस प्रकार हम केवल अपनी वर्तमान हितों के लिए एक "त्वरित मैच" नहीं मिल रहा है, लेकिन आप चीजों को आप पसंद कर सकते का सुझाव सकता है अगले (के रूप में चीजों को आप पसंद कर सकते करने के लिए विरोध अब )।

मुझे यकीन नहीं है कि मैं इसे अच्छी तरह समझा रहा हूं। मूल रूप से मैं दूसरे दृष्टिकोण के पक्ष में हूं और एक अनुशंसाकर्ता प्रणाली के बारे में बात कर रहा हूं, जो स्वाद प्रक्षेपवक्रों के सहसंबंधों को मापेगा और उपज की सिफारिशों को पूरा करेगा जो कि .. अच्छी तरह से, इसे व्यक्तिगत विकास कहते हैं - क्योंकि वे ऐसे लोगों से आएंगे जिनके "स्वाद प्रक्षेपवक्र" (और न केवल "स्वाद स्नैपशॉट") आपके समान है।

अब सवाल: मुझे आश्चर्य है कि अगर "विकल्प 2" के समान कुछ पहले से मौजूद है और, अगर ऐसा होता है, तो मुझे आश्चर्य है कि यह कैसे काम करता है। और अगर यह मौजूद नहीं है, तो आप इस पर चर्चा करने के लिए स्वागत करते हैं कि यह कैसे काम करना चाहिए! :)

जवाबों:


8

मैं वास्तव में येहुदा कोरेन (नेटफ्लिक्स कॉन्टेस्ट!) द्वारा टेम्पोरल डायनामिक्स के साथ पेपर को फिल्टर करने की सलाह देता हूं, जहां इस मुद्दे पर विस्तार से चर्चा की जाती है।

मैं लेखक से सहमत हूं, कि पहला विकल्प ("काटना") जाने का तरीका नहीं है। यह सच है कि पुरानी वरीयताओं को इस तरह से नजरअंदाज किया जाता है, लेकिन क) कुछ प्राथमिकताएं कभी नहीं बदलती हैं, इसलिए एक डेटा को हमेशा की पहचान करने के लिए मारता है और ख) भविष्य की प्राथमिकताओं को समझने के लिए अतीत में कुछ वरीयताओं की आवश्यकता होती है ( उदाहरण के लिए सीजन 1 खरीदें -> आप सीजन 2 खरीदने की संभावना है)।

हालाँकि, कोरेन स्पष्ट रूप से ऐसे प्रक्षेपवक्रों की पहचान करने की कोशिश नहीं करता (यानी ताकि कोई उपयोगकर्ता के भविष्य में होने वाले व्यवहार की भविष्यवाणी कर सके), क्योंकि यह बहुत ही कठिन काम है। आप इस बात को ध्यान में रखते हुए कल्पना कर सकते हैं कि एक प्रक्षेपवक्र के साथ वह वरीयता "स्टेशनों" समय के लिए बाध्य नहीं है, लेकिन किसी उपयोगकर्ता के व्यक्तिगत विकास के लिए, संभवतः अन्य प्रक्षेपवक्र द्वारा बाधित या पार किया जाता है या बस एक अलग तरीके से व्यक्त किया जाता है। उदाहरण के लिए, यदि कोई हार्ड एक्शन मूवीज से एक्शन फिल्मों की ओर बढ़ता है, तो निश्चित "एंट्री सॉफ्ट एक्शन मूवी" या ऐसा कुछ नहीं है। उपयोगकर्ता इस क्षेत्र में किसी भी समय (समय और आइटम स्थान पर) दर्ज कर सकता है। डेटा की विरलता के साथ संयुक्त यह समस्या यहां एक व्यवहार्य मॉडल बनाने के लिए लगभग असंभव बना देती है।

इसके बजाय, कोरन रेटिंग पूर्वानुमानों की प्रभावशीलता को बढ़ाने के लिए पिछले डेटा को दीर्घकालिक-पैटर्न-संकेतों और दैनिक शोर में अलग करने की कोशिश करता है। वह एसवीडी और सरल सहयोगी निबोरबूड मॉडल दोनों के लिए इस दृष्टिकोण को लागू करता है। दुर्भाग्य से, मैं अभी तक गणित के साथ नहीं किया गया हूं, इसलिए मैं इस पर अधिक विवरण प्रदान नहीं कर सकता।

प्रक्षेपवक्र के स्पष्ट मॉडलिंग पर अतिरिक्त ध्यान दें

सीक्वेंस माइनिंग का क्षेत्र करने के तरीके प्रदान करता है, लेकिन महत्वपूर्ण बात यह है कि वस्तुओं का एक उपयुक्त सार निरूपण किया जाए (क्योंकि वस्तुओं का उपयोग करने से स्वैच्छिकता के कारण काम नहीं होगा), जैसे टैग में क्लस्टरिंग। हालाँकि, जब यह दृष्टिकोण कुछ उपयोगकर्ताओं (डेटा माइनिंग!) के व्यवहार में कुछ अंतर्दृष्टि प्रदान कर सकता है, तो यह प्रासंगिक नहीं हो सकता है जब यह सभी ग्राहकों (यानी द्रव्यमान) के लिए आवेदन की बात आती है, ताकि कुरान द्वारा सुझाए अनुसार मॉडलिंग निहित हो। अंत में बेहतर है।


येहुदा पेपर मैं जो बात कर रहा था उसके बहुत करीब है, हालांकि वास्तव में वह "स्वाद प्रक्षेपवक्र" के बारे में बात नहीं करता है। शायद आप सही हैं और किसी भी व्यक्ति के लिए "स्वाद परिवर्तन दर" तय नहीं है .. लिंक के लिए धन्यवाद!
andreister

हाँ, यह पहली बात है जिसके बारे में मैंने सोचा था।
स्टम्पी जो पीट

2

मैं एक कार्य प्रणाली के बारे में नहीं जानता, लेकिन आश्चर्यचकित नहीं होता अगर अमेज़ॅन, नेटफ्लिक्स या किसी के पास ऐसी प्रणाली है। यहां तक ​​कि Google खोज इंजन में एक समान प्रकार का सिस्टम हो सकता है।

मैंने डॉ। एनजी के अंतिम सेमेस्टर के कोर्स के दौरान इस बारे में सोचा। मैंने पहले सोचा था कि आयु के आधार पर एक वेटिंग फैक्टर जोड़ना सबसे अच्छा होगा। डेटा का एक टुकड़ा जितना अधिक वर्तमान होगा, उतना ही भारी होगा। यह दृष्टिकोण लागू करने के लिए अपेक्षाकृत सरल और कम्प्यूटेशनल रूप से सस्ता होगा।

हालांकि, इस दृष्टिकोण के बारे में अधिक ध्यान से सोचने के बाद मुझे लगता है कि इसमें कई अनुप्रयोगों के लिए गंभीर खामियां हैं। व्यक्तिगत रूप से, मैं अक्सर एक शैली का पालन करूंगा या कुछ समय के लिए दिखाऊंगा, इसका टायर, किसी और चीज पर जाऊंगा, लेकिन बाद में मूल शैली पर लौटूंगा। यह बर्नआउट, पुनर्मिलन चक्र समाज में भी दिखाई देता है।

इसलिए, मैं थोड़ा और अधिक जटिल प्रणाली की ओर झुक रहा हूं। डेटा को दो सेटों में विभाजित करने की आवश्यकता होगी; वर्तमान डेटा - थ्रेसहोल्ड को अलग-अलग अनुप्रयोगों के आधार पर अलग-अलग बातचीत की लंबाई के आधार पर अलग-अलग करना होगा - जो कि अधिक भारी और "ऐतिहासिक" डेटा होगा जो समय के साथ मूल्यों में धीमी गिरावट के साथ कम मूल्यांकन किया जाएगा। दूसरा, एक कारक को "टर्न-ऑफ" का पता लगाने की कोशिश करने के लिए शामिल किया जाएगा जहां एक भारी ब्याज या भागीदारी अचानक गायब हो जाती है। "वर्तमान" डेटा जो समान रूप से वर्गीकृत किया गया है, उसे फिर से वर्गीकृत किया जाएगा जैसे कि यह ऐतिहासिक था।

इस दृष्टिकोण में से किसी में भी कोई कठोरता या मान्यता नहीं है, लेकिन मेरा मानना ​​है कि यह परिकल्पना के कुछ परीक्षणों के निर्माण के लायक होगा।


पुराने डेटा के लिए कम वजन का आपका विचार वास्तव में "विकल्प 1" के समान है। इसके बजाय, मैं कह रहा हूं कि बदलते स्वाद का संपूर्ण प्रक्षेपवक्र महत्वपूर्ण है - यानी, अगर कल आपको शैली ए पसंद थी और आज आपको शैली बी पसंद है, तो सिस्टम उसी "एबी- ??" वाले अन्य लोगों को देखेगा। स्वाद चलता रहता है और सुझाव देता है कि कल आप शैली सी को पसंद करेंगे
andreister

1

जैसा कि मैं इसे देखता हूं, सहयोगी फ़िल्टरिंग का एक संशोधित संस्करण काम कर सकता है। हालाँकि, आपको प्रत्येक रैंकिंग पर टाइमस्टैम्प रखने की आवश्यकता होगी, और रैंक के वजन की गणना करते समय जुर्माना लगाना होगा जो कि अधिक पुराना है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.