यह अनुशंसा करने में बहुत सामान्य है कि हमारे पास उपयोगकर्ता उत्पाद डेटा है, जैसे कि "क्लिक" के रूप में लेबल है। मॉडल को सीखने के लिए, मुझे क्लिक और नो-क्लिक डेटा की आवश्यकता है।
उत्पन्न करने के लिए सरलतम तरीका उपयोगकर्ता-उत्पादों के जोड़े को लेना है जो क्लिक डेटा में नहीं पाए जाते हैं। हालाँकि, यह भ्रामक हो सकता है। उदाहरण:
user1, product1 (click)
user2, product2 (click)
user2, product3 (click)
user3, product2 (click)
मैं product1 को छोड़कर सभी उत्पादों के साथ user1 ले सकता हूं और उन्हें "no_click" और इतने पर लेबल कर सकता हूं। लेकिन यह सच नहीं हो सकता है। शायद user1 ने product2 पर क्लिक किया होगा यदि उसे product2 दिखाया गया था। लेकिन सिर्फ इसलिए कि उन्हें उत्पादों के अन्य सेट दिखाए गए थे - उनके पास उत्पाद 2 पर क्लिक / नो-क्लिक करने का निर्णय लेने का कोई अवसर नहीं था।
तो कैसे एकजुट डेटा समस्या को संबोधित करने के लिए?