टेक्स्ट क्लासिफायर ट्रेन करने के लिए मैं कौन से स्वतंत्र रूप से उपलब्ध डेटासेट का उपयोग कर सकता हूं?
हम उसके लिए सबसे अधिक संबंधित सामग्री की सिफारिश करके अपने उपयोगकर्ताओं के जुड़ाव को बढ़ाने की कोशिश कर रहे हैं, इसलिए हमने सोचा कि यदि हम अपनी सामग्री को शब्दों के पूर्वनिर्धारित बैग के आधार पर वर्गीकृत करते हैं, तो हम पहले से ही वर्गीकृत पदों की यादृच्छिक संख्या पर उनकी प्रतिक्रिया प्राप्त करके उन्हें आकर्षक सामग्री की सिफारिश कर सकते हैं। इससे पहले।
हम इस जानकारी का उपयोग उसके लिए उन वर्गों के साथ दालों के लिए अनुशंसित कर सकते हैं। लेकिन हमने पाया कि यदि हम अपनी सामग्री से संबंधित शब्दों के पूर्वनिर्धारित बैग का उपयोग नहीं करते हैं, तो फीचर वेक्टर शून्य से भरा होगा, श्रेणियां भी हमारी सामग्री के लिए प्रासंगिक नहीं हो सकती हैं। इसलिए उन कारणों के लिए हमने एक और समाधान की कोशिश की जो हमारी सामग्री को वर्गीकृत नहीं करेगा।
धन्यवाद :)