मैं 1 मिलियन लेबल वाले दस्तावेज़ों से मिलकर पाठ वर्गीकरण के लिए scikit रैखिक समर्थन वेक्टर मशीन (SVM) क्लासिफायरियर का उपयोग करने की योजना बना रहा हूं। मैं क्या करने की योजना बना रहा हूं, जब कोई उपयोगकर्ता किसी कीवर्ड में प्रवेश करता है, तो क्लासिफायर पहले इसे एक श्रेणी में वर्गीकृत करेगा, और फिर बाद की सूचना पुनर्प्राप्ति क्वेरी उस श्रेणी श्रेणी के दस्तावेजों के भीतर होगी। मेरे कुछ प्रश्न हैं:
- मैं कैसे पुष्टि करूं कि वर्गीकरण में अधिक समय नहीं लगेगा? मैं नहीं चाहता कि उपयोगकर्ताओं को बेहतर परिणाम प्राप्त करने के लिए एक वर्गीकरण के इंतजार में समय बिताना पड़े।
- क्या वेबसाइटों / वेब अनुप्रयोगों के लिए पायथन की स्कैबिट लाइब्रेरी का उपयोग इसके लिए उपयुक्त है?
- क्या कोई जानता है कि उपयोगकर्ता के प्रश्नों पर अमेजन या फ्लिपकार्ट कैसे वर्गीकरण करते हैं, या क्या वे पूरी तरह से अलग तर्क का उपयोग करते हैं?