मैं करैस पैकेज के अपने ज्ञान का विस्तार कर रहा हूं और मैं कुछ उपलब्ध मॉडलों के साथ काम कर रहा हूं। मेरे पास एक एनएलपी बाइनरी वर्गीकरण समस्या है जिसे मैं हल करने की कोशिश कर रहा हूं और विभिन्न मॉडल लागू कर रहा हूं।
कुछ परिणामों के साथ काम करने और LSTM के बारे में अधिक से अधिक पढ़ने के बाद, ऐसा लगता है कि यह दृष्टिकोण मेरे द्वारा (कई डेटासेटों में) की कोशिश की गई चीज़ों से कहीं अधिक श्रेष्ठ है। मैं अपने आप को सोचता रहता हूं, "आप / आप एलएसटीएम का उपयोग क्यों नहीं करेंगे?" LSTM में निहित अतिरिक्त फाटकों का उपयोग, कुछ मॉडलों के गायब होने के बाद मेरे लिए सही समझ में आता है जो लुप्त हो रहे ग्रेडिएंट्स से पीड़ित हैं।
तो क्या LSTM के साथ पकड़ है? वे इतना अच्छा कहां नहीं करते हैं? मुझे पता है कि "एक आकार सभी फिट बैठता है" एल्गोरिथम जैसी कोई चीज नहीं है, इसलिए LSTM के लिए नकारात्मक पहलू होना चाहिए।