मैं टेक्स्ट को वर्गीकृत करने के लिए एक lstm और फीड-फॉरवर्ड नेटवर्क का उपयोग कर रहा हूं।
मैं पाठ को एक-गर्म वैक्टर में परिवर्तित करता हूं और प्रत्येक को lstm में फ़ीड करता हूं ताकि मैं इसे एकल प्रतिनिधित्व के रूप में सारांशित कर सकूं। फिर मैं इसे दूसरे नेटवर्क को खिलाता हूं।
लेकिन मैं lstm को कैसे प्रशिक्षित करूं? मैं सिर्फ पाठ को वर्गीकृत करना चाहता हूं - क्या मुझे इसे बिना प्रशिक्षण के खिलाना चाहिए? मैं सिर्फ एक आइटम के रूप में मार्ग का प्रतिनिधित्व करना चाहता हूं जिसे मैं क्लासिफायरियर की इनपुट परत में फीड कर सकता हूं।
मैं इस के साथ किसी भी सलाह की बहुत सराहना करेंगे!
अपडेट करें:
इसलिए मेरे पास एक lstm और एक क्लासिफायरियर है। मैं lstm के सभी आउटपुट लेता हूं और उन्हें पूल करता हूं, फिर मैं उस औसत को क्लासिफायर में खिलाता हूं।
मेरा मुद्दा यह है कि मैं नहीं जानता कि lstm या क्लासिफायर ट्रेन कैसे करें। मुझे पता है कि इनपुट lstm के लिए क्या होना चाहिए और उस इनपुट के लिए क्लासिफायर का आउटपुट क्या होना चाहिए। चूंकि वे दो अलग-अलग नेटवर्क हैं जो केवल क्रमिक रूप से सक्रिय हो रहे हैं, मुझे यह जानने की जरूरत है और पता नहीं है कि एलएसटीएम के लिए आदर्श-आउटपुट क्या होना चाहिए, जो कि क्लासिफायरियर के लिए भी इनपुट होगा। क्या इसे करने का कोई तरीका है?