RNN का उपयोग भविष्यवाणी के लिए किया जा सकता है, या अनुक्रम से अनुक्रम मैपिंग के लिए किया जा सकता है। लेकिन आरएनएन को वर्गीकरण के लिए कैसे इस्तेमाल किया जा सकता है? मेरा मतलब है, हम एक पूरे अनुक्रम को एक लेबल देते हैं।
RNN का उपयोग भविष्यवाणी के लिए किया जा सकता है, या अनुक्रम से अनुक्रम मैपिंग के लिए किया जा सकता है। लेकिन आरएनएन को वर्गीकरण के लिए कैसे इस्तेमाल किया जा सकता है? मेरा मतलब है, हम एक पूरे अनुक्रम को एक लेबल देते हैं।
जवाबों:
एक इनपुट (लेबल) के लिए कई इनपुट मैप करने के लिए RNN का उपयोग कर सकते हैं, क्योंकि यह आंकड़ा ( स्रोत ) दिखाता है:
प्रत्येक आयत एक वेक्टर है और तीर फ़ंक्शन (जैसे मैट्रिक्स गुणा) का प्रतिनिधित्व करते हैं। इनपुट वैक्टर लाल रंग में होते हैं, आउटपुट वैक्टर नीले रंग में होते हैं और हरे रंग के वैक्टर आरएनएन की स्थिति को धारण करते हैं (इस पर जल्द ही)। बाएं से दाएं: (1) आरएनएन के बिना प्रसंस्करण के वेनिला मोड, निश्चित आकार के इनपुट से लेकर निश्चित आकार के आउटपुट (उदाहरण के लिए वर्गीकरण) तक। (2) अनुक्रम आउटपुट (जैसे छवि कैप्शनिंग एक छवि लेता है और शब्दों का एक वाक्य आउटपुट करता है)। (3) अनुक्रम इनपुट (उदाहरण के लिए भावना का विश्लेषण जहां किसी दिए गए वाक्य को सकारात्मक या नकारात्मक भावना व्यक्त करने के रूप में वर्गीकृत किया गया है)। (4) अनुक्रम इनपुट और अनुक्रम आउटपुट (जैसे मशीन अनुवाद: एक आरएनएन अंग्रेजी में एक वाक्य पढ़ता है और फिर फ्रेंच में एक वाक्य आउटपुट करता है)। (5) सिंक किए गए अनुक्रम इनपुट और आउटपुट (जैसे वीडियो वर्गीकरण जहां हम वीडियो के प्रत्येक फ्रेम को लेबल करना चाहते हैं)।
सरल आरएनएन के मामले में, अपने नेटवर्क को संपूर्ण अनुक्रम खिलाएं और फिर अंतिम अनुक्रम तत्व पर आउटपुट क्लास लेबल देखें ( इस दृष्टिकोण के प्रारंभिक उदाहरण के लिए इस पेपर और संदर्भ देखें )। प्रशिक्षण चरण में हम पिछले अनुक्रम तत्व से अनुक्रम की शुरुआत के समय में त्रुटि को बैकप्रोपोगेट कर सकते हैं। सामान्य तौर पर यह आरएनएन अनुक्रम लेबलिंग समस्या से अलग नहीं है, जहां हमें केवल अनुक्रम के कुछ तत्वों को लेबल निर्दिष्ट करने की आवश्यकता होती है (या अन्य सभी तत्वों को अन्य के रूप में लेबल किया जाता है)।