एक आवर्तक तंत्रिका नेटवर्क क्या है?


12

आश्चर्यजनक रूप से यह पहले नहीं पूछा गया था - कम से कम मुझे कुछ अस्पष्ट संबंधित प्रश्नों के अलावा कुछ भी नहीं मिला

तो, एक आवर्तक तंत्रिका नेटवर्क क्या है, और नियमित एनएन पर उनके फायदे क्या हैं?


1
क्रिस्टोफर ओलाह द्वारा ब्लॉग पोस्ट अंडरस्टैंडिंग LSTM नेटवर्क देखें ।
श्रीमती

जवाबों:


6

आवर्तक तंत्रिका नेटवर्क (RNN) मस्तिष्क में न्यूरॉन्स की चक्रीय कनेक्टिविटी से प्रेरित कृत्रिम तंत्रिका नेटवर्क वास्तुकला का एक वर्ग है। यह जानकारी संग्रहीत करने के लिए पुनरावृत्त फ़ंक्शन लूप का उपयोग करता है।

इस पुस्तक के चित्रों का उपयोग करते हुए पारंपरिक तंत्रिका नेटवर्क के साथ अंतर :

यहाँ छवि विवरण दर्ज करें

और, एक आरएनएन:

यहाँ छवि विवरण दर्ज करें

अंतर पर ध्यान दें - फीडवर्डवर्ड न्यूरल नेटवर्क के कनेक्शन चक्र नहीं बनाते हैं। यदि हम इस स्थिति में आराम करते हैं, और चक्रीय कनेक्शन की अनुमति देते हैं, तो हम आवर्तक तंत्रिका नेटवर्क (RNN) प्राप्त करते हैं। आप देख सकते हैं कि वास्तुकला की छिपी हुई परत में।

जबकि एक बहुपरत अवधारणात्मक और एक आरएनएन के बीच का अंतर तुच्छ लग सकता है, अनुक्रम सीखने के निहितार्थ दूरगामी हैं। एक एमएलपी केवल इनपुट से आउटपुट वैक्टर तक मैप कर सकता है , जबकि एक आरएनएन पिछले आउटपुट के पूरे इतिहास से प्रत्येक आउटपुट के सिद्धांत मानचित्र में कर सकता है । वास्तव में, एमएलपी के लिए सार्वभौमिक सन्निकटन सिद्धांत के बराबर परिणाम यह है कि पर्याप्त संख्या में छिपी इकाइयों के साथ एक आरएनएन किसी भी औसत दर्जे के अनुक्रम-टू-सीक्वेंस मैपिंग को मनमानी सटीकता के लिए अनुमानित कर सकता है।

महत्वपूर्ण टेकअवे:

आवर्तक कनेक्शन नेटवर्क की आंतरिक स्थिति में बने रहने के लिए पिछले इनपुट की 'मेमोरी' की अनुमति देते हैं, और इस तरह नेटवर्क आउटपुट को प्रभावित करते हैं।

फायदे के संदर्भ में बात करना उचित नहीं है क्योंकि वे दोनों अत्याधुनिक हैं और कुछ कार्यों में विशेष रूप से अच्छे हैं। RNN पर किए गए कार्यों की एक विस्तृत श्रेणी है:

अनुक्रम लेबलिंग

अनुक्रम लेबलिंग का लक्ष्य इनपुट डेटा के दृश्यों के लिए, एक निश्चित वर्णमाला से खींचे गए लेबल के अनुक्रम निर्दिष्ट करना है।

पूर्व: बोले गए शब्दों (भाषण मान्यता), या हाथ के इशारों के साथ वीडियो फ्रेम के अनुक्रम के साथ ध्वनिक सुविधाओं का एक अनुक्रम लिखें।

अनुक्रम लेबलिंग में उप-कार्यों में से कुछ हैं:

अनुक्रम वर्गीकरण

लेबल अनुक्रम लंबाई एक के लिए विवश हैं। इसे अनुक्रम वर्गीकरण के रूप में संदर्भित किया जाता है, क्योंकि प्रत्येक इनपुट अनुक्रम एक एकल वर्ग को सौंपा गया है। अनुक्रम वर्गीकरण कार्य के उदाहरणों में एकल बोले गए कार्य की पहचान और व्यक्तिगत हस्तलिखित पत्र की मान्यता शामिल है।

खंड वर्गीकरण

सेगमेंट वर्गीकरण से तात्पर्य उन कार्यों से है जहां लक्ष्य अनुक्रम में कई लेबल होते हैं, लेकिन लेबल के स्थान - अर्थात्, इनपुट खंडों की स्थिति, जिस पर लेबल लागू होते हैं - अग्रिम में ज्ञात होते हैं।


9

एक आवर्तक तंत्रिका नेटवर्क (RNN) एक कृत्रिम तंत्रिका नेटवर्क है जिसमें पिछड़े या स्व-कनेक्शन होते हैं, जैसे कि केवल फॉरवर्ड कनेक्शन के विपरीत, जैसे कि फीड-फॉरवर्ड न्यूरल नेटवर्क (FFNN)। विशेषण "आवर्तक" इस प्रकार इस पिछड़े या स्वयं-कनेक्शन को संदर्भित करता है, जो इन नेटवर्क में लूप बनाते हैं।

RNN को समय (BBTT) के माध्यम से बैक-प्रचार का उपयोग करके प्रशिक्षित किया जा सकता है , जैसे कि ये पिछड़े या स्व-कनेक्शन पहले देखे गए इनपुट को "याद" करते हैं। इसलिए, इन कनेक्शनों का उपयोग मुख्य रूप से इनपुट के अनुक्रम के तत्वों के बीच अस्थायी संबंधों को ट्रैक करने के लिए किया जाता है, जो आरएनएन को अनुक्रम भविष्यवाणी और समान कार्यों के लिए अच्छी तरह से अनुकूल बनाता है।

कई आरएनएन मॉडल हैं: उदाहरण के लिए, एलएनटीएम या जीआरयू इकाइयों के साथ आरएनएन। LSTM (या GRU) एक RNN है जिसकी एकल इकाइयाँ "सादे RNN" में एक इकाई की तुलना में अधिक जटिल परिवर्तन करती हैं, जो एक गैर-रेखीय फ़ंक्शन के अनुप्रयोग के बाद इनपुट का एक रैखिक परिवर्तन करता है (जैसे कि ReLU) रैखिक परिवर्तन। सिद्धांत रूप में, "सादे आरएनएन" LSTM इकाइयों के साथ RNN के समान शक्तिशाली हैं। व्यवहार में, वे "लुप्त और विस्फोट ग्रेडिएंट्स" समस्या से पीड़ित हैं। इसलिए, व्यवहार में, LSTM (या समान परिष्कृत आवर्तक इकाइयों) का उपयोग किया जाता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.