lstm पर टैग किए गए जवाब

लॉन्ग शॉर्ट टर्म मेमोरी (LSTM) एक न्यूरल नेटवर्क आर्किटेक्चर है जिसमें बार-बार आने वाले NN ब्लॉक होते हैं जो समय की एक मनमानी लंबाई के लिए एक मूल्य याद रख सकते हैं।

4
LSTM लुप्त होती क्रमिक समस्या को कैसे रोकता है?
LSTM का आविष्कार विशेष रूप से लुप्त हो रही ढाल समस्या से बचने के लिए किया गया था। ऐसा नहीं है कि ऐसा करने के लिए लगातार त्रुटि Carousel (सीईसी) है, जो नीचे चित्र पर (से के साथ माना जाता है Greff एट अल। ) के अनुरूप चारों ओर पाश …

5
LSTM इकाइयों बनाम कोशिकाओं को समझना
मैं कुछ समय से LSTM का अध्ययन कर रहा हूं। मैं एक उच्च स्तर पर समझता हूं कि सब कुछ कैसे काम करता है। हालाँकि, उन्हें Tensorflow का उपयोग करके लागू करने जा रहा है मैंने देखा है कि BasicLSTMCell को कई इकाइयों (यानी num_units) पैरामीटर की आवश्यकता होती है …

1
प्रशिक्षण हानि नीचे और ऊपर फिर जाती है। क्या हो रहा है?
मेरा प्रशिक्षण नुकसान नीचे और फिर ऊपर जाता है। यह बहुत ही अजीब है। क्रॉस-वेलिडेशन लॉस प्रशिक्षण हानि को ट्रैक करता है। क्या हो रहा है? मेरे पास दो स्टैक्ड LSTMS इस प्रकार हैं (करेस पर): model = Sequential() model.add(LSTM(512, return_sequences=True, input_shape=(len(X[0]), len(nd.char_indices)))) model.add(Dropout(0.2)) model.add(LSTM(512, return_sequences=False)) model.add(Dropout(0.2)) model.add(Dense(len(nd.categories))) model.add(Activation('sigmoid')) model.compile(loss='binary_crossentropy', …

3
कई LSTM को ढेर करने के क्या फायदे हैं?
फायदे क्या हैं, क्यों एक-एक नेटवर्क में, कई LSTM का उपयोग किया जाएगा, एक-एक करके, एक तरफ? मैं एक इनपुट के अनुक्रम का प्रतिनिधित्व करने के लिए एक LSTM का उपयोग कर रहा हूं। इसलिए एक बार मेरे पास यह एकल प्रतिनिधित्व है - मैं इसे फिर से क्यों पास …

1
वास्तव में ध्यान तंत्र क्या हैं?
ध्यान तंत्र का उपयोग पिछले कुछ वर्षों में विभिन्न डीप लर्निंग पेपर में किया गया है। इल्या सुतकीवर, ओपन एआई के शोध प्रमुख, ने उत्साहपूर्वक उनकी प्रशंसा की: https://towardsdatascience.com/the-fall-of-rnn-lstm-2d1594c74ce0 पर्ड्यू विश्वविद्यालय में यूजीनियो क्यूलुरसेलो ने दावा किया है कि आरएनएन और एलएसटीएम को पूरी तरह से ध्यान आधारित तंत्रिका नेटवर्क …

3
केआरएस के साथ LSTM में input_shape पैरामीटर को समझना
मैं "स्टैक्ड LSTM फॉर सीक्वेंस वर्गीकरण" नाम के केरस प्रलेखन में वर्णित उदाहरण का उपयोग करने की कोशिश कर रहा हूं (नीचे कोड देखें) और input_shapeअपने डेटा के संदर्भ में पैरामीटर का पता नहीं लगा सकता । मेरे पास इनपुट के रूप में 25 संभावित वर्णों के दृश्यों का एक …
20 lstm  keras  shape  dimensions 

4
प्रतिक्रिया RNN और LSTM / GRU के बीच अंतर
मैं अलग-अलग आवर्तक तंत्रिका नेटवर्क (RNN) आर्किटेक्चर को समय श्रृंखला डेटा पर लागू करने के लिए समझने की कोशिश कर रहा हूं और RNN का वर्णन करते समय अक्सर उपयोग किए जाने वाले विभिन्न नामों के साथ थोड़ा भ्रमित हो रहा हूं। क्या दीर्घकालिक अल्पकालिक मेमोरी (LSTM) और गेटेड रिकरंट …

2
एलएसटीएम के लिए कौन से अनुकूलन के तरीके सबसे अच्छे हैं?
मैं LSTMs के साथ प्रयोग करने के लिए थीनो का उपयोग कर रहा हूं, और सोच रहा था कि LSTM के लिए कौन से अनुकूलन के तरीके (SGD, Adagrad, Adadelta, RMSprop, Adam, etc) सबसे अच्छे हैं? क्या इस विषय पर कोई शोध पत्र हैं? इसके अलावा, क्या इसका जवाब इस …

3
RNN / LSTM नेटवर्क का वजन समय के साथ क्यों साझा किया जाता है?
मैं हाल ही में LSTM में दिलचस्पी ले रहा हूं और मुझे यह जानकर आश्चर्य हुआ कि वजन समय के साथ साझा किया जाता है। मुझे पता है कि यदि आप समय के साथ वजन साझा करते हैं, तो आपके इनपुट समय अनुक्रम एक चर लंबाई हो सकते हैं। साझा …

3
आरसीएन (LSTM) का उपयोग समय के वैक्टर (थीनो) की भविष्यवाणी के लिए
मुझे बहुत ही साधारण समस्या है लेकिन मुझे इसे हल करने के लिए एक सही उपकरण नहीं मिल रहा है। मेरे पास उसी लंबाई के वैक्टर के कुछ अनुक्रम हैं। अब मैं इन अनुक्रमों के ट्रेन नमूने पर LSTM RNN को प्रशिक्षित करना चाहता हूं और फिर कई प्राइमिंग वैक्टरों …

3
तंत्रिका नेटवर्क में नमूने, समय कदम और सुविधाओं के बीच अंतर
मैं LSTM तंत्रिका नेटवर्क पर निम्न ब्लॉग से गुजर रहा हूं: http://machinelearningmastery.com/understanding-stateful-lstm-recurrent-neural-networks-python-keras/ लेखक इनपुट वेक्टर X को LSTM के विभिन्न विन्यास के लिए [नमूने, समय के कदम, सुविधाएँ] के रूप में फिर से दिखाता है। लेखक लिखता है दरअसल, अक्षरों के क्रम अलग-अलग सुविधाओं के एक समय के कदम के …

1
आरएनएन: बीपीटीटी और / या अपडेट कब लागू करें?
मैं आरएनएन के उच्च स्तरीय अनुप्रयोग को समझने के लिए (अन्य लोगों के बीच) ग्रोम्स के 2005 के पेपर को फोनेमी वर्गीकरण पर अनुक्रमित करने की कोशिश कर रहा हूं । समस्या को संक्षेप में बताने के लिए: हमारे पास एक बड़ा प्रशिक्षण सेट है जिसमें एकल वाक्यों की ऑडियो …
16 lstm  rnn 

1
मॉडल के लिए एक RNN के लिए एक व्यवहार्य अनुक्रम लंबाई क्या है?
मैं मॉडलिंग समितियों के डेटा के लिए एक आवर्तक तंत्रिका नेटवर्क (RNN) के LSTM ( दीर्घकालिक अल्पकालिक मेमोरी ) संस्करण का उपयोग कर रहा हूं । जैसे-जैसे डेटा की अनुक्रम लंबाई बढ़ती है, नेटवर्क की जटिलता बढ़ जाती है। इसलिए मैं उत्सुक हूं कि एक अच्छी सटीकता के साथ मॉडल …

1
छोटे डेटासेट पर LSTM के ओवरफिटिंग को रोकना
मैं 80 परतों के साथ एक word2vec जैसे प्रतिनिधित्व का उपयोग करते हुए 128 छिपी इकाइयों के साथ एक परत LSTM का उपयोग कर भावना भविष्यवाणी के लिए 15000 ट्वीट्स मॉडलिंग कर रहा हूं। मुझे 1 युग के बाद एक वंश सटीकता (यादृच्छिक = 20% के साथ 38%) मिलती है। …

1
गहरे नेटवर्क की LSTM परत को कैसे प्रशिक्षित करें
मैं टेक्स्ट को वर्गीकृत करने के लिए एक lstm और फीड-फॉरवर्ड नेटवर्क का उपयोग कर रहा हूं। मैं पाठ को एक-गर्म वैक्टर में परिवर्तित करता हूं और प्रत्येक को lstm में फ़ीड करता हूं ताकि मैं इसे एकल प्रतिनिधित्व के रूप में सारांशित कर सकूं। फिर मैं इसे दूसरे नेटवर्क …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.