जैसा कि कई अन्य लोगों के पास है, मैंने यहां और यहां के संसाधनों को LSTM कोशिकाओं को समझने के लिए बेहद उपयोगी माना। मुझे विश्वास है कि मैं समझता हूं कि मूल्यों का प्रवाह कैसे होता है और अद्यतन किया जाता है, और मुझे विश्वास है कि उल्लेखित "पीपहोल कनेक्शन", आदि को भी जोड़ा जाएगा।
मेरे उदाहरण में, मेरे पास हर बार लंबाई के इनपुट वेक्टर और लंबाई के i
आउटपुट वेक्टर के चरण हैं o
, जहां o < i
।
क्या न तो पृष्ठ को वास्तव में कवर किया गया है, ये कैसे व्यवस्थित और प्रशिक्षित हैं।
मेरे 2 सवाल हैं:
- मेरे प्रशिक्षण डेटा में, मेरे पास बहुत से, कई समय इकाइयों के अनुरूप बहुत सारे इनपुट / आउटपुट वेक्टर जोड़े हैं। मान लीजिए कि मैं LSTM को सभी डेटा के साथ प्रशिक्षित करता हूं। क्या तब मैं इसके माध्यम से निर्धारित एक मनमाना लंबाई इनपुट चला सकता हूं? मेरा क्या मतलब है, अगर मेरे पास 2015 और 2016 के लिए प्रशिक्षण डेटा है, तो क्या मैं 2017 के लिए नेटवर्क के माध्यम से डेटा चला सकता हूं? या शायद 2017 2020 के माध्यम से?
- मैंने जो पढ़ा है, उसके अनुसार, ऐसा महसूस होता है कि मेरे पास एक LSTM सेल प्रति टाइम यूनिट है, इसलिए यदि मेरे पास कई समय इकाइयाँ हैं, तो मेरे पास LSTM की कई कोशिकाएँ हैं। चूँकि श्रृंखला की लंबाई उस डेटा की लंबाई पर निर्भर करती है जिसे मैं नेटवर्क के माध्यम से चलाना चाहता हूं, और यह संभवतः मनमाना है, मैं यह नहीं देख सकता कि मैं इसे कैसे प्रशिक्षित करूंगा, जब तक कि मैं केवल एक एलएसटीएम सेल को प्रशिक्षित नहीं करता हूं जो तब एक नंबर डुप्लिकेट है बार। तो ऐसा लगता है कि मैं एक एकल LSTM सेल को प्रशिक्षित करूंगा, और फिर
n
एक दी गई इनपुट वेक्टर लंबाई की सूची के लिए उन्हें एक साथ श्रृंखला देगाn
? भले ही एक एकल LSTM सेल में कई तत्व और फ़ंक्शंस हों, लेकिन ऐसा लगता है कि इतनी छोटी चीज़ में इतनी जानकारी हासिल करना पर्याप्त नहीं है?
धन्यवाद। क्या कोई अन्य संसाधन हैं जो मैं (अपेक्षाकृत जल्दी से) उपभोग कर सकता हूं जो मुझे कार्यान्वयन के विवरण को समझने में मदद करेगा? ऊपर दिए गए 2 लिंक ने जो चल रहा है उसकी एक शानदार उच्च-स्तरीय तस्वीर दी लेकिन इन बारीक विवरणों को पकड़ने में असफल रहे।