सामान्य तौर पर, एलएसटीएम में परतों की संख्या या मेमोरी कोशिकाओं की संख्या का निर्धारण करने के बारे में कोई दिशानिर्देश नहीं हैं।
LSTM में आवश्यक परतों और कोशिकाओं की संख्या समस्या के कई पहलुओं पर निर्भर हो सकती है:
डेटासेट की जटिलता । सुविधाओं की संख्या, डेटा बिंदुओं की संख्या आदि।
डेटा जनरेट करने की प्रक्रिया। डेटा निर्माण प्रक्रिया कैसे महत्वपूर्ण भूमिका निभा सकती है, इसके उदाहरण के बाद।
पूर्व - एक अच्छी तरह से समझी गई अर्थव्यवस्था के सकल घरेलू उत्पाद की भविष्यवाणी की तुलना में तेल की कीमतों की भविष्यवाणी। उत्तरार्द्ध पूर्व की तुलना में बहुत आसान है। इस प्रकार, तेल की कीमतों की भविष्यवाणी करने के साथ-साथ सकल घरेलू उत्पाद की तुलना में अधिक सटीकता के साथ भविष्यवाणी करने के लिए LSTM मेमोरी कोशिकाओं की अधिक संख्या की आवश्यकता हो सकती है।
- उपयोग की स्थिति के लिए आवश्यक सटीकता। मेमोरी कोशिकाओं की संख्या इस पर बहुत अधिक निर्भर करेगी । यदि लक्ष्य अत्याधुनिक को हरा देना है - तो सामान्य रूप से अधिक एलएसटीएम कोशिकाओं की आवश्यकता है। उचित भविष्यवाणियों के साथ आने के लक्ष्य की तुलना करें - जिन्हें LSTM कोशिकाओं की कम संख्या की आवश्यकता होगी।
LSTM का उपयोग करते समय मैं इन चरणों का पालन करता हूं:
2 या 3 मेमोरी कोशिकाओं के साथ एक छिपी हुई परत का प्रयास करें। देखें कि यह बेंचमार्क के खिलाफ कैसा प्रदर्शन करता है। यदि यह समय श्रृंखला की समस्या है तो मैं आमतौर पर शास्त्रीय समय श्रृंखला तकनीकों से एक बेंचमार्क के रूप में पूर्वानुमान लगाता हूं।
कोशिश करें और मेमोरी सेल्स की संख्या बढ़ाएँ। यदि प्रदर्शन बहुत अधिक नहीं बढ़ रहा है, तो अगले चरण पर जाएं।
नेटवर्क को गहरा बनाना शुरू करें यानी मेमोरी सेल की एक छोटी संख्या के साथ एक और परत जोड़ें।
एक तरफ:
नुकसान की फ़ंक्शन के उस वैश्विक मिनीमा तक पहुंचने और सर्वोत्तम हाइपर-मापदंडों को ट्यून करने के लिए समर्पित श्रम की मात्रा की कोई सीमा नहीं है। इसलिए, मॉडलिंग के लिए अंतिम लक्ष्य पर ध्यान केंद्रित करना चाहिए जितना संभव हो उतना सटीकता बढ़ाने की कोशिश करने के बजाय रणनीति होनी चाहिए।
अधिकांश समस्याओं को नेटवर्क की 2-3 परतों का उपयोग करके नियंत्रित किया जा सकता है।