मैं हाल ही में LSTM में दिलचस्पी ले रहा हूं और मुझे यह जानकर आश्चर्य हुआ कि वजन समय के साथ साझा किया जाता है।
मुझे पता है कि यदि आप समय के साथ वजन साझा करते हैं, तो आपके इनपुट समय अनुक्रम एक चर लंबाई हो सकते हैं।
साझा भार के साथ आपके पास प्रशिक्षित करने के लिए कई कम पैरामीटर हैं।
मेरी समझ से, कारण एक LSTM बनाम कुछ अन्य शिक्षण पद्धति में बदल जाएगा क्योंकि आप मानते हैं कि आपके डेटा में कुछ प्रकार की अस्थायी / अनुक्रमिक संरचना / निर्भरता है जिसे आप सीखना चाहते हैं। यदि आप वैरिएबल लेंथ 'लग्जरी' का त्याग करते हैं, और लंबी गणना समय स्वीकार करते हैं, तो एक आरएनएन / LSTM बिना साझा वज़न के नहीं होगा (यानी हर बार जब आपके पास अलग-अलग वज़न है) बेहतर तरीके से प्रदर्शन करते हैं या ऐसा कुछ है जो मुझे याद आ रहा है?