ARIMA बनाम LSTM का उपयोग करके समय श्रृंखला की भविष्यवाणी


10

जिस समस्या से मैं निपट रहा हूं, वह समय श्रृंखला मूल्यों की भविष्यवाणी कर रही है। मैं एक समय में एक श्रृंखला देख रहा हूं और उदाहरण के लिए 15% इनपुट डेटा पर आधारित हूं, मैं इसके भविष्य के मूल्यों की भविष्यवाणी करना चाहता हूं। अब तक मैं दो मॉडल देख चुका हूं:

  • LSTM (दीर्घकालिक अल्पकालिक स्मृति; आवर्तक तंत्रिका नेटवर्क का एक वर्ग)
  • ARIMA

मैंने दोनों की कोशिश की है और उन पर कुछ लेख पढ़े हैं। अब मैं कोशिश कर रहा हूं कि दोनों की तुलना कैसे की जाए। मैंने अब तक क्या पाया है:

  1. अगर हम भारी मात्रा में डेटा के साथ काम कर रहे हैं और पर्याप्त प्रशिक्षण डेटा उपलब्ध है, तो LSTM बेहतर काम करता है, जबकि ARIMA छोटे डेटासेट के लिए बेहतर है (क्या यह सही है?)
  2. ARIMA को (p,q,d)कई मापदंडों की आवश्यकता होती है, जिनकी गणना डेटा के आधार पर की जानी चाहिए, जबकि LSTM को ऐसे पैरामीटर सेट करने की आवश्यकता नहीं है। हालांकि, कुछ हाइपरपरमेटर्स हैं जिन्हें हमें LSTM के लिए ट्यून करना होगा।

उपर्युक्त गुणों के अलावा, मुझे कोई अन्य बिंदु या तथ्य नहीं मिला, जो मुझे सर्वश्रेष्ठ मॉडल का चयन करने में मदद कर सके। मैं वास्तव में आभारी रहूंगा यदि कोई मुझे लेख, कागजात या अन्य सामान खोजने में मदद कर सकता है (अब तक कोई भाग्य नहीं था, यहां और वहां केवल कुछ सामान्य राय और प्रयोगों के आधार पर कुछ भी नहीं है।)

मुझे यह उल्लेख करना होगा कि मूल रूप से मैं स्ट्रीमिंग डेटा के साथ काम कर रहा हूं, हालांकि अब मैं NAB डेटासेट का उपयोग कर रहा हूं जिसमें 20k डेटा बिंदुओं के अधिकतम आकार के साथ 50 डेटासेट शामिल हैं।


1
आप अपने डेटा के हिस्से पर केवल दो मॉडलों की कोशिश क्यों नहीं करते, देखें कि पूर्वानुमान में कौन सा बेहतर है, और इसे चुनें। या दोनों मॉडल का उपयोग करें और उनके पूर्वानुमान को मिलाएं। पूर्वानुमान संयोजन अक्सर व्यक्तिगत पूर्वानुमानों को बेहतर बनाते हैं।
रिचर्ड हार्डी

@ रीचर्डहार्डी मैं पहले ही कर चुका हूं और अपने डेटासेट पर उनके प्रदर्शन से अवगत हूं। मैं दोनों की बेहतर समझ प्राप्त करने की कोशिश कर रहा हूं, विशेष रूप से उनकी कमियां यह देखने के लिए कि आगामी डेटा नमूनों को संभालने के लिए सबसे अच्छा उम्मीदवार कौन हो सकता है।
अंजीब


कृपया सहायता केंद्र पढ़ें - विशेष रूप से तीसरा-अंतिम पैराग्राफ जो कहता है " कृपया ध्यान दें, हालांकि, एसई साइटों पर क्रॉस-पोस्टिंग नहीं है। अपने प्रश्न को पोस्ट करने के लिए एक सर्वोत्तम स्थान चुनें। बाद में, यदि यह बेहतर अनुकूल साबित होता है। दूसरी साइट, इसे माइग्रेट किया जा सकता है। "
Glen_b -Reinstate Monica

जवाबों:


3

कमोडिटी की कीमतों के पूर्वानुमान के लिए कृत्रिम तंत्रिका नेटवर्क और समय श्रृंखला के मॉडल की तुलना वित्तीय समय श्रृंखला की भविष्यवाणी में एएनएन और एआरआईएमए के प्रदर्शन की तुलना करती है। मुझे लगता है कि यह आपके साहित्य की समीक्षा के लिए एक अच्छा शुरुआती बिंदु है।

कई मामलों में, तंत्रिका नेटवर्क एआर-आधारित मॉडल से बेहतर प्रदर्शन करते हैं। हालांकि, मुझे लगता है कि अधिक उन्नत मशीन सीखने के तरीकों के साथ एक बड़ी खामी (जिसकी अकादमिक लिटरेचर में ज्यादा चर्चा नहीं है) यह है कि वे ब्लैक बॉक्स का उपयोग करते हैं। यह एक बड़ी समस्या है यदि आपको यह बताना है कि मॉडल किसी ऐसे व्यक्ति के लिए कैसे काम करता है जो इन मॉडलों के बहुत से नहीं जानता (उदाहरण के लिए एक निगम में)। लेकिन अगर आप यह विश्लेषण सिर्फ एक स्कूल के काम के रूप में कर रहे हैं, तो मुझे नहीं लगता कि यह कोई मुद्दा है।

लेकिन पिछले कमेंटेटर की तरह आमतौर पर सबसे अच्छा तरीका एक एनसेंबल असेसमेंट बनाना होता है जिसमें आप दो या दो से अधिक मॉडल्स को मिलाते हैं।


7
रेफरी ने आपको सरल फीडफॉरवर्ड न्यूरल नेट से संबंधित होने का हवाला दिया और यह उपयोगी होने के लिए बहुत पुराना है (1990 के दशक एक सदी पहले)। ओपी प्रश्न एलएसटीएम आर्किटेक्चर के साथ आवर्तक तंत्रिका जाल के बारे में पूछता है और यह पेपर कवर नहीं करता है।

1
जैसा कि @horaceT ने उल्लेख किया है कि यह पेपर थोड़ा पुराना है और यदि आप अधिक हाल के पेपर का सुझाव दे सकते हैं जिसमें LSTM की जानकारी शामिल है तो यह बहुत बढ़िया होगा। धन्यवाद
ahajib
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.