जिस समस्या से मैं निपट रहा हूं, वह समय श्रृंखला मूल्यों की भविष्यवाणी कर रही है। मैं एक समय में एक श्रृंखला देख रहा हूं और उदाहरण के लिए 15% इनपुट डेटा पर आधारित हूं, मैं इसके भविष्य के मूल्यों की भविष्यवाणी करना चाहता हूं। अब तक मैं दो मॉडल देख चुका हूं:
- LSTM (दीर्घकालिक अल्पकालिक स्मृति; आवर्तक तंत्रिका नेटवर्क का एक वर्ग)
- ARIMA
मैंने दोनों की कोशिश की है और उन पर कुछ लेख पढ़े हैं। अब मैं कोशिश कर रहा हूं कि दोनों की तुलना कैसे की जाए। मैंने अब तक क्या पाया है:
- अगर हम भारी मात्रा में डेटा के साथ काम कर रहे हैं और पर्याप्त प्रशिक्षण डेटा उपलब्ध है, तो LSTM बेहतर काम करता है, जबकि ARIMA छोटे डेटासेट के लिए बेहतर है (क्या यह सही है?)
- ARIMA को
(p,q,d)
कई मापदंडों की आवश्यकता होती है, जिनकी गणना डेटा के आधार पर की जानी चाहिए, जबकि LSTM को ऐसे पैरामीटर सेट करने की आवश्यकता नहीं है। हालांकि, कुछ हाइपरपरमेटर्स हैं जिन्हें हमें LSTM के लिए ट्यून करना होगा। - संपादित करें: दोनों के बीच एक बड़ा अंतर जो मैंने यहां एक महान लेख पढ़ते समय देखा , वह यह है कि एआरआईएमए केवल स्थिर समय श्रृंखला (जहां कोई मौसमी, प्रवृत्ति और आदि नहीं है) पर अच्छा प्रदर्शन कर सकता है और आपको इसकी देखभाल करने की आवश्यकता है ARIMA का उपयोग करना चाहते हैं
उपर्युक्त गुणों के अलावा, मुझे कोई अन्य बिंदु या तथ्य नहीं मिला, जो मुझे सर्वश्रेष्ठ मॉडल का चयन करने में मदद कर सके। मैं वास्तव में आभारी रहूंगा यदि कोई मुझे लेख, कागजात या अन्य सामान खोजने में मदद कर सकता है (अब तक कोई भाग्य नहीं था, यहां और वहां केवल कुछ सामान्य राय और प्रयोगों के आधार पर कुछ भी नहीं।)
मुझे यह उल्लेख करना होगा कि मूल रूप से मैं स्ट्रीमिंग डेटा के साथ काम कर रहा हूं, हालांकि अब मैं NAB डेटासेट का उपयोग कर रहा हूं जिसमें 20k डेटा बिंदुओं के अधिकतम आकार के साथ 50 डेटासेट शामिल हैं।