समय श्रृंखला क्रॉस-मान्यता के साथ पूर्वानुमान त्रुटि की गणना करना


13

मेरे पास टाइम सीरीज़ के लिए एक पूर्वानुमान मॉडल है और मैं इसके आउट ऑफ सैंपल प्रिडिक्शन एरर की गणना करना चाहता हूं। फिलहाल मैं जिस रणनीति का पालन कर रहा हूं वह है रोब हंडमैन के ब्लॉग (पृष्ठ के निचले भाग के पास) पर सुझाव दिया गया है जो इस प्रकार है (एक समय श्रृंखला और आकार का प्रशिक्षण सेट )y1,,ynk

  1. डेटा को मॉडल फिट करें और let अगले अवलोकन के लिए पूर्वानुमान हो।yt,,yt+k1y^t+k
  2. पूर्वानुमान त्रुटि की गणना ।et=y^t+kyt+k
  3. लिए दोहराएंt=1,,nk
  4. माध्य वर्ग त्रुटि की गणनाMSE=1nkt=1nket2

मेरा सवाल यह है कि मुझे अपने अतिव्यापी प्रशिक्षण सेटों के कारण सहसंबंधों के बारे में कितना चिंतित होना है। विशेष रूप से, मान लीजिए कि मैं न केवल अगले मूल्य, बल्कि अगले मूल्यों का पूर्वानुमान करना चाहता हूं , ताकि मेरे पास भविष्यवाणियां और त्रुटियां , और मैं भविष्यवाणी त्रुटियों की एक अवधि-संरचना का निर्माण करना चाहता हूं।my^t+k,,y^t+k+m1et,1,,et,m

क्या मैं अभी भी प्रत्येक बार प्रशिक्षण सेट की खिड़की को 1 बार आगे बढ़ा सकता हूं, या क्या मुझे इसे द्वारा आगे बढ़ाना चाहिए ? इन प्रश्नों के उत्तर कैसे बदलते हैं यदि श्रृंखला में महत्वपूर्ण ऑटोक्रॉलेशन है जो मैं भविष्यवाणी कर रहा हूं (निश्चित रूप से यह एक लंबी-मेमोरी प्रक्रिया है, यानी ऑटोक्लेररेशन फ़ंक्शन घातांक के बजाय एक शक्ति कानून के रूप में तय होता है।)m

मैं या तो यहाँ एक स्पष्टीकरण की सराहना करता हूँ, या कहीं और लिंक करता हूँ जहाँ मैं MSE (या अन्य त्रुटि) के आसपास विश्वास अंतराल के बारे में सैद्धांतिक परिणाम पा सकता हूँ।

जवाबों:


11

ऐसा लगता है कि आप क्रॉस-सत्यापन के बजाय अधिकतम-एन्ट्रापी बूटस्ट्रैप का उपयोग करके त्रुटियों का अनुमान लगाने में अधिक रुचि रख सकते हैं । यह आपको कई डेटा के बूटस्ट्रैप उत्पन्न करने की अनुमति देगा, जिसे आप बाद में अपने पूर्वानुमान के लिए आत्मविश्वास अंतराल की गणना करने के लिए कई ट्रेन / परीक्षण सेटों में विभाजित कर सकते हैं।

रोब ह्यंडमैन ने अपने ब्लॉग पर टाइम सीरीज़ के क्रॉस-वैलिडेशन की कुछ और चर्चा की , जहाँ उन्होंने "रोलिंग" और फोरकास्टिंग के कई अलग-अलग तरीकों को लागू किया, लेकिन यह ज्यादातर कार्यान्वयन पर केंद्रित है। मेरे पास अपने ब्लॉग पर कुछ और कार्यान्वयन हैं । हो सकता है कि सरलतम दृष्टिकोण आपकी त्रुटि को सभी समय खिड़कियों पर औसत करने के लिए हो, और इसलिए त्रुटियों में उपेक्षा और संभावित सहसंबंध।

जहां तक ​​मैं बता सकता हूं, समय-श्रृंखला के आंकड़ों के लिए क्रॉस-वैलिडेशन की सैद्धांतिक स्थिति सामान्य क्रॉस-वैलिडेशन की सैद्धांतिक स्थिति से कुछ पीछे है। सहज रूप से, मुझे उम्मीद है कि त्रुटि बढ़ने के साथ क्षितिज बढ़ेगा, जो बताता है कि आपको विभिन्न पूर्वानुमान क्षितिज के पार सहसंबद्ध त्रुटियों की अपेक्षा करनी चाहिए। यह आपकी चिंता क्यों करता है?

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.