मैं मीन स्क्वेरेड प्रीडिक्शन एरर को कम करके एक टाइम-सीरीज़ में सेट किए गए टाइम-सीरीज़ डेटा के पूर्वानुमानित और बैककास्टेड (अर्थात पिछले मूल्यों की भविष्यवाणी) को संयोजित करना चाहूंगा।
कहो कि मेरे पास 2001-2010 से वर्ष 2007 के अंतराल के साथ समय श्रृंखला है। मैं 2001-2007 डेटा (लाल रेखा - इसे ) और 2008-2009 डेटा (हल्का नीला) का उपयोग करके बैककास्ट का उपयोग करके 2007 का पूर्वानुमान लगाने में सक्षम रहा हूं । लाइन - इसे कहते हैं )।Y ब
मैं प्रत्येक महीने के लिए और के डेटा बिंदुओं को एक बाधित डेटा बिंदु Y_i में संयोजित करना चाहूंगा। आदर्श रूप से मैं वेट इस तरह प्राप्त करना चाहूंगा कि यह Y_i के मीन स्क्वेर्ड प्रेडिक्शन एरर (MSPE) को कम से कम । यदि यह संभव नहीं है, तो मैं दो समय-श्रृंखला के डेटा बिंदुओं के बीच औसत कैसे पाऊंगा?Y ब W य Y म
एक त्वरित उदाहरण के रूप में:
tt_f <- ts(1:12, start = 2007, freq = 12)
tt_b <- ts(10:21, start=2007, freq=12)
tt_f
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
2007 1 2 3 4 5 6 7 8 9 10 11 12
tt_b
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
2007 10 11 12 13 14 15 16 17 18 19 20 21
मैं प्राप्त करना चाहूंगा (केवल औसत दिखा रहा हूं ... आदर्श रूप से न्यूनतम MSPE)
tt_i
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
2007 5.5 6.5 7.5 8.5 9.5 10.5 11.5 12.5 13.5 14.5 15.5 16.5
predict
पूर्वानुमान पैकेज के कार्य का उपयोग कर रहा है । हालांकि, मुझे लगता है कि मैं HoltWinters पूर्वानुमान मॉडल का उपयोग करने जा रहा हूं भविष्यवाणी करने और बैककास्ट करने के लिए। मेरे पास थोड़ा <50 काउंट के साथ समय श्रृंखला है, और पॉइसन प्रतिगमन पूर्वानुमान की कोशिश की - लेकिन किसी कारण से बहुत कमजोर भविष्यवाणियों के लिए।
NA
मूल्यों के बिना सिर्फ मायने रखता है या कुछ अतिरिक्त संबंधित समय श्रृंखला है? ऐसा लगता है कि लर्निंग पीरियड बनाना MSPE को भ्रामक हो सकता है क्योंकि सब-पीरियड्स 'लीनियर टेंडेंसीज़ द्वारा अच्छी तरह से बताए गए हैं, लेकिन मिस्ड पीरियड में कहीं न कहीं एक गिरावट आती है और यह वास्तव में कोई भी बिंदु हो सकता है। यह भी ध्यान दें कि चूंकि पूर्वानुमान प्रवृत्ति में टकरा रहे हैं, इसलिए उनका औसत एक प्रतीत होने के बजाय दो संरचनात्मक विराम पेश करेगा।