मुझे एक समय श्रृंखला सेटिंग में मॉडल चयन में दिलचस्पी है। संक्षिप्तता के लिए, मान लीजिए कि मैं अलग-अलग लैग ऑर्डर वाले ARMA मॉडल के पूल से एक ARMA मॉडल का चयन करना चाहता हूं। अंतिम आशय पूर्वानुमान है ।
द्वारा मॉडल चयन किया जा सकता है
- परिणाम का सत्यापन करना,
- सूचना मानदंड (एआईसी, बीआईसी) का उपयोग,
अन्य तरीकों के बीच।
Rob J. Hyndman समय श्रृंखला के लिए क्रॉस सत्यापन करने का एक तरीका प्रदान करता है । अपेक्षाकृत छोटे नमूनों के लिए, क्रॉस सत्यापन में उपयोग किए गए नमूना आकार मूल नमूना आकार की तुलना में गुणात्मक रूप से भिन्न हो सकते हैं । उदाहरण के लिए, यदि मूल नमूना का आकार 200 अवलोकनों का है, तो कोई पहले 101 अवलोकनों को ले कर क्रॉस वेलिडेशन शुरू करने के बारे में सोच सकता है और विंडो को 102, 103, ..., 200 अवलोकनों में बढ़ाकर 100 क्रॉस-वैरिफिकेशन परिणाम प्राप्त कर सकता है। स्पष्ट रूप से, एक मॉडल जो 200 प्रेक्षण के लिए यथोचित रूप से पारंगत है, 100 टिप्पणियों के लिए बहुत बड़ा हो सकता है और इस प्रकार इसकी सत्यापन त्रुटि बड़ी होगी। इस प्रकार क्रॉस सत्यापन व्यवस्थित रूप से बहुत-पार्सिमोनस मॉडल के पक्ष में होने की संभावना है। नमूना आकारों में बेमेल के कारण यह एक अवांछनीय प्रभाव है ।
क्रॉस सत्यापन का एक विकल्प मॉडल चयन के लिए सूचना मानदंड का उपयोग कर रहा है। चूंकि मुझे पूर्वानुमान के बारे में परवाह है, इसलिए मैं एआईसी का उपयोग करूंगा। भले ही AIC समान रूप से आउट-कम करने के लिए समान रूप से समतुल्य है, लेकिन समय श्रृंखला के मॉडल के लिए एक-चरणीय पूर्वानुमान MSE ( Rob J. Hyndman द्वारा इस पोस्ट के अनुसार ), मुझे संदेह है कि यह नमूना के बाद से यहां प्रासंगिक है। आकार जो मुझे परवाह है कि बड़े नहीं हैं ...
प्रश्न: क्या मुझे छोटे / मध्यम नमूनों के लिए समय श्रृंखला पार सत्यापन पर एआईसी को चुनना चाहिए?