मैं समय श्रृंखला भविष्यवाणी पर काम कर रहा हूं। मेरे पास दो डेटा सेट और । मेरे पास तीन भविष्यवाणी मॉडल हैं: । उन सभी मॉडलों को डेटा सेट में नमूनों का उपयोग करके प्रशिक्षित कियाजाता है, और डेटा सेट में नमूनों का उपयोग करके उनके प्रदर्शन को मापा जाता है। मान लें कि प्रदर्शन मीट्रिक MSE (या कुछ और) है। उन मॉडलों जब डेटा सेट के लिए मापा के एमएसई हैं और । मैं कैसे परीक्षण कर सकता हूं कि एक मॉडल का दूसरे पर सुधार सांख्यिकीय रूप से महत्वपूर्ण है।
उदाहरण के लिए, मान लें कि , , , और डेटा सेट में नमूना की कुल संख्या है, जिसके आधार पर उन MSE की गणना 2000 है। मैं कैसे परीक्षण कर सकता हूं कि , , और काफी अलग हैं। मैं बहुत सराहना करूंगा अगर कोई इस समस्या में मेरी मदद कर सकता है।