मेरे पास एक बेकरी से ऐतिहासिक बिक्री डेटा है (दैनिक, 3 साल से अधिक)। अब मैं भविष्य की बिक्री की भविष्यवाणी करने के लिए एक मॉडल बनाना चाहता हूं (कार्यदिवस, मौसम चर, आदि जैसी सुविधाओं का उपयोग करके)।
मुझे मॉडल के फिटिंग और मूल्यांकन के लिए डेटासेट कैसे विभाजित करना चाहिए?
- क्या इसे कालानुक्रमिक ट्रेन / सत्यापन / परीक्षण विभाजन की आवश्यकता है?
- फिर क्या मैं ट्रेन और सत्यापन सेट के साथ हाइपरपैरेट ट्यूनिंग करूंगा?
- क्या (नेस्टेड) सत्यापन एक टाइम-सीरीज़ समस्या के लिए एक खराब रणनीति को पार करता है?
EDIT
यहां कुछ लिंक दिए गए हैं, जो मुझे @ ene100 द्वारा सुझाए गए URL का अनुसरण करने के बाद आए:
- रोब Hyndman वर्णन "रोलिंग पूर्वानुमान मूल" सिद्धांत में और व्यवहार में (आर कोड के साथ)
- रोलिंग फोरकास्टिंग मूल के अन्य शब्द "वॉक फॉरवर्ड ऑप्टिमाइज़ेशन" ( यहाँ या) हैं यहां ), "रोलिंग क्षितिज" या "चलती मूल"
- ऐसा लगता है कि इन तकनीकों को निकट भविष्य में शिक्षा-विज्ञान में एकीकृत नहीं किया जाएगा, क्योंकि "इन तकनीकों की मांग और अर्थ का पता अस्पष्ट है" ( यहां कहा गया है )।
और यह समय-श्रृंखला क्रॉस सत्यापन के लिए एक और सुझाव है।