जवाबों:
मान लीजिए आप डेटा है , जहां ज ∈ { 1 , 2 , ... } , और अपने लक्ष्य को एक मॉडल बनाने के लिए है (जैसे कि, च ( एक्स टी - ज ) ) भविष्यवाणी करने के लिए Y t दिया गया x t - h । समवर्ती के लिए, मान लें कि डेटा दैनिक है और टी आज से मेल खाती है।
इन-सैंपल विश्लेषण का अर्थ है कि और टी सहित सभी उपलब्ध आंकड़ों का उपयोग करके मॉडल का अनुमान लगाना , और फिर मॉडल के फिट किए गए मूल्यों की वास्तविक वास्तविकताओं से तुलना करना। हालांकि, इस प्रक्रिया को मॉडल की पूर्वानुमान क्षमता की एक अत्यधिक आशावादी तस्वीर खींचने के लिए जाना जाता है, क्योंकि आम फिटिंग एल्गोरिदम (जैसे चुकता त्रुटि या संभावना मानदंड का उपयोग करते हुए) बड़ी भविष्यवाणी त्रुटियों से बचने के लिए दर्द उठाते हैं, और इस प्रकार ओवरफिटिंग के लिए अतिसंवेदनशील होते हैं - गलती से शोर डेटा में संकेत के लिए।
ध्यान दें कि छद्म-आउट-ऑफ-सैंपल विश्लेषण एक मॉडल के आउट-ऑफ-सैंपल प्रदर्शन का अनुमान लगाने का एकमात्र तरीका नहीं है। विकल्प में क्रॉस-मान्यता और सूचना मानदंड शामिल हैं।
इन सभी मुद्दों की एक बहुत अच्छी चर्चा अध्याय 7 के अध्याय में दी गई है
http://www.stanford.edu/~hastie/local.ftp/Springer/OLD/ESLII_print4.pdf