"इन-सैंपल" और "छद्म आउट-ऑफ-सैंपल" पूर्वानुमानों के बीच अंतर


12

क्या नमूना पूर्वानुमान और छद्म आउट-ऑफ-नमूना पूर्वानुमान के बीच एक स्पष्ट अंतर है । दोनों पूर्वानुमान मॉडल के मूल्यांकन और तुलना के संदर्भ में है।

जवाबों:


18

मान लीजिए आप डेटा है , जहां { 1 , 2 , ... } , और अपने लक्ष्य को एक मॉडल बनाने के लिए है (जैसे कि, ( एक्स टी - ) ) भविष्यवाणी करने के लिए Y t दिया गया x t - h । समवर्ती के लिए, मान लें कि डेटा दैनिक है और टी आज से मेल खाती है।{Yटी,एक्सटी-}टी=+1टी{1,2,...},f^(Xth)YtXthटी

इन-सैंपल विश्लेषण का अर्थ है कि और टी सहित सभी उपलब्ध आंकड़ों का उपयोग करके मॉडल का अनुमान लगाना , और फिर मॉडल के फिट किए गए मूल्यों की वास्तविक वास्तविकताओं से तुलना करना। हालांकि, इस प्रक्रिया को मॉडल की पूर्वानुमान क्षमता की एक अत्यधिक आशावादी तस्वीर खींचने के लिए जाना जाता है, क्योंकि आम फिटिंग एल्गोरिदम (जैसे चुकता त्रुटि या संभावना मानदंड का उपयोग करते हुए) बड़ी भविष्यवाणी त्रुटियों से बचने के लिए दर्द उठाते हैं, और इस प्रकार ओवरफिटिंग के लिए अतिसंवेदनशील होते हैं - गलती से शोर डेटा में संकेत के लिए।टी

Yटी+1टी+1Yटी+1-^(एक्सटी+1-),Yटी+2{टी+एल}एल=1एल

टी0<टीटी{टी}टी=टी0+1टी

ध्यान दें कि छद्म-आउट-ऑफ-सैंपल विश्लेषण एक मॉडल के आउट-ऑफ-सैंपल प्रदर्शन का अनुमान लगाने का एकमात्र तरीका नहीं है। विकल्प में क्रॉस-मान्यता और सूचना मानदंड शामिल हैं।

इन सभी मुद्दों की एक बहुत अच्छी चर्चा अध्याय 7 के अध्याय में दी गई है

http://www.stanford.edu/~hastie/local.ftp/Springer/OLD/ESLII_print4.pdf


3
पीडीएफ लिंक काम नहीं करता है, लेकिन लगता है टिब्शीरानी की मुफ्त ऑनलाइन पुस्तक "द एलीमेंट ऑफ स्टैटिस्टिकल लर्निंग: डेटा माइनिंग, इंट्रेंस एंड प्रेडिक्शन"
ओलेग
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.