क्यों समय श्रृंखला "बहुत गरीब" की यह भविष्यवाणी है?


15

मैं यह जानने की कोशिश कर रहा हूं कि तंत्रिका नेटवर्क का उपयोग कैसे किया जाए। मैं इस ट्यूटोरियल को पढ़ रहा था ।

T + 1 पर मान की भविष्यवाणी करने के लिए पर मान का उपयोग करके एक टाइम सीरीज़ पर एक न्यूरल नेटवर्क को फिट करने के बाद लेखक निम्नलिखित प्लॉट प्राप्त करता है, जहाँ ब्लू लाइन टाइम सीरीज़ है, ग्रीन ट्रेन डेटा पर भविष्यवाणी है, लाल है। परीक्षण डेटा पर भविष्यवाणी (उन्होंने एक परीक्षण-ट्रेन विभाजन का इस्तेमाल किया)टीटी+1p1

और यह कहता है "हम देख सकते हैं कि मॉडल ने प्रशिक्षण और परीक्षण डेटासेट दोनों को फिट करने का बहुत खराब काम किया। यह मूल रूप से आउटपुट के समान इनपुट मूल्य की भविष्यवाणी करता है।"

टीटी-1टी-2टी+1

p2

और कहता है "ग्राफ को देखते हुए, हम भविष्यवाणियों में अधिक संरचना देख सकते हैं।"

मेरा प्रश्न

पहला "गरीब" क्यों है? यह मेरे लिए लगभग सही लग रहा है, यह पूरी तरह से हर एक परिवर्तन की भविष्यवाणी करता है!

और इसी तरह, दूसरा बेहतर क्यों है? "संरचना" कहाँ है? मेरे लिए यह पहले वाले की तुलना में बहुत गरीब है।

सामान्य तौर पर, समय श्रृंखला पर एक भविष्यवाणी कब अच्छी होती है और कब खराब होती है?


3
एक सामान्य टिप्पणी के रूप में, अधिकांश एमएल विधियां क्रॉस-अनुभागीय विश्लेषण के लिए हैं, और समय श्रृंखला के लिए समायोजन की आवश्यकता है। मुख्य कारण है, जबकि एमएल में अक्सर डेटा सबसे लोकप्रिय तरीकों में स्वतंत्र माना जाता है डेटा में ऑटो सहसंबंध है
Aksakal

11
यह हर बदलाव की भविष्यवाणी करने का एक बड़ा काम करता है ... सही होने के बाद!
हॉब्स

@ ओह, मैं t + 1 की भविष्यवाणी करने के लिए t, t-1, t-2 आदि का उपयोग करने की कोशिश नहीं कर रहा हूं। मैं सोच रहा था कि क्या आप जानते हैं कि अतीत में कितने शब्दों का उपयोग करना सबसे अच्छा है। यदि हम बहुत अधिक उपयोग करते हैं, तो क्या हम ओवरफिट कर रहे हैं?
Euler_Salter

यह अवशिष्टों को प्लॉट करने के लिए अधिक रोशन होता।
रेता काटो

जवाबों:


23

यह एक ऑप्टिकल भ्रम की तरह है: आंख ग्राफ को देखता है, और देखता है कि लाल और नीले ग्राफ प्रत्येक के ठीक बगल में हैं। समस्या यह है कि वे क्षैतिज रूप से एक-दूसरे के ठीक बगल में हैं , लेकिन ऊर्ध्वाधर क्या मायने रखता हैदूरी। आंख सबसे आसानी से कार्टेशियन ग्राफ के द्वि-आयामी अंतरिक्ष में घटता के बीच की दूरी को देखती है, लेकिन क्या मायने रखती है एक विशेष टी मूल्य के भीतर एक-आयामी दूरी। उदाहरण के लिए, मान लें कि हमारे पास A1 = (10,100), A2 = (10.1, 90), A3 = (9.8,85), P1 = (10.1,100.1) और P2 = (9.8, 88) अंक थे। आंख स्वाभाविक रूप से पी 1 से ए 1 की तुलना करने जा रही है, क्योंकि यह निकटतम बिंदु है, जबकि ए 2 की तुलना ए 2 से होने जा रही है। चूंकि पी 1 ए 1 के करीब है, पी 2 की तुलना में ए 3 है, पी 1 एक बेहतर भविष्यवाणी की तरह दिखने वाला है। लेकिन जब आप पी 1 से ए 1 की तुलना करते हैं, तो आप देख रहे हैं कि ए 1 कितनी अच्छी तरह से केवल वही दोहरा सकता है जो उसने पहले देखा था; A1 के संबंध में, P1 कोई भविष्यवाणी नहीं है। उचित तुलना P1 v। A2 और P2 v। A3 के बीच है, और इस तुलना में P2 P1 से बेहतर है। यह स्पष्ट होता अगर, t_ के विरुद्ध y_actual और y_pred की साजिश रचने के अलावा, t के विरुद्ध (y_pred-y_actual) के ग्राफ़ होते थे।


2
यह बेहतर उत्तर है क्योंकि दूसरे ने यह भी उल्लेख नहीं किया है कि "अच्छा दिखने वाला" पूर्वानुमान वास्तव में खराब क्यों है, जबकि आप इसके लिए बहुत अच्छा काम करते हैं!
रिचर्ड हार्डी

17

पहला "गरीब" क्यों है? यह मेरे लिए लगभग सही लग रहा है, यह पूरी तरह से हर एक परिवर्तन की भविष्यवाणी करता है!

यह एक तथाकथित "स्थानांतरित" पूर्वानुमान है। यदि आप चार्ट 1 पर अधिक बारीकी से देखते हैं, तो आप देखते हैं कि भविष्यवाणी की शक्ति केवल लगभग अंतिम देखे गए मूल्य की नकल करने में है। इसका मतलब है कि मॉडल ने कुछ भी बेहतर नहीं सीखा, और यह समय श्रृंखला को एक यादृच्छिक चलने के रूप में मानता है। मुझे लगता है कि समस्या इस तथ्य में हो सकती है कि आप कच्चे नेटवर्क का उपयोग करते हैं जो आप तंत्रिका नेटवर्क को खिलाते हैं। ये डेटा गैर-स्थिर हैं जो सभी परेशानी का कारण बनते हैं।


8
पूर्वानुमान में इसे "भोला" पूर्वानुमान कहा जाता है, अर्थात पूर्वानुमान के रूप में देखे गए अंतिम का उपयोग करें
अक्षल

धन्यवाद! @ अक्षल क्या आप जानते हैं कि भविष्यवाणी के लिए कितने पिछले मूल्यों का उपयोग किया जाना चाहिए?
Euler_Salter

स्टेशनरी पर ध्यान दें। इस समय श्रृंखला के लिए स्थिर अंतराल के एक जोड़े को काफी अच्छा होना चाहिए। 100 से अधिक नॉनसेफ्टरी लैग्स।
एलेक्सी बर्नकोव

समय श्रृंखला में ACF और PACF के माध्यम से अंतराल संरचना पर एक अच्छा अनुमान प्राप्त करने का एक तरीका है, इस मंच को देखते हुए, यह कैसे किया जाता है पर कई पोस्ट थे
अक्कल

@AlexeyBurnakov तो इसका मतलब है कि मुझे इसे स्थिर करने के लिए बदलना चाहिए?
यूलर_सल्टर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.