तंत्रिका नेटवर्क में इनपुट के रूप में दिनांक को कैसे एनकोड करना है?


12

मैं एक समय श्रृंखला की भविष्यवाणी करने के लिए तंत्रिका नेटवर्क का उपयोग कर रहा हूं। अब मैं जिस प्रश्न का सामना कर रहा हूं, वह यह है कि मैं दिनांक / समय / क्रम सं। प्रत्येक इनपुट तंत्रिका नेटवर्क के लिए एक इनपुट के रूप में सेट?

क्या मुझे यहाँ बताए अनुसार 1 सी एन्कोडिंग (एन्कोडिंग श्रेणियों के लिए प्रयुक्त) का उपयोग करना चाहिए ?

या क्या मुझे यह समय (1-1-1970 के बाद से मिलीसेकंड में) खिलाना चाहिए?

या इसे अनावश्यक रूप से समय खिला रहा है जब तक कि मैं इसे बाकी डेटा कालानुक्रमिक रूप से फ़ीड नहीं करता?


मुझे यकीन नहीं है कि यदि आप एक समय श्रृंखला की भविष्यवाणी करने के लिए तंत्रिका नेटवर्क का उपयोग कर रहे हैं, तो आप इसे अनावश्यक खिलाने के बारे में सोचते हैं ।
स्काउहू

दिनांक / समय को एन्कोड करने के कई तरीके हैं। यह समय श्रृंखला की प्रकृति को जानने में मदद करेगा। यह या तो बाहर शासन करने के लिए या शासन करने के लिए कोई प्राथमिकता नहीं है।
vzn

@vzn मैं सामान्य रूप से एक वित्तीय समय श्रृंखला की भविष्यवाणी करने की कोशिश कर रहा हूं। अगर वह मददगार है।
शयन आरसी

जवाबों:


17

तंत्रिका नेटवर्क जादू नहीं हैं। यदि आप उनके साथ वैसा ही व्यवहार करते हैं जैसे वे हैं और बिना सोचे समझे उन पर डेटा फेंक देते हैं तो आपके पास बहुत बुरा समय आने वाला है।

आपको खुद को रोकने और पूछने की आवश्यकता है "क्या 1970 के बाद से मिलीसेकंड वास्तव में उस घटना का अनुमान लगाने वाला है जिसकी मुझे दिलचस्पी है?" आपको तुरंत जो जवाब देना चाहिए, वह नहीं है। क्यों? प्रत्येक उदाहरण के लिए आप वास्तव में परवाह करते हैं (भविष्य में होने वाली घटनाएं, पहले से ही हुआ अतीत) समय चर एक मूल्य पर ले जाएगा जो आपके प्रशिक्षण डेटा में समय चर किसी भी मूल्य से अधिक है। इस तरह के एक चर मदद करने के लिए बहुत संभावना नहीं है। इससे भी बदतर अगर आप सावधान नहीं हैं, तो ओवरफिटिंग (शक्तिशाली गैर-रेखीय मॉडल जैसे तंत्रिका नेटवर्क के लिए एक गंभीर समस्या) होने की संभावना है।

अब जो अर्थ हो सकता है वह वर्ष या महीने के सप्ताह की तरह एक चर है जो आपको मौसमी या वार्षिक प्रभाव मॉडल बनाने में मदद कर सकता है। मैंने कृषि रोग की भविष्यवाणी में कुछ काम किया है जहाँ जूलियन दिन एक बहुत ही महत्वपूर्ण चर रहा है। इस अनुभव के आधार पर, मुझे संदेह है कि आप इस प्रकार के चर को क्रमबद्ध चर के रूप में क्रमबद्ध करने के बजाय एन्कोडिंग से बेहतर होंगे, आपका अनुभव बहुत हो सकता है। ध्यान दें कि वर्ष का महीना या सप्ताह ऐसी दोहराई जाने वाली घटनाएं हैं जिन्हें आपके प्रशिक्षण डेटा में कई बार देखने की संभावना होती है और यह स्पष्ट करना संभव है कि इस तरह का एक चर वित्तीय परिणाम को क्यों प्रभावित कर सकता है। 1970 के बाद मिलीसेकंड के साथ इसका विरोध करें जो सिर्फ एक नीरस रूप से बढ़ते मूल्य है।

अंत में, आपके कथन से "या जब तक मैं इसे बाकी डेटा को कालानुक्रमिक रूप से खिलाऊं, तब तक यह अनावश्यक समय खिला रहा है?" ऐसा लगता है कि आपके पास तंत्रिका नेटवर्क कैसे काम करते हैं, इसकी बहुत अच्छी समझ नहीं हो सकती है। एक मानक फीडफॉर्वर्ड न्यूरल नेटवर्क के साथ आप जिस ऑर्डर को नेटवर्क को फीड करते हैं, वह आपके पूर्वानुमानों पर कोई प्रभाव नहीं डालने वाला है। यदि आप स्टोकेस्टिक या मिनी-बैच ग्रेडिएंट वंश का उपयोग कर रहे हैं, तो ऑर्डर प्रशिक्षण को प्रभावित कर सकता है, लेकिन यह केवल पुनरावृत्ति (बैच के विपरीत) प्रशिक्षण पद्धति की एक कलाकृति है। यदि आप एक तंत्रिका नेटवर्क के साथ अस्थायी निर्भरता को मॉडल करना चाहते हैं, तो आपको स्लाइडिंग विंडो या आवर्तक तंत्रिका नेटवर्क जैसी किसी चीज़ का उपयोग करने की आवश्यकता होगी।


2

आप टिप्पणी करते हैं कि आप वित्तीय समय श्रृंखला भविष्यवाणी पर काम कर रहे हैं। इनपुट में समय शामिल करना या नहीं करना कुछ हद तक डोमेन-निर्भर है। यदि आप किसी प्रकार के "चक्रीय" समय घटक को अपने डेटा में रखते हैं तो यह सामान्य रूप से प्रासंगिक है। उदाहरण के लिए, हो सकता है कि आपके डेटा में कुछ साप्ताहिक प्रभाव हो, यदि यह हफ्तों से अधिक चल रहा हो, या किसी दिन में फैला हो तो कुछ इंट्रा डे प्रभाव। फिर यदि आपके पास कई चक्र हैं, तो एक इनपुट शामिल करें जो चक्र में स्थिति को दर्शाता है, जैसे कि या या कहें ।[-1,1][0,1]रोंमैंn(टी)

यदि आप पाते हैं कि एक सुसंगत प्रवृत्ति जैसे कि या तो समय के साथ बढ़ती या घटती है तो इसकी अधिक उपयुक्तता को इनपुट से खिलाने से पहले इनपुट के माध्यम से जिसे "डिटरेंडिंग" कहा जाता है। दूसरे शब्दों में, आप उस अंतर्निहित प्रवृत्ति के लिए सूत्र हैं और प्रवृत्ति प्लस भविष्यवाणी करते हैं लेकिन NN केवल अंतर पर केंद्रित , प्रवृत्ति ।(टी)(टी)टी=टी+जीटीजीटीटी

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.