तंत्रिका नेटवर्क के लिए दिनांक / समय (चक्रीय डेटा) एन्कोडिंग


12

एक तंत्रिका नेटवर्क के लिए एक घटना की तारीख और समय को कैसे सांकेतिक शब्दों में बदलना है?

मेरे पास निरंतर समय श्रृंखला नहीं है, लेकिन तारीख और समय के साथ कुछ घटनाएं हैं, और मैं किसी तरह की रुचि का विश्लेषण करता हूं। यह रुचि सुबह और शाम के बीच भिन्न होती है, और सप्ताह के दिनों में और गर्मियों और सर्दियों के बीच और क्रिसमस और ईस्टर से पहले और इसी तरह अलग होती है। और घटनाओं का समय के साथ एक मजबूत गैर-समान वितरण होता है (दिन में रात की तुलना में अधिक, सप्ताह के दौरान कुछ प्रकार अधिक, सप्ताहांत में कुछ अधिक)।

मैंने इसे वर्ष में सप्ताह की संख्या के रूप में एन्कोडिंग करने की कोशिश की, सप्ताह के दिन 1-7 और दिन के घंटे के रूप में। लेकिन एक विरल ऑटोकेनोडर के साथ खेलने से मुझे यह आभास हुआ कि मेरे डेटा का तंत्रिका नेटवर्क से कोई मतलब नहीं है, यह एक बड़ी छिपी हुई परत के साथ भी इनपुट के पास कुछ भी पुन: उत्पन्न नहीं कर सकता है। न तो क्रमबद्ध 0-1 के रूप में और न ही सामान्यीकृत मूल्यों के रूप में।

लेकिन एक तंत्रिका नेटवर्क के लिए समय के एन्कोडिंग के लिए खोज करना ज्यादातर समय श्रृंखला के बारे में जानकारी देता है, इसलिए वन द्वारा आंखों पर पट्टी बांधकर, लेकिन पेड़ की तलाश कर रहा है।

बेशक मैं डेटा को देख सकता था और मोटे तौर पर इसे कम या ज्यादा निरंकुश रूप से वर्गीकृत कर सकता था। लेकिन डीप लर्निंग की अवधारणा सभी हाथ से तैयार की गई मैनुअल सुविधा निष्कर्षण को दूर करने के लिए लगती है। और वर्गीकरण स्वाभाविक रूप से निरंतर इनपुट चर में बड़े छलांग लगाएगा।

मेरे मस्तिष्क में मेरी "प्राकृतिक एन्कोडिंग" कुछ श्रेणियों जैसे "रात", "सुबह", "कार्यदिवस" ​​इत्यादि की फ़ज़ी सदस्यता की तरह है।

पूरी बात को और दिलचस्प बनाने के लिए, आश्रित चर में उन तारीखों / समय के डेटा शामिल होते हैं, लेकिन यह एक अलग सवाल है।

संपादित करें: किसी तरह चक्रीय प्रकार के डेटा से संबंधित कुछ हालिया प्रश्न हैं, जैसे

इस दिन के डेटा सेट के साथ कौन से सांख्यिकीय परीक्षण उचित हैं?

जवाबों:


7

मैं एक ऐसी ही समस्या के जवाब की तलाश में था और इस धागे पर ठोकर खाई। इस ब्लॉग पोस्ट में sinusoidal एन्कोडिंग विचार का पता लगाया गया है:

सांकेतिक निरंतर सुविधाओं को एन्कोडिंग - 24 घंटे का समय

इयान के जवाब ने मेरी आवश्यकताओं को पूरी तरह से संबोधित किया, इसलिए मैंने इसे भविष्य की स्मृति के लिए यहां पोस्ट करने के बारे में सोचा।


मुझे आश्चर्य है कि इसका उपयोग कैसे किया जा सकता है stackoverflow.com/questions/59653862/… - विशेष रूप से जब समय सुविधाएँ हैं।
user4581

1

आप वर्ष के दिनों और दिनों के घंटों का प्रतिनिधित्व करने के लिए एक बड़े मैट्रिक्स के रूप में समय का निर्धारण कर सकते हैं, यानी 24 से 365, और फिर 8760 वेक्टर द्वारा 1 में इसे "अनियंत्रित" करें। समय इस वेक्टर के भीतर स्थिति के अनुरूप होगा और इस स्थिति में मूल्य उस समय का मूल्य है।


2
क्या तुमने कोशिश की और इस तरह एक कूटबन्धन के साथ सफल? मुझे आश्चर्य होगा कि एक न्यूरल नेट इस एन्कोडिंग में रविवार की सुबह की सटीक स्थिति को "सीखेगा"। लेकिन भोले को आश्चर्यचकित करना तंत्रिका जाल की ताकत में से एक है, इसलिए मैं इसके खिलाफ अपने स्कॉच को दांव पर नहीं लगाऊंगा। ;-)
flaschenpost

यह उपयोगी हो सकता है यदि आप विभिन्न वर्षों में एक ही घंटे द्वारा चक्रीय घटनाओं का पता लगाना चाहते थे, लेकिन मुझे लगता है कि सहसंबंध बहुत कमजोर होगा। मैं प्रत्येक सप्ताह एक ही घंटे, या हर दिन एक ही घंटे के बीच सहसंबंध की एक उच्च संभावना देख सकता हूं, अधिकांश समय श्रृंखला डेटा के लिए।
दीकिंगकोट्रूथ

1

मैं आपको पहले से ही मौजूद डेटा में मौजूद रिश्तों (या विश्वास) का उपयोग करके समय श्रृंखला से कई इनपुट फीचर बनाने का सुझाव दूंगा। उदाहरण के लिए, आप बताते हैं कि लक्ष्य उत्पादन अलग-अलग होगा:

सुबह और शाम के बीच, और सप्ताह के दिनों में और गर्मियों और सर्दियों के बीच अलग-अलग ...

तो क्यों न इन 'साइकिल' में से प्रत्येक का वर्णन करने वाली सुविधाओं का एक समूह बनाया जाए। यह सभी का वर्णन करने वाली एकल विशेषता के बजाय सूक्ष्म और स्थूल भिन्नता दोनों को छेड़ने में मदद कर सकता है।

उदाहरण के लिए...

1..241..16812,36,60...


हाँ, यह मेरा भी पहला विचार था। लेकिन समय की गोलाकार अवधारणा (23:59 के बाद 00:00 बजे) तब छिपी हुई है, और एक और बात जो मुझे परेशान करती है, वह है संपूर्ण संख्याओं के बीच की छलांग - 09:55 पर एक घटना 10:05 के समान है, लेकिन सुबह 06:10 06:55 से बहुत अलग है। मैं समय के खोज केंद्रों (प्रकाशिकी या पसंद?) की कल्पना कर सकता था और फिर उन केंद्रों से दूरी और माप दे सकता था। तो सुबह 04:30 रात सबसे गहरी है, जबकि 05:30 अधिक "सुबह" है, लेकिन पूरी तरह से शाम की तरह नहीं है।
flaschenpost

1
अच्छी तरह से उस मामले में आप साइनसॉइड या कोसाइन के रूप में एन्कोडिंग की कोशिश कर सकते हैं, या वास्तव में दोनों।
CatsLoveJazz
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.