एक तंत्रिका नेटवर्क के लिए एक घटना की तारीख और समय को कैसे सांकेतिक शब्दों में बदलना है?
मेरे पास निरंतर समय श्रृंखला नहीं है, लेकिन तारीख और समय के साथ कुछ घटनाएं हैं, और मैं किसी तरह की रुचि का विश्लेषण करता हूं। यह रुचि सुबह और शाम के बीच भिन्न होती है, और सप्ताह के दिनों में और गर्मियों और सर्दियों के बीच और क्रिसमस और ईस्टर से पहले और इसी तरह अलग होती है। और घटनाओं का समय के साथ एक मजबूत गैर-समान वितरण होता है (दिन में रात की तुलना में अधिक, सप्ताह के दौरान कुछ प्रकार अधिक, सप्ताहांत में कुछ अधिक)।
मैंने इसे वर्ष में सप्ताह की संख्या के रूप में एन्कोडिंग करने की कोशिश की, सप्ताह के दिन 1-7 और दिन के घंटे के रूप में। लेकिन एक विरल ऑटोकेनोडर के साथ खेलने से मुझे यह आभास हुआ कि मेरे डेटा का तंत्रिका नेटवर्क से कोई मतलब नहीं है, यह एक बड़ी छिपी हुई परत के साथ भी इनपुट के पास कुछ भी पुन: उत्पन्न नहीं कर सकता है। न तो क्रमबद्ध 0-1 के रूप में और न ही सामान्यीकृत मूल्यों के रूप में।
लेकिन एक तंत्रिका नेटवर्क के लिए समय के एन्कोडिंग के लिए खोज करना ज्यादातर समय श्रृंखला के बारे में जानकारी देता है, इसलिए वन द्वारा आंखों पर पट्टी बांधकर, लेकिन पेड़ की तलाश कर रहा है।
बेशक मैं डेटा को देख सकता था और मोटे तौर पर इसे कम या ज्यादा निरंकुश रूप से वर्गीकृत कर सकता था। लेकिन डीप लर्निंग की अवधारणा सभी हाथ से तैयार की गई मैनुअल सुविधा निष्कर्षण को दूर करने के लिए लगती है। और वर्गीकरण स्वाभाविक रूप से निरंतर इनपुट चर में बड़े छलांग लगाएगा।
मेरे मस्तिष्क में मेरी "प्राकृतिक एन्कोडिंग" कुछ श्रेणियों जैसे "रात", "सुबह", "कार्यदिवस" इत्यादि की फ़ज़ी सदस्यता की तरह है।
पूरी बात को और दिलचस्प बनाने के लिए, आश्रित चर में उन तारीखों / समय के डेटा शामिल होते हैं, लेकिन यह एक अलग सवाल है।
संपादित करें: किसी तरह चक्रीय प्रकार के डेटा से संबंधित कुछ हालिया प्रश्न हैं, जैसे
इस दिन के डेटा सेट के साथ कौन से सांख्यिकीय परीक्षण उचित हैं?