मुझे नहीं पता कि यह एक सामान्य / सर्वोत्तम अभ्यास है, लेकिन यह इस मामले को देखने का एक और बिंदु है।
यदि आपके पास है, तो हम कहते हैं, एक तारीख, आप प्रत्येक क्षेत्र को "निरंतर चर" के बजाय "श्रेणी चर" के रूप में मान सकते हैं। दिन का सेट {1, 2 ..., 31} में एक मान होगा, महीने का मूल्य {1, ..., 12} में होगा और वर्ष के लिए, आप एक न्यूनतम और अधिकतम मूल्य चुनते हैं। और एक सेट का निर्माण।
फिर, दिनों, महीनों और वर्षों के विशिष्ट संख्यात्मक मान डेटा में रुझानों को खोजने के लिए उपयोगी नहीं हो सकते हैं, संख्यात्मक मानों को सांकेतिक शब्दों में बदलना करने के लिए एक द्विआधारी प्रतिनिधित्व का उपयोग करें, प्रत्येक बिट एक विशेषता है। उदाहरण के लिए, 5 महीने 0 0 0 0 1 0 0 0 0 0 0 0
(11 0 की 1 ए 5 वीं स्थिति में, प्रत्येक बिट एक विशेषता है) होगा।
इसलिए, उदाहरण के लिए, "वर्ष के सेट" में 10 साल, एक तारीख को 43 विशेषताओं (= 31 + 12 + 10) के वेक्टर में बदल दिया जाएगा। "विरल वैक्टर" का उपयोग करते हुए, सुविधाओं की मात्रा में समस्या नहीं होनी चाहिए।
कुछ ऐसा ही समय डेटा, सप्ताह के दिन, महीने के दिन के लिए किया जा सकता है ...
यह सब उस सवाल पर निर्भर करता है जिसे आप चाहते हैं कि आपका मशीन लर्निंग मॉडल जवाब दे।