मैं यह समझने की कोशिश कर रहा हूं कि कैरस (या टेन्सरफ्लो) का उपयोग करके एक बहुआयामी और बहुभिन्नरूपी श्रृंखला के पूर्वानुमान बनाने के लिए डेटा का प्रतिनिधित्व और आकार कैसे करें, लेकिन डेटा को कैसे प्रस्तुत किया जाए, इसके बारे में कई ब्लॉग पोस्ट / ट्यूटोरियल / प्रलेखन पढ़ने के बाद भी मैं बहुत स्पष्ट नहीं हूं। सही आकार (ज्यादातर उदाहरण थोड़ा कम का है
मेरा डेटासेट:
- कई शहर
- जिसके लिए मेरे पास तापमान, कार यातायात, आर्द्रता के बारे में जानकारी है
- पिछले 2 वर्षों के लिए (प्रत्येक दिन के लिए एक रिकॉर्ड)
मैं क्या करना चाहता हूं: मैं प्रत्येक शहर के लिए पूर्वानुमान करना चाहता हूं कि तापमान के संभावित रूप से अंतराल संस्करण, कार ट्रैफ़िक और आर्द्रता का उपयोग करके मैं अगले वर्ष की उम्मीद कर सकता हूं (बेशक इसमें कई और विशेषताएं होंगी लेकिन यह सिर्फ एक है उदाहरण के लिए सोचा)।
मैं किस बारे में भ्रमित हूं: यदि मेरे पास 2 शहर हैं, जिसके लिए मैंने 365 दिनों के लिए 3 सुविधाएँ दर्ज की हैं। मुझे अपने इनपुट को कैसे आकार देना चाहिए ताकि मॉडल इन दो शहरों के लिए 365 दिनों के लिए पूर्वानुमान का उत्पादन कर सके (यानी 365 दिनों के लिए तापमान की 2 श्रृंखला)?
अंत में (?, 365, 3)
365 दिनों और 3 सुविधाओं के लिए टेंसर का आकार होगा । लेकिन मुझे यकीन नहीं है कि पहले आयाम में क्या होगा और, सबसे महत्वपूर्ण बात, मुझे आश्चर्य होगा कि अगर यह शहरों की संख्या के लिए होना था। लेकिन एक ही समय में, मुझे नहीं पता कि मॉडल में कैसे निर्दिष्ट किया जाए कि उसे आयामों को ठीक से समझना है।
कोई भी संकेत सहायक होगा। मैं बाकी की समस्या से बहुत परिचित हूँ (यानी आप कैसे केर में नेटवर्क बनाते हैं आदि) जब से मैंने यह अन्य न्यूरल नेटवर्क के लिए किया है, लेकिन विशेष रूप से वांछित इनपुट के लिए अनुक्रम को एन्कोड करने के लिए कितना अच्छा है।)
ओह और यह भी , मुझे लगता है कि मैं स्वतंत्र रूप से प्रत्येक शहर के लिए प्रशिक्षित और भविष्यवाणी कर सकता हूं, लेकिन मुझे यकीन है कि हर कोई सहमत होगा कि शायद ऐसी चीजें सीखी जाएं जो किसी भी शहर के लिए विशेष नहीं हैं, लेकिन यह केवल तभी देखा जा सकता है जब उनमें से कई पर विचार किया जाए, इसलिए मुझे लगता है कि मॉडल में इसे एनकोड करना महत्वपूर्ण है।