आपके पास समय के अनुसार घटनाओं का एक क्रम है इसलिए इसे टाइम सीरीज़ कहने में संकोच न करें!
समय श्रृंखला में क्लस्टरिंग के 2 अलग-अलग अर्थ हैं:
- समय श्रृंखला का विभाजन यानी आप आंतरिक समानता के अनुसार अलग-अलग समय श्रृंखला में अलग-अलग समय श्रृंखला को विभाजित करना चाहते हैं।
- टाइम सीरीज़ क्लस्टरिंग यानी आपके पास कई टाइम सीरीज़ हैं और आप दोनों के बीच समानता के अनुसार अलग-अलग क्लस्टर ढूंढना चाहते हैं।
मुझे लगता है कि आप दूसरे का मतलब है और यहाँ मेरा सुझाव है:
आपके पास प्रति वाहन कई वाहन हैं और आपके पास कई वाहन हैं। इसलिए आपके पास कई मैट्रिसेस हैं (प्रत्येक वाहन एक मैट्रिक्स है) और प्रत्येक मैट्रिक्स में एन पंक्तियाँ (टिप्पणियों का एनआर) और टी कॉलम (समय बिंदु) शामिल हैं। एक सुझाव पीसीए अंतरिक्ष में मंदता और डेटा को कम करने के लिए प्रत्येक मैट्रिक्स पर पीसीए को लागू करना हो सकता है और देखें कि क्या मैट्रिक्स (वाहन) के भीतर विभिन्न टिप्पणियों के बीच सार्थक संबंध हैं । फिर आप सभी वाहनों के लिए एक-दूसरे पर एक अवलोकन कर सकते हैं और एक मैट्रिक्स बना सकते हैं और पीसीए को लागू कर सकते हैं ताकि विभिन्न वाहनों के बीच एक ही अवलोकन के संबंधों को देख सकें।
यदि आपके पास नकारात्मक मूल्य नहीं हैं, तो मैट्रिक्स फॉर्म डेटा के आयाम में कमी के लिए मैट्रिक्स फैक्टराइजेशन की जोरदार सिफारिश की जाती है।
एक अन्य सुझाव में सभी मैट्रिसेस को एक-दूसरे के ऊपर रखा जा सकता है और N x M x T टेंसर का निर्माण किया जा सकता है, जहाँ N वाहनों की संख्या है, M अवलोकनों की संख्या है और T समय क्रम है और विश्व स्तर पर देखने के लिए Tensor Decomposition लागू करें ।
टाइम सीरीज़ क्लस्टरिंग के लिए एक बहुत अच्छा दृष्टिकोण इस पेपर में दिखाया गया है जहां कार्यान्वयन सीधे आगे शांत है।
मुझे आशा है कि इससे मदद मिली!
शुभ लाभ :)
संपादित करें
जैसा कि आपने बताया कि टाइम सीरीज़ सेगमेंटेशन का मतलब है कि मैं इसे उत्तर में जोड़ता हूँ।
टाइम सीरीज़ सेगमेंटेशन एकमात्र क्लस्टरिंग समस्या है जिसका मूल्यांकन के लिए एक जमीनी सच्चाई है। दरअसल आप समय श्रृंखला के पीछे पैदा वितरण पर विचार करने और उसका विश्लेषण मैं दृढ़ता से अनुशंसा करते यह , यह , यह , यह , यह और इस जहां आपकी समस्या को व्यापक अध्ययन किया है। विशेष रूप से अंतिम एक और पीएचडी थीसिस।
शुभ लाभ!