क्या समय अनुक्रमित डेटा के लिए कोई अप्रशिक्षित शिक्षण एल्गोरिदम हैं?


9

मेरे डेटा में प्रत्येक अवलोकन को 0.1 सेकंड के अंतर के साथ एकत्र किया गया था। मैं इसे टाइम सीरीज़ नहीं कहता क्योंकि इसमें डेट और टाइम स्टैम्प नहीं है। क्लस्टरिंग एल्गोरिदम (मैंने ऑनलाइन पाया) के उदाहरणों में और पीसीए नमूना डेटा में प्रति मामले में 1 अवलोकन है और समयबद्ध नहीं हैं। लेकिन मेरे डेटा में प्रति वाहन प्रति 0.1 सेकंड में सैकड़ों अवलोकन हैं और कई वाहन हैं।

नोट: मैंने यह प्रश्न quora पर भी पूछा है।


1
कृपया भाषा पर ध्यान दें। आपका प्रश्न पूरी तरह से अस्पष्ट है। "नमूना डेटा में प्रति मामले 1 अवलोकन होता है और समयबद्ध नहीं होता है" का मतलब है?
कासरा मंशाई

1
मैं उन उदाहरणों के बारे में बात कर रहा था जो मुझे ऑनलाइन ट्यूटोरियल में मिले थे। उनके द्वारा उपयोग किए गए नमूना डेटा में प्रति केस केवल 1 अवलोकन / व्यक्ति (जैसे ग्राहक, देश, आदि) हैं। और वे डेटा टाइम सीरीज़ नहीं हैं।
उमर दुर्रानी 20

जवाबों:


7

आपके पास समय के अनुसार घटनाओं का एक क्रम है इसलिए इसे टाइम सीरीज़ कहने में संकोच न करें!

समय श्रृंखला में क्लस्टरिंग के 2 अलग-अलग अर्थ हैं:

  1. समय श्रृंखला का विभाजन यानी आप आंतरिक समानता के अनुसार अलग-अलग समय श्रृंखला में अलग-अलग समय श्रृंखला को विभाजित करना चाहते हैं।
  2. टाइम सीरीज़ क्लस्टरिंग यानी आपके पास कई टाइम सीरीज़ हैं और आप दोनों के बीच समानता के अनुसार अलग-अलग क्लस्टर ढूंढना चाहते हैं।

मुझे लगता है कि आप दूसरे का मतलब है और यहाँ मेरा सुझाव है:

आपके पास प्रति वाहन कई वाहन हैं और आपके पास कई वाहन हैं। इसलिए आपके पास कई मैट्रिसेस हैं (प्रत्येक वाहन एक मैट्रिक्स है) और प्रत्येक मैट्रिक्स में एन पंक्तियाँ (टिप्पणियों का एनआर) और टी कॉलम (समय बिंदु) शामिल हैं। एक सुझाव पीसीए अंतरिक्ष में मंदता और डेटा को कम करने के लिए प्रत्येक मैट्रिक्स पर पीसीए को लागू करना हो सकता है और देखें कि क्या मैट्रिक्स (वाहन) के भीतर विभिन्न टिप्पणियों के बीच सार्थक संबंध हैं । फिर आप सभी वाहनों के लिए एक-दूसरे पर एक अवलोकन कर सकते हैं और एक मैट्रिक्स बना सकते हैं और पीसीए को लागू कर सकते हैं ताकि विभिन्न वाहनों के बीच एक ही अवलोकन के संबंधों को देख सकें।

यदि आपके पास नकारात्मक मूल्य नहीं हैं, तो मैट्रिक्स फॉर्म डेटा के आयाम में कमी के लिए मैट्रिक्स फैक्टराइजेशन की जोरदार सिफारिश की जाती है।

एक अन्य सुझाव में सभी मैट्रिसेस को एक-दूसरे के ऊपर रखा जा सकता है और N x M x T टेंसर का निर्माण किया जा सकता है, जहाँ N वाहनों की संख्या है, M अवलोकनों की संख्या है और T समय क्रम है और विश्व स्तर पर देखने के लिए Tensor Decomposition लागू करें ।

टाइम सीरीज़ क्लस्टरिंग के लिए एक बहुत अच्छा दृष्टिकोण इस पेपर में दिखाया गया है जहां कार्यान्वयन सीधे आगे शांत है।

मुझे आशा है कि इससे मदद मिली!

शुभ लाभ :)


संपादित करें

जैसा कि आपने बताया कि टाइम सीरीज़ सेगमेंटेशन का मतलब है कि मैं इसे उत्तर में जोड़ता हूँ।

टाइम सीरीज़ सेगमेंटेशन एकमात्र क्लस्टरिंग समस्या है जिसका मूल्यांकन के लिए एक जमीनी सच्चाई है। दरअसल आप समय श्रृंखला के पीछे पैदा वितरण पर विचार करने और उसका विश्लेषण मैं दृढ़ता से अनुशंसा करते यह , यह , यह , यह , यह और इस जहां आपकी समस्या को व्यापक अध्ययन किया है। विशेष रूप से अंतिम एक और पीएचडी थीसिस।

शुभ लाभ!


1
एक महान जवाब के लिए धन्यवाद। मेरा लक्ष्य, वास्तव में, मेरे डेटा सेट में प्रत्येक वाहन के लिए "समय श्रृंखला का विभाजन" करना है।
उमर दुर्रानी

1
मैं समय श्रृंखला अपघटन पर ट्यूटोरियल का अध्ययन कर रहा हूं। मैंने पाया कि प्रवृत्ति, मौसमी और चक्रीय घटकों में उन्हें विघटित करने के तरीके हैं। हालाँकि, मेरी टाइम सीरीज़, वाहन के कुछ सेकंड हैं। क्या यह संभव है कि किसी चालित गति के भीतर त्वरण, गति, लीड वाहन गति और त्वरण के रुझानों के आधार पर उन्हें अलग-अलग ड्राइविंग व्यवहार घटकों में विघटित किया जाए?
उमर दुर्रानी

2
शायद! इसके लिए "अपघटन" और "विभाजन" दोनों पर विचार करना बेहतर है। उदाहरण के लिए यदि आपकी समय श्रृंखला पीसी अंतरिक्ष में महत्वपूर्ण क्लस्टर दिखाती है तो आप उन्हें ड्राइविंग व्यवहार से संबंधित कर सकते हैं। सेगमेंटेशन एक समय श्रृंखला के भीतर विभिन्न ड्राइविंग व्यवहारों का पता लगाने के लिए भी है। लंबी कहानी यह है कि आप सभी वाहनों के लिए अलग-अलग ड्राइविंग व्यवहार खंडों के लिए विभाजन का उपयोग कर सकते हैं और सभी वाहनों के लिए वैश्विक ड्राइविंग व्यवहार का पता लगाने के लिए अपघटन तकनीक का उपयोग कर सकते हैं।
कासरा मंशाई
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.