मुझे कई समय-श्रृंखला डेटासेट पर विसंगति का पता लगाने की आवश्यकता है। मैंने पहले कभी ऐसा नहीं किया है और कुछ सलाह की उम्मीद कर रहा था। मैं अजगर के साथ बहुत सहज हूं, इसलिए मैं इस समाधान को लागू करना पसंद करूंगा (मेरे कोड के अधिकांश मेरे काम के अन्य हिस्सों के लिए अजगर है)।
डेटा का विवरण: यह मासिक समय-श्रृंखला डेटा है जिसे केवल पिछले 2 वर्षों में एकत्र किया जाना शुरू हुआ है (यानी केवल 24-36 समय अवधि)। अनिवार्य रूप से, कई क्लाइंट्स के लिए मासिक आधार पर कई मैट्रिक्स की निगरानी की जा रही है।
time_period client metric score
01-2013 client1 metric1 100
02-2013 client1 metric1 119
01-2013 client2 metric1 50
02-2013 client2 metric2 500
...
यहां मैं सोच रहा हूं: डेटा को एक डेटाफ्रेम (पंडों) में खींचो, फिर प्रत्येक क्लाइंट / मीट्रिक जोड़ी के लिए एक रोलिंग 6 महीने की औसत गणना करें। यदि वर्तमान समय अवधि का मूल्य 6-महीने के औसत के आधार पर कुछ सीमा से अधिक है, तो ध्वज को बढ़ाएं। समस्या सरल लगती है। मैं सिर्फ यह सुनिश्चित करना चाहता हूं कि मैं एक ठोस दृष्टिकोण अपना रहा हूं।
इस विचार को थोड़ा बाहर करने की किसी भी सलाह की बहुत सराहना की जाएगी। मुझे पता है कि सवाल थोड़ा सार है, और मैं इसके लिए माफी माँगता हूँ।