मुझसे समय श्रृंखला के बारे में एक और सवाल।
मेरे पास एक डेटासेट है जो एक मनोरोग अस्पताल में तीन वर्षों में हिंसक घटनाओं का दैनिक रिकॉर्ड देता है। अपने पिछले प्रश्न की मदद से मैं इसके साथ जुड़ गया हूं और अब इसके बारे में थोड़ा खुश हूं।
मेरे पास अब यह बात है कि दैनिक श्रृंखला बहुत शोर करती है। यह बेतहाशा, ऊपर और नीचे, 0 से 20 तक के समय में उतार-चढ़ाव करता है। लोटे के भूखंडों और पूर्वानुमान पैकेज का उपयोग करके (जो मैं अपने जैसे नौसिखियों के लिए अत्यधिक अनुशंसा कर सकता हूं) मुझे पूर्वानुमान से बड़े पैमाने पर आत्मविश्वास अंतराल के साथ बस एक पूरी तरह से सपाट रेखा मिलती है।
हालाँकि, साप्ताहिक या मासिक डेटा एकत्र करना बहुत अधिक मायने रखता है। वे श्रृंखला की शुरुआत से नीचे झूलते हैं, और फिर बीच में फिर से बढ़ जाते हैं। ढीले प्लॉटिंग और पूर्वानुमान पैकेज दोनों कुछ ऐसा उत्पन्न करते हैं जो बहुत अधिक सार्थक लगता है।
हालांकि यह धोखा देने जैसा महसूस होता है। क्या मैं सिर्फ एकत्रित संस्करणों को पसंद कर रहा हूं क्योंकि वे इसे बिना किसी वास्तविक वैधता के साथ अच्छे लगते हैं?
या एक चलती औसत की गणना करना और आधार के रूप में उपयोग करना बेहतर होगा? मुझे डर है कि मैं इस सब के पीछे सिद्धांत को अच्छी तरह से समझ नहीं पा रहा हूं कि क्या स्वीकार्य है