क्या इसे और अधिक सार्थक बनाने के लिए किसी समय श्रृंखला को एकत्र करना मान्य है?


10

मुझसे समय श्रृंखला के बारे में एक और सवाल।

मेरे पास एक डेटासेट है जो एक मनोरोग अस्पताल में तीन वर्षों में हिंसक घटनाओं का दैनिक रिकॉर्ड देता है। अपने पिछले प्रश्न की मदद से मैं इसके साथ जुड़ गया हूं और अब इसके बारे में थोड़ा खुश हूं।

मेरे पास अब यह बात है कि दैनिक श्रृंखला बहुत शोर करती है। यह बेतहाशा, ऊपर और नीचे, 0 से 20 तक के समय में उतार-चढ़ाव करता है। लोटे के भूखंडों और पूर्वानुमान पैकेज का उपयोग करके (जो मैं अपने जैसे नौसिखियों के लिए अत्यधिक अनुशंसा कर सकता हूं) मुझे पूर्वानुमान से बड़े पैमाने पर आत्मविश्वास अंतराल के साथ बस एक पूरी तरह से सपाट रेखा मिलती है।

हालाँकि, साप्ताहिक या मासिक डेटा एकत्र करना बहुत अधिक मायने रखता है। वे श्रृंखला की शुरुआत से नीचे झूलते हैं, और फिर बीच में फिर से बढ़ जाते हैं। ढीले प्लॉटिंग और पूर्वानुमान पैकेज दोनों कुछ ऐसा उत्पन्न करते हैं जो बहुत अधिक सार्थक लगता है।

हालांकि यह धोखा देने जैसा महसूस होता है। क्या मैं सिर्फ एकत्रित संस्करणों को पसंद कर रहा हूं क्योंकि वे इसे बिना किसी वास्तविक वैधता के साथ अच्छे लगते हैं?

या एक चलती औसत की गणना करना और आधार के रूप में उपयोग करना बेहतर होगा? मुझे डर है कि मैं इस सब के पीछे सिद्धांत को अच्छी तरह से समझ नहीं पा रहा हूं कि क्या स्वीकार्य है

जवाबों:


8

यह पूरी तरह से आपकी समय श्रृंखला पर निर्भर करता है और आप किस प्रभाव को खोजना चाहते हैं / प्रमाण आदि।

यहां एक महत्वपूर्ण बात यह है कि आपके डेटा में किस तरह की अवधि है। आप डेटा का एक स्पेक्ट्रम बनाएं और देखें कि आपके डेटा में क्या फ्रीक्वेंसी आम हैं।

वैसे भी, जब आप एकत्रित मूल्यों को प्रदर्शित करने का निर्णय लेते हैं तो आप झूठ नहीं बोलते हैं। जब आप उन प्रभावों को देख रहे हैं जो हफ्तों से हो रहे हैं (जैसे, गर्मी के मौसम में और अधिक हिंसा जब यह गर्म मौसम है) तो यह करना सही है।

शायद आप हिल्बर्ट हुआंग ट्रांसफॉर्म पर भी नज़र डाल सकते हैं। यह आपको आंतरिक मोड फ़ंक्शंस देगा जो दृश्य विश्लेषण के लिए बहुत उपयोगी हैं।


12

सिग्नल / शोर अनुपात को बढ़ाने के लिए डेटा एकत्र करने का पूर्वानुमान लगाना बहुत आम है। उदाहरण के लिए, अर्थशास्त्र में पूर्वानुमान सटीकता पर लौकिक एकत्रीकरण के प्रभाव पर कई पेपर हैं। आप शायद दैनिक डेटा में जो देख रहे हैं, वह एक कमजोर संकेत है जो शोर से बह रहा है, जबकि साप्ताहिक और मासिक डेटा एक मजबूत संकेत दिखा रहे हैं जो अधिक दिखाई दे रहा है।

आप अस्थायी एकत्रीकरण का उपयोग करना चाहते हैं या नहीं, यह पूरी तरह से आपके उद्देश्य पर निर्भर करता है। यदि आपको दैनिक घटनाओं के पूर्वानुमान की आवश्यकता है, तो एकत्रीकरण का अधिक उपयोग नहीं होने वाला है। यदि आप घटना की आवृत्ति पर कई कोवरिएट के प्रभावों की खोज करने में रुचि रखते हैं, और आपके सभी डेटा दैनिक आधार पर उपलब्ध हैं, तो मैं शायद दैनिक डेटा का उपयोग करूंगा क्योंकि यह एक बड़ा नमूना आकार देगा और शायद आपको पता लगाने में सक्षम होगा। प्रभाव अधिक आसानी से।

चूंकि आप पूर्वानुमान पैकेज का उपयोग कर रहे हैं, संभवतः आप समय श्रृंखला पूर्वानुमान में रुचि रखते हैं। तो क्या आपको दैनिक पूर्वानुमान, साप्ताहिक पूर्वानुमान या मासिक पूर्वानुमान की आवश्यकता है? उत्तर निर्धारित करेगा कि एकत्रीकरण आपके लिए उपयुक्त है या नहीं।


1

आपके सामने आने वाली समस्या (दुविधा) आपके पूर्वानुमानों को संशोधित करने के लिए एक इष्टतम (या अन्यथा अच्छा) नमूना अंतराल का चयन करने में से एक है। शुरुआत करने के लिए, ब्राउन की प्रसिद्ध पुस्तक का लिंक टेक्स्ट देखें , जो एक अच्छे संदर्भ के रूप में भी योग्य होगा। यह सभी "डेटा की अंतर्निहित परिवर्तनशीलता और अक्सर संशोधित योजनाओं की लागत के खिलाफ एक बदलाव को नोटिस नहीं करने के जोखिम को संतुलित करने" के लिए उबालता है। यदि आप अपने पूर्वानुमान को संशोधित करने के लिए तैयार नहीं हैं (और निर्णय जो इसे प्रेरित करते हैं) दैनिक, आपको वास्तव में दैनिक डेटा का उपयोग करने की आवश्यकता नहीं है। एक महत्वपूर्ण बिंदु, जो अक्सर समकालीन पूर्वानुमान साहित्य में खो जाता है, यह है कि पूर्वानुमान केवल एक निर्णय लेने में सहायता करने के लिए आवश्यक हैं (जब तक कि कोई यह भी नहीं जानता कि उनसे मज़ा कैसे लिया जाए)।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.