मल्टीरिएंट टाइम सीरीज़ में आर। लैग्ड सहसंबंध कैसे खोजें और पूर्वानुमान के लिए मॉडल का निर्माण करें


16

मैं पेज में नया हूं और आंकड़ों में बहुत नया हूं और नदियों में बारिश और जल प्रवाह के स्तर के बीच संबंध खोजने के उद्देश्य से मैं कॉलेज के लिए एक परियोजना पर काम कर रहा हूं। एक बार सहसंबंध साबित होने के बाद मैं इसका पूर्वानुमान / पूर्वानुमान लगाना चाहता हूं।

डेटा मैं युक्त एक विशेष नदियों के लिए (हर 5 मिनट में लिया गया) कई वर्षों के डेटा का एक सेट है:

  • मिलीमीटर में बारिश
  • प्रति सेकंड क्यूबिक मीटर में नदी का प्रवाह

इस नदी में बर्फ नहीं है, इसलिए मॉडल सिर्फ बारिश और समय पर आधारित है। कभी-कभार ठंड के तापमान होते हैं, लेकिन मैं डेटा को आउटलेयर के रूप में उन अवधियों को हटाने के बारे में सोच रहा हूं क्योंकि यह स्थिति मेरी परियोजना के दायरे से बाहर है।

उदाहरण यहां आपके पास बारिश से पानी के नमूने के कुछ जोड़े और कुछ घंटों बाद पानी का बढ़ना है।

कुछ दिनों के लिए बड़ा उदाहरण

छोटा उदाहरण केवल एक वर्षा काल

लाल रेखा नदी का प्रवाह है। नारंगी बारिश है। नदी में पानी बढ़ने से पहले आप हमेशा बारिश देख सकते हैं। समय श्रृंखला के अंत में फिर से कुछ बारिश शुरू हो रही है, लेकिन यह बाद में नदी के प्रवाह को प्रभावित करेगी।

सहसंबंध है। यहाँ मैंने R में ccf का उपयोग करके सहसंबंध साबित करने के लिए R में क्या किया है:

  • क्रॉस-सहसंबंध
  • अग्रणी चर
  • अंतराल

यह मेरी R लाइन है जिसका उपयोग दूसरे उदाहरण (एक वर्षा अवधि) के लिए किया जाता है:

ccf(arnoiaex1$Caudal, arnoiaex1$Precip, lag.max=1000, plot=TRUE, main="Flow & Rain")

छोटे उदाहरण के लिए ccf परिणाम 2

मेरी व्याख्या है:

  • बारिश होती है (पहले होती है),
  • 450
  • 450800ccf

क्या मैं सही हू?

समय श्रृंखला के बारे में । इस समय श्रृंखला में आवधिकता या मौसमी नहीं है। बारिश किसी भी समय आ सकती है और प्रभाव पैदा कर सकती है। यह गर्मियों में कम हो जाता है, लेकिन यह अभी भी होता है, यह एक ऐसा क्षेत्र है जिसमें पूरे साल बहुत बारिश होती है।

मॉडल और पूर्वानुमान। मुझे नहीं पता कि एक मॉडल कैसे बनाया जाए जो एक पूर्वानुमान करने में सक्षम हो जो मुझे बताता है कि एक नदी कितनी बारिश के बाद मात्रा को बढ़ाने वाली है। मैं कुछ कोशिश कर रहा हूँ arima, auto arimaलेकिन बहुत सफल नहीं रहा है। क्या मुझे उपयोग करना चाहिए Arima, varsया अन्य विभिन्न बहुभिन्नरूपी मॉडल? उदाहरण के लिए कोई भी लिंक बहुत मदद करेगा।

कृपया, मुझे बताएं कि यदि आप इस भविष्यवाणी को बनाने का सबसे अच्छा तरीका जानते हैं, तो मुझे किस मॉडल का उपयोग करना चाहिए। कुछ अन्य चीजें हैं जो मैं करने पर विचार कर रहा हूं, लेकिन उन्हें सरलता के लिए इस स्पष्टीकरण से निकाल दिया। यदि आवश्यक हो तो मैं कुछ डेटा साझा कर सकता हूं।


आप हस्तक्षेप विश्लेषण की तलाश कर रहे हैं (सामाजिक अध्ययनों में सबसेट को "ईवेंट स्टडीज" कहा जाता है)
कोन्स्टेंटेनोस

जवाबों:


3

आपको अपने एसीएफ और पीएसीएफ व्यवहार का उपयोग करने की आवश्यकता है, जो यह निर्धारित करने में आपकी मदद करता है कि कौन सा मॉडल आपके डेटा को बेहतर ढंग से सूट करता है (जैसे एसीएफ प्लॉट में धीमी गति से क्षय का एक अस्तित्व इंगित करता है कि श्रृंखला को और अधिक स्थिर बनाने के लिए विभेदन की आवश्यकता हो सकती है। आपका एसीएफ प्लॉट स्पष्ट रूप से कुछ प्रकार दिखाता है। परिवर्तन की आवश्यकता है। यदि आप सही परिवर्तन (स्थिर श्रृंखला) का उपयोग करते हैं तो उतार-चढ़ाव कम और नीले रंग की रेखाओं के भीतर होना चाहिए। एक बार जब आप अपनी श्रृंखला को स्थिर बना लेते हैं, तो सोचें कि कौन सा मॉडल AR, MA, ARMA, या ARIMA उपयुक्त है। मेरी परियोजना में मैंने मॉडल चयन में मदद करने के लिए निम्नलिखित किया:

ACF प्लॉट लैग 2 पर अपेक्षाकृत बड़ा मूल्य दिखाता है ( देखें कि यह आपके प्लॉट में कहां है )। इसके अलावा, यह अनिवार्य रूप से दो से अधिक अंतराल पर शून्य हो जाता है। यह बताता है कि एक एमए (2) मॉडल डेटा फिट हो सकता है और फिर पीएसीएफ भूखंड को देखकर हम तुरंत नोटिस करते हैं कि सहसंबंध लगभग सभी अंतराल पर शून्य है। यह सुझाव दे सकता है कि मॉडल पर कोई एआर हिस्सा नहीं है (इसे अपने प्लॉट में समायोजित करें))। इसलिए, हमारा एक उम्मीदवार मॉडल पैरामीटर p = 0, d = 1, और q = 1 or2 के साथ ARIMA (p, d, q) हो सकता है। मैंने MA के कुछ उच्च आदेशों की भी कोशिश की और AIC, AICc और BIC के परिणामों की तुलना करने और अंतिम मॉडल पर निर्णय लेने के लिए मॉडल में AR भाग होने की कुछ संभावना पर विचार किया। अगला चरण आपको यह सुनिश्चित करने के लिए कुछ नैदानिक ​​परीक्षणों को चलाने की आवश्यकता होगी कि आपने सही मॉडल चुना है और आपके अवशेषों में कोई पैटर्न नहीं है (अवशेषों के लिए ACF & PACF, Ljung-Box आँकड़ा के लिए पी-मान, अवशिष्टों के लिए हिस्टोग्राम और QQ प्लॉट)। आशा करता हूँ की ये काम करेगा!

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.