R में सेकंड / मिनट के अंतराल डेटा के लिए "फ़्रिक्वेंसी" मान


28

मैं पूर्वानुमान के लिए R (3.1.1), और ARIMA मॉडल का उपयोग कर रहा हूं। मैं जानना चाहता हूं कि "आवृत्ति" पैरामीटर क्या होना चाहिए, जो ts()फ़ंक्शन में असाइन किया गया है , अगर समय श्रृंखला डेटा का उपयोग करके im है:

  1. मिनटों से अलग हो गया है और 180 दिनों (1440 मिनट / दिन) में फैला है
  2. सेकंड से अलग और 180 दिनों (86,400 सेकंड / दिन) में फैला हुआ है।

अगर मुझे सही परिभाषा याद है, आर में ts में एक "आवृत्ति", "सीज़न" प्रति टिप्पणियों की संख्या है।

प्रश्न भाग 1:

मेरे मामले में "सीज़न" क्या है?

यदि सीजन "दिन" है, तो मिनटों के लिए "आवृत्ति" = 1440 और सेकंड के लिए 86,400 है?

प्रश्न भाग 2:

क्या "फ्रीक्वेंसी" इस बात पर भी निर्भर कर सकती है कि मैं क्या हासिल करने / पूर्वानुमान लगाने की कोशिश कर रहा हूं? उदाहरण के लिए, मेरे मामले में, मैं एक बहुत ही अल्पकालिक पूर्वानुमान रखना चाहता हूं। हर बार 10minutes से एक कदम आगे। तब क्या एक दिन के बजाय एक घंटे के रूप में मौसम पर विचार करना संभव होगा? उस स्थिति में आवृत्ति = मिनट के लिए 60, आवृत्ति = सेकंड के लिए 3600?

मैंने उदाहरण के लिए आवृत्ति = 60 मिनट के डेटा का उपयोग करने की कोशिश की है और आवृत्ति = 1440 की तुलना में बेहतर परिणाम प्राप्त किया है ( fourierHyndman द्वारा नीचे लिंक देखें) http://robjhyndman.com/hyndsight/forecasting-weekly-data/

(पूर्वानुमान सटीकता के माप के लिए MAPE का उपयोग करके तुलना की गई थी)

यदि परिणाम पूर्ण रूप से मनमाने हैं, और आवृत्ति को बदला नहीं जा सकता है। वास्तव में मेरे डेटा पर freq = 60 का उपयोग करने की व्याख्या क्या होगी?

मुझे यह भी लगता है कि यह ध्यान देने योग्य है कि मेरे डेटा में हर घंटे और हर दो घंटे पर मौसमी (कच्चे डेटा और स्वतःसंक्रमण फ़ंक्शन का अवलोकन करके) समाहित है।

जवाबों:


38

"आवृत्ति" प्रति "चक्र" (आमतौर पर एक वर्ष, लेकिन कभी-कभी एक सप्ताह, एक दिन, एक घंटा, आदि) की टिप्पणियों की संख्या होती है। यह भौतिकी में आवृत्ति की परिभाषा के विपरीत है, या फूरियर विश्लेषण में, जहां "अवधि" चक्र की लंबाई है, और "आवृत्ति" अवधि का व्युत्क्रम है। ts()आर में फ़ंक्शन का उपयोग करते समय , निम्नलिखित विकल्पों का उपयोग किया जाना चाहिए।

Data      frequency
Annual     1
Quarterly  4
Monthly   12
Weekly    52

दरअसल, एक वर्ष में 52 सप्ताह नहीं होते हैं, लेकिन औसतन 365.25 / 7 = 52.18 हैं। लेकिन अधिकांश फ़ंक्शन जो tsऑब्जेक्ट का उपयोग करते हैं, उन्हें पूर्णांक आवृत्ति की आवश्यकता होती है।

एक बार जब टिप्पणियों की आवृत्ति एक सप्ताह से छोटी होती है, तो आमतौर पर आवृत्ति को संभालने का एक से अधिक तरीका होता है। उदाहरण के लिए, प्रत्येक मिनट में देखे गए डेटा में प्रति घंटा मौसमी (आवृत्ति = 60), एक दैनिक मौसमी (आवृत्ति = 24x60 = 1440), एक साप्ताहिक मौसमी (आवृत्ति = 24x60x7 = 10080) और एक वार्षिक मौसमी (आवृत्ति = 24x60x365.25) हो सकती है। 525,960)। यदि आप किसी tsवस्तु का उपयोग करना चाहते हैं , तो आपको यह तय करने की आवश्यकता है कि इनमें से कौन सबसे महत्वपूर्ण है।

एक विकल्प एक mstsवस्तु ( forecastपैकेज में परिभाषित ) का उपयोग करने के लिए है जो कई मौसमी समय श्रृंखला को संभालता है। फिर आप उन सभी आवृत्तियों को निर्दिष्ट कर सकते हैं जो प्रासंगिक हो सकती हैं। यह गैर-पूर्णांक आवृत्तियों को संभालने के लिए पर्याप्त लचीला है।

आप जरूरी इन सभी आवृत्तियों को शामिल नहीं करना चाहेंगे --- बस वही जो डेटा में मौजूद होने की संभावना है। जैसा कि आपके पास केवल 180 दिनों का डेटा है, आप शायद वार्षिक सीज़न की अनदेखी कर सकते हैं। यदि डेटा एक प्राकृतिक घटना (उदाहरण के लिए, तापमान) के माप हैं, तो आप साप्ताहिक सीज़न की अनदेखी भी कर सकते हैं।

कई मौसमी के साथ, आप एक प्रतिगमन या ARIMA मॉडल में एक टीबीएटीएस मॉडल, या फूरियर शर्तों का उपयोग कर सकते हैं। fourierपूर्वानुमान पैकेज से समारोह संभाल लेंगे mstsवस्तुओं।


इस उत्तर पर एक भिन्नता मेरे ब्लॉग पर पोस्ट की गई है: robjhyndman.com/hyndsight/seasonal-periods
Rob

प्रो। Hyndman, आप अपने पोस्ट के लिए बहुत बहुत धन्यवाद! मुझे खुशी है कि मेरे सवालों का जवाब दिया।
एपिथॉन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.