मौसमी समय श्रृंखला


9

मैं decomposeफ़ंक्शन का उपयोग करता हूं Rऔर मेरी मासिक समय श्रृंखला (प्रवृत्ति, मौसमी और यादृच्छिक) के 3 घटकों के साथ आता हूं। यदि मैं चार्ट की साजिश करता हूं या तालिका को देखता हूं, तो मैं स्पष्ट रूप से देख सकता हूं कि समय श्रृंखला सीज़न से प्रभावित होती है।

हालाँकि, जब मैं 11 सीजनल डमी वैरिएबल्स पर टाइम सीरीज़ को पुनः प्राप्त करता हूं, तो सभी गुणांक सांख्यिकीय रूप से महत्वपूर्ण नहीं होते हैं, यह सुझाव देते हुए कि कोई सीज़नसिटी नहीं है।

मुझे समझ नहीं आता कि मैं दो अलग-अलग परिणामों के साथ क्यों आता हूं। क्या यह किसी के साथ हुआ? क्या मुझसे कुछ गलत हो रही है?


मैं यहां कुछ उपयोगी विवरण जोड़ता हूं।

यह मेरी समय श्रृंखला और इसी मासिक परिवर्तन है। दोनों चार्ट में, आप देख सकते हैं कि मौसम की स्थिति है (या यही वह है जो मैं आकलन करना चाहता हूं)। विशेष रूप से, दूसरे चार्ट में (जो श्रृंखला का मासिक परिवर्तन है) मैं एक आवर्तक पैटर्न (वर्ष के समान महीनों में उच्च अंक और कम अंक) देख सकता हूं।

समय श्रृंखला

MonthlyChange

नीचे decomposeफ़ंक्शन का आउटपुट है । मैं इसकी सराहना करता हूं, जैसा कि @RichardHardy ने कहा, फ़ंक्शन यह परीक्षण नहीं करता है कि वास्तविक मौसमी है या नहीं। लेकिन अपघटन इस बात की पुष्टि करता है कि मुझे क्या लगता है।

विघटित

हालाँकि, जब मैं 11 सीजनल डमी वैरिएबल (जनवरी से नवंबर, दिसंबर को छोड़कर) पर टाइम सीरीज़ को पुनः प्राप्त करता हूं तो मुझे निम्नलिखित मिलते हैं:

    Coefficients:
                  Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 5144454056  372840549  13.798   <2e-16 ***
    Jan     -616669492  527276161  -1.170    0.248    
    Feb     -586884419  527276161  -1.113    0.271    
    Mar     -461990149  527276161  -0.876    0.385    
    Apr     -407860396  527276161  -0.774    0.443    
    May     -395942771  527276161  -0.751    0.456    
    Jun     -382312331  527276161  -0.725    0.472    
    Jul     -342137426  527276161  -0.649    0.520    
    Aug     -308931830  527276161  -0.586    0.561    
    Sep     -275129629  527276161  -0.522    0.604    
    Oct     -218035419  527276161  -0.414    0.681    
    Nov     -159814080  527276161  -0.303    0.763

मूल रूप से, सभी मौसमी गुणांक सांख्यिकीय रूप से महत्वपूर्ण नहीं हैं।

रैखिक प्रतिगमन को चलाने के लिए मैं निम्नलिखित फ़ंक्शन का उपयोग करता हूं:

lm.r = lm(Yvar~Var$Jan+Var$Feb+Var$Mar+Var$Apr+Var$May+Var$Jun+Var$Jul+Var$Aug+Var$Sep+Var$Oct+Var$Nov)

जहां मैंने मासिक आवृत्ति (आवृत्ति = 12) के साथ एक समय श्रृंखला चर के रूप में यवर की स्थापना की।

मैं समय श्रृंखला के रुझान वाले घटक को भी ध्यान में रखने की कोशिश करता हूं, जिसमें प्रवृत्ति के लिए प्रतिगमन शामिल है। हालांकि, परिणाम नहीं बदलता है।

                  Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 3600646404   96286811  37.395   <2e-16 ***
    Jan     -144950487  117138294  -1.237    0.222    
    Feb     -158048960  116963281  -1.351    0.183    
    Mar      -76038236  116804709  -0.651    0.518    
    Apr      -64792029  116662646  -0.555    0.581    
    May      -95757949  116537153  -0.822    0.415    
    Jun     -125011055  116428283  -1.074    0.288    
    Jul     -127719697  116336082  -1.098    0.278    
    Aug     -137397646  116260591  -1.182    0.243    
    Sep     -146478991  116201842  -1.261    0.214    
    Oct     -132268327  116159860  -1.139    0.261    
    Nov     -116930534  116134664  -1.007    0.319    
    trend     42883546    1396782  30.702   <2e-16 ***

इसलिए मेरा सवाल है: क्या मैं प्रतिगमन विश्लेषण में कुछ गलत कर रहा हूं?


1
@forecaster, यहाँ आपके प्रश्न का उत्तर है (ओपी कहते हैं कि decomposeफ़ंक्शन Rका उपयोग किया जाता है)।
रिचर्ड हार्डी

1
decomposeफंक्शन की हेल्प फाइल को पढ़कर ऐसा लगता है कि फंक्शन टेस्ट नहीं करता है कि सीज़न है। इसके बजाय, यह प्रत्येक मौसम के लिए औसत प्राप्त करता है, औसत को घटाता है और इस मौसमी घटक को कॉल करता है। तो यह एक मौसमी घटक का उत्पादन करेगा चाहे सच अंतर्निहित मौसमी घटक या सिर्फ शोर हो। फिर भी, यह स्पष्ट नहीं करता है कि आपके डमी क्यों महत्वहीन हैं, हालांकि आप कहते हैं कि मौसमी डेटा के एक भूखंड से दिखाई देता है। क्या ऐसा हो सकता है कि महत्वपूर्ण मौसमी डमी पाने के लिए आपका नमूना बहुत छोटा हो? क्या वे संयुक्त रूप से महत्वपूर्ण हैं?
रिचर्ड हार्डी

3
आपको तराजू पर गौर करने की जरूरत है, मौसमी चार्ट दिखाता है कि मौसमी भिन्नता -0.02 और +0.04 के बीच है, जबकि वास्तविक मूल्य 4 बिलियन से 6 बिलियन तक हैं। Decompose फ़ंक्शन आपके डेटा को कुछ मौसमीता दिखाने के लिए मजबूर करता है यही कारण है कि यह एक मूल्य दिखा रहा है जो नगण्य है। आपके डेटा में कोई भी मौसम नहीं है।
फोरकास्टर

1
मैंने सोचा कि मौसमी चाल के परिमाण के बजाय एक निश्चित "निश्चित" आवृत्ति के साथ आंदोलनों के बारे में अधिक है। तराजू भिन्न होते हैं क्योंकि पहला चार्ट एक संतुलन दिखाता है (पाउंड के संदर्भ में) और दूसरा परिवर्तन है (प्रतिशत शब्दों में व्यक्त)। मैंने केवल प्रतिगमन को फिर से चलाने की कोशिश की है: यदि मैं एक बहुपदीय प्रवृत्ति को ध्यान में रखता हूं, तो कुछ गुणांक महत्वपूर्ण होने लगते हैं। मुझे लगता है, जैसा कि @danno ने सुझाव दिया, प्रवृत्ति बहुत महत्वपूर्ण है।
मटियास

1
कैनोवा और हैनसेन परीक्षण आपके डेटा में मौसमी पैटर्न की उपस्थिति और स्थिरता के बारे में आपकी कुछ और जानकारी दे सकते हैं। इस परीक्षण के कुछ अनुप्रयोगों के लिए उदाहरण के लिए इस पोस्ट को देखें , जो मूल पेपर का लिंक और नमूना कोड भी देता है।
ज्वालाचेल

जवाबों:


1

क्या आपने प्रवृत्ति को हटाने के बाद डेटा पर प्रतिगमन कर रहे हैं ? आपके पास एक सकारात्मक प्रवृत्ति है, और आपके मौसमी हस्ताक्षर की संभावना आपके प्रतिगमन (प्रवृत्ति, या त्रुटि के कारण विचरण), महीने के कारण बड़ी होती है) में नकाबपोश की जाती है, जब तक कि आपने यवर में प्रवृत्ति के लिए जिम्मेदार नहीं हो ...

इसके अलावा, मैं समय श्रृंखला के साथ बहुत आश्वस्त नहीं हूं, लेकिन क्या प्रत्येक अवलोकन को एक महीने नहीं सौंपा जाना चाहिए, और आपका प्रतिगमन कुछ इस तरह दिखता है?

lm(Yvar ~ Time + Month)

माफी अगर कोई मतलब नहीं है ... क्या प्रतिगमन यहाँ सबसे अधिक समझ में आता है?


मैं एक इकोनोमेट्रिक्स की पाठ्यपुस्तक (वोल्ड्रिज) पर पढ़ता हूं कि यदि आप प्रतिगमन में "समय" कारक का परिचय देते हैं, तो यह आपकी मूल समय श्रृंखला को डी-ट्रेंड करने जैसा है। "समय" कारक के लिए मेरा मतलब है एक वेक्टर जैसे [1, 2, ..., n] n = के साथ टिप्पणियों की संख्या। मुझे वास्तव में आपका दूसरा बिंदु नहीं मिला है। मेरा दूसरा प्रतिगमन निम्नलिखित जैसा दिखता है: lm.r = lm (Yvar ~ Varटीमैं+वीआरजनवरी + वारएफ++वीआरनवम्बर)। क्या यही आपका मतलब है?
१३:१३

यह आपके डेटा की कुछ लाइनों को देखने में मदद करेगा। लेकिन, मुझे लगता है कि आपको तीन कॉलम मिले हैं, टाइम, यवर, महीना। पंक्तियाँ अवलोकनीय हैं। इस प्रकार, मुझे लगता है कि आपके एलएम () के कारक समय और महीने होंगे (महीने के कारक स्तर नहीं)। इसके अलावा, मुझे लगता है कि समय श्रृंखला पर lm () के साथ कुछ मुद्दे हैं ... अवलोकन स्वतंत्र नहीं है - अस्थायी रूप से स्वतःसंबंधित।
danno

1

समय श्रृंखला के आपके चित्रमय चित्रण में, यह स्पष्ट है कि "प्रवृत्ति" - समय में एक रैखिक घटक - प्राप्ति के लिए सबसे महत्वपूर्ण योगदानकर्ता है। हम टिप्पणी करेंगे कि इस समय श्रृंखला का सबसे महत्वपूर्ण पहलू प्रत्येक महीने स्थिर वृद्धि है।

उसके बाद, मैं टिप्पणी करूंगा कि मौसमी बदलाव तुलनात्मक रूप से छोटा है। यह आश्चर्य की बात नहीं है, इसलिए, 6 साल से अधिक के लिए (केवल 72 टिप्पणियों के कुल) मासिक उपायों के साथ, रैखिक प्रतिगमन मॉडल 11 महीने के किसी भी विरोधाभास को सांख्यिकीय रूप से महत्वपूर्ण के रूप में पहचानने के लिए सटीक होने में विफल रहता है । यह और अधिक आश्चर्यजनक नहीं है कि समय प्रभाव सांख्यिकीय महत्व को प्राप्त करता है , क्योंकि यह सभी 72 प्रेक्षणों पर होने वाली लगभग समान रैखिक वृद्धि है, जो उनके मौसमी प्रभाव पर सशर्त है।

11 महीने के किसी भी विरोधाभास के लिए सांख्यिकीय महत्व की कमी का मतलब यह नहीं है कि मौसमी प्रभाव नहीं हैं। वास्तव में, यदि आप यह निर्धारित करने के लिए प्रतिगमन मॉडल का उपयोग करने के लिए थे कि क्या कोई मौसमीता है, तो उपयुक्त परीक्षण स्वतंत्रता परीक्षण की नेस्टेड 11 डिग्री है जो एक साथ प्रत्येक महीने के विपरीत के सांख्यिकीय महत्व का आकलन करता है। आप एक एनोवा, संभावना अनुपात परीक्षण, या मजबूत वाल्ड परीक्षण करके इस तरह की परीक्षा प्राप्त करेंगे। उदाहरण के लिए:

library(lmtest) model.mt <- lm(outcome ~ time + month) model.t <- lm(outcome ~ time) aov(model.mt, model.t) lrtest(model.mt, model.t) library(sandwich) ## autoregressive consistent robust standard errors waldtest(lrtest, lmtest, vcov.=function(x)vcovHAC(x))


0

मुझे नहीं पता कि यह आपका मामला है, लेकिन मेरे साथ ऐसा तब हुआ जब मैंने आर में टाइम सीरीज़ का विश्लेषण करना शुरू किया और मुद्दा यह था कि मैंने टाइम सीरीज़ को बनाने के लिए टाइम सीरीज़ को सही ढंग से नहीं बताया था। समय श्रृंखला फ़ंक्शन में एक पैरामीटर है जो आपको इसकी आवृत्ति निर्दिष्ट करने देता है। ऐसा करने पर, यह अपने मौसमी रुझानों को सही ढंग से विघटित करता है।


jmnavarro, मैंने डिकम्पोजिशन फ़ंक्शन में आवृत्ति को सही तरीके से परिभाषित किया (= 12 जैसा कि मेरे पास मासिक डेटा है)। वास्तव में, मैं इस समारोह के परिणाम से खुश हूं। मेरा सवाल यह है कि जब मैं डमी चरों का उपयोग कर रेखीय प्रतिगमन करता हूं तो मुझे वही परिणाम नहीं मिलते हैं (मौसमी महत्वपूर्ण है)। मैंने इसे आर और एक्सेल दोनों के साथ किया और परिणाम समान हैं: डमी गुणांक सांख्यिकीय रूप से महत्वपूर्ण नहीं है। यह उस चीज के खिलाफ है जिसे मैंने पहले डिकम्पोज फंक्शन में पाया था। मुझे समझ नहीं आ रहा है कि मैं यहाँ कुछ याद कर रहा हूँ
रात

सच, क्षमा करें, मैं आपके प्रश्न को पूरी तरह से नहीं समझ पाया। यदि आप अपना कोड पोस्ट कर सकते हैं तो यह मदद करेगा, इसलिए हम इसे पुन: प्रस्तुत करने का प्रयास कर सकते हैं।
जमनवरो
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.