ARIMA मॉडल को फिट करने से पहले लॉग टू टाइम श्रृंखला कब बदलना है


26

मैंने पूर्व में यूनीवेट टाइम सीरीज़ का पूर्वानुमान लगाने के लिए पूर्वानुमान प्रो का उपयोग किया है , लेकिन मैं अपने वर्कफ़्लो को आर पर स्विच कर रहा हूं। आर के लिए पूर्वानुमान पैकेज में बहुत सारे उपयोगी कार्य शामिल हैं, लेकिन एक बात यह नहीं है कि ऑटो चलाने से पहले किसी भी तरह का डेटा परिवर्तन होता है। .arima ()। कुछ मामलों में पूर्वानुमान प्रो पूर्वानुमान करने से पहले ट्रांसफॉर्म डेटा लॉग करने का फैसला करता है, लेकिन मुझे अभी तक यह पता नहीं चला है कि क्यों।

तो मेरा सवाल यह है: ARIMA विधियों को आजमाने से पहले मुझे अपनी समय श्रृंखला को कब बदलना चाहिए?

/ संपादित करें: आपके उत्तर पढ़ने के बाद, मैं कुछ इस तरह का उपयोग करने जा रहा हूं, जहां x मेरी समय श्रृंखला है:

library(lmtest)
if ((gqtest(x~1)$p.value < 0.10) {
    x<-log(x)
}

इसका कोई मतलब भी है क्या?

जवाबों:


21

आगे बढ़ने से पहले कुछ चेतावनी। जैसा कि मैं अक्सर अपने छात्रों को सुझाव देता हूं, auto.arima()केवल अपने अंतिम परिणाम के लिए पहले सन्निकटन के रूप में चीजों का उपयोग करें या यदि आप चाहते हैं कि जब आप जांच करें कि आपके प्रतिद्वंद्वी सिद्धांत-आधारित मॉडल बेहतर करते हैं।

डेटा

आपके द्वारा काम कर रहे समय श्रृंखला डेटा के विवरण से शुरू करने के लिए आपके पास स्पष्ट रूप से है। मैक्रो-इकोनोमेट्रिक्स में आप आमतौर पर एग्रीगेटेड डेटा के साथ काम करते हैं, और ज्यामितीय साधनों (आश्चर्यजनक रूप से) के पास मैक्रो टाइम सीरीज़ डेटा के लिए अधिक अनुभवजन्य साक्ष्य होते हैं, शायद इसलिए क्योंकि उनमें से अधिकांश घातीय रूप से बढ़ते प्रवृत्ति में विघटित होते हैं ।

वैसे, रोब का सुझाव "नेत्रहीन" स्पष्ट मौसमी भाग के साथ समय श्रृंखला के लिए काम करता है , क्योंकि धीरे-धीरे अलग-अलग वार्षिक डेटा भिन्नता में वृद्धि के लिए कम स्पष्ट है। सौभाग्य से तेजी से बढ़ते रुझान को आमतौर पर देखा जाता है (यदि यह रैखिक लगता है, तो लॉग की आवश्यकता नहीं है)।

आदर्श

यदि आपका विश्लेषण कुछ सिद्धांत पर आधारित है जो बताता है कि कुछ भारित ज्यामितीय माध्य और अधिक के रूप में जाना जाता है गुणात्मक प्रतिगमन मॉडल वह है जिसके साथ आपको काम करना है। फिर आप आमतौर पर एक लॉग-लॉग रिग्रेशन मॉडल में चले जाते हैं , जो मापदंडों और आपके अधिकांश चर में रैखिक है, लेकिन कुछ वृद्धि दर, रूपांतरित हो जाते हैं।Y(टी)=एक्स1α1(टी)एक्सकश्मीरαकश्मीर(टी)ε(टी)

लॉग-रिटर्न की लोकप्रियता के कारण वित्तीय अर्थमिति में लॉग एक आम बात है, क्योंकि ...

लॉग ट्रांसफॉर्मेशन में अच्छे गुण होते हैं

लॉग-लॉग प्रतिगमन मॉडल में यह अनुमान लगाया पैरामीटर की व्याख्या है, कहते हैं कि के रूप में लोच की पर ।αमैंY(टी)एक्समैं(टी)

त्रुटि-सुधार मॉडल में हमारे पास एक आनुभविक रूप से मजबूत धारणा है कि अनुपात पूर्ण अंतरों की तुलना में अधिक स्थिर ( स्थिर ) हैं।

वित्तीय अर्थमिति में समय के साथ लॉग-रिटर्न को एकत्रित करना आसान है

कई अन्य कारणों का उल्लेख यहां नहीं है।

आखिरकार

ध्यान दें कि लॉग-रूपांतरण आमतौर पर गैर-नकारात्मक (स्तर) चर पर लागू होता है। यदि आप दो समय श्रृंखला (उदाहरण के लिए शुद्ध निर्यात) के अंतरों का निरीक्षण करते हैं, तो लॉग लेना संभव भी नहीं है, आपको या तो स्तरों में मूल डेटा की खोज करनी होगी या सामान्य प्रवृत्ति के रूप को ग्रहण करना होगा जिसे घटाया गया था।

[ संपादित करने के बाद जोड़ ] अगर आप अभी भी लॉग रूपांतरण करने के लिए एक सांख्यिकीय मानदंड चाहते हैं , तो एक सरल समाधान विषमलैंगिकता के लिए कोई भी परीक्षण होगा। बढ़ते विचरण के मामले में, मैं गोल्डफेल्ड-क्वांड्ट टेस्ट या इसके समान सुझाव दूंगा । आर में यह स्थित है library(lmtest)और gqtest(y~1)फ़ंक्शन द्वारा निरूपित किया जाता है । यदि आपके पास कोई प्रतिगमन मॉडल नहीं है, तो बस इंटरसेप्ट शब्द पर फिर से लिखें, yआपका आश्रित चर है।


जानकारी के लिए धन्यवाद। GQ परीक्षण के साथ, p मान जितना कम होगा, वितरण के विषमता की संभावना उतनी ही अधिक होगी?
जैच

@Zach: बिल्कुल, उदाहरण के लिए, 5% लें, यदि आप डेटा माइनिंग के लिए जाने की योजना नहीं बना रहे हैं। मैं व्यक्तिगत रूप से मॉडल मान्यताओं से शुरू करता हूं।
Dmitrij Celov

@Dmitrij। धन्यवाद। मैं सिर्फ यह सुनिश्चित करना चाहता हूं कि मैं आउटपुट को सही ढंग से व्याख्या कर रहा हूं।
Zach

29

समय के खिलाफ डेटा का एक ग्राफ प्लॉट करें। यदि ऐसा लगता है कि श्रृंखला के स्तर के साथ भिन्नता बढ़ती है, तो लॉग लें। अन्यथा मूल डेटा को मॉडल करें।


3
यहाँ एक सवाल है: यदि आप लॉग लेते हैं और उन्हें नहीं बुलाया जाता है तो इसका क्या प्रभाव पड़ता है? मुझे समय श्रृंखला के साथ काम करते समय यह पसंद आया है जिसमें लॉग ट्रांसफ़ॉर्म की आवश्यकता होती है, क्योंकि (जैसा कि मैं इसे समझता हूं) गुणांक अनुपात हैं और छोटे मूल्यों पर लगभग प्रतिशत हैं। (उदा। एक्सप (0.05) = 1.051।)
वेन

4

उनके फलों से उन्हें पता चल जाएगा

धारणा (परीक्षण किया जाना है) यह है कि मॉडल से त्रुटियों का निरंतर विचरण होता है। ध्यान दें कि इसका मतलब यह नहीं है कि एक मान्य मॉडल से त्रुटियां। जब आप एक सरल चित्रमय विश्लेषण का उपयोग करते हैं तो आप अनिवार्य रूप से समय में एक रैखिक मॉडल मान रहे हैं।

इस प्रकार यदि आपके पास एक अपर्याप्त मॉडल है, जैसा कि समय के खिलाफ डेटा के एक आकस्मिक साजिश द्वारा सुझाया जा सकता है, तो आप गलत तरीके से एक शक्ति परिवर्तन की आवश्यकता के बारे में निष्कर्ष निकाल सकते हैं। बॉक्स और जेनकिन्स ने अपने एयरलाइन डेटा उदाहरण के साथ ऐसा किया। उन्होंने हाल के आंकड़ों में 3 असामान्य मूल्यों का हिसाब नहीं दिया, इस प्रकार उन्होंने गलत निष्कर्ष निकाला कि श्रृंखला के उच्चतम स्तर पर अवशिष्टों में उच्च भिन्नता थी।

इस विषय पर अधिक जानकारी के लिए कृपया http://www.autobox.com/pdfs/vegas_ibf_09a.pdf देखें


1

जब आप किसी तरह से प्राकृतिक रूप से ज्यामितीय होते हैं या जहां निवेश का समय मूल्य निकलता है, तो आप एक न्यूनतम जोखिम बांड की तुलना करते हैं, जिसमें सकारात्मक वापसी होती है, तब आप श्रृंखला को लॉग-ट्रांसफ़ॉर्म करना चाह सकते हैं। यह उन्हें और अधिक "रैखिक बनाने योग्य" बना देगा, और इसलिए एक सरल विभेदक पुनरावृत्ति संबंध के लिए उपयुक्त है।


1
रूपांतरण दवाओं की तरह हैं: कुछ आपके लिए अच्छे हैं और कुछ नहीं हैं। यदि आप सांख्यिकीय परिकल्पना के परीक्षण में रुचि नहीं रखते हैं, तो आप अपनी पसंद की कोई भी चीज़ ग्रहण कर सकते हैं। परिकल्पना के पैरामीट्रिक परीक्षणों में त्रुटि के बारे में धारणाएं हैं, उन्हें अपने जोखिम पर ध्यान न दें।
आयरिशस्टैट

1
सच है। मैंने कहा था कि प्रक्रिया को ज्यामितीय होना चाहिए। रूपांतरित होने में विफल होने से त्रुटि के साथ-साथ त्रुटियों का भी सामना करना पड़ सकता है। मैं यह नहीं देखता कि मैं कहां से सुझाव दे रहा था कि मान्य औचित्य की शर्तों के बारे में मान्यताओं की अनदेखी करें।
डीडिन

1
आंकड़े.stackexchange.com/questions/6498/… को कब और क्यों बदलना है, की चर्चा शामिल थी। "तथ्य" कि मूल डारिस "ज्यामितीय" है, यह अनुमान नहीं लगाता है कि एक पर्याप्त मॉडल के अवशेषों में मानक विचलन होता है जो अर्थ के लिए आनुपातिक होता है। लेकिन यह अनुभवजन्य साबित या कम से कम परीक्षण किया जा सकता है।
आयरिशस्टैट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.