कैसे पता चलेगा कि एक समय श्रृंखला स्थिर या गैर-स्थिर है?


30

मैं आर उपयोग कर रहा हूँ, मैं गूगल पर खोज की है और सीखा है कि kpss.test(), PP.test(), और adf.test()समय श्रृंखला का stationarity के बारे में पता करने के लिए उपयोग किया जाता है।

लेकिन मैं कोई सांख्यिकीविद् नहीं हूं, जो उनके परिणामों की व्याख्या कर सकता हूं

> PP.test(x)

     Phillips-Perron Unit Root Test
data:  x 
Dickey-Fuller = -30.649, Truncation lag parameter = 7, p-value = 0.01

> kpss.test(b$V1)

  KPSS Test for Level Stationarity
  data:  b$V1 
  KPSS Level = 0.0333, Truncation lag parameter = 3, p-value = 0.1

Warning message:
In kpss.test(b$V1) : p-value greater than printed p-value
> adf.test(x)

    Augmented Dickey-Fuller Test

data:  x 
Dickey-Fuller = -9.6825, Lag order = 9, p-value = 0.01
alternative hypothesis: stationary

Warning message:
In adf.test(x) : p-value smaller than printed p-value

मैं हजारों समय श्रृंखला के साथ काम कर रहा हूं, कृपया मुझे बताएं कि समय श्रृंखला की स्टेशनरी के बारे में मात्रात्मक जांच कैसे करें।

जवाबों:


22

यदि एक श्रृंखला स्थिर बनाम गैर-स्थिर है तो परीक्षण की आवश्यकता है कि आप वैकल्पिक परिकल्पना के अनुक्रम पर विचार करें। प्रत्येक सूची के लिए एक गाऊसी अनुमान। किसी को यह समझना होगा कि गॉसियन असूशंस सभी त्रुटि प्रक्रिया के बारे में हैं और मूल्यांकन के तहत देखी गई श्रृंखला से कोई लेना-देना नहीं है। जैसा कि StasK द्वारा सही ढंग से संक्षेपित किया गया है, इसमें स्थिरता का उल्लंघन शामिल हो सकता है, जैसे समय के साथ परिवर्तन, परिवर्तन, परिवर्तन, मॉडल के मापदंडों में परिवर्तन। उदाहरण के लिए, मूल्यों का एक ऊपर की ओर ट्रेंडिंग सेट एक श्रृंखला का एक प्रथम उदाहरण होगा जो वाई में स्थिर नहीं था, जबकि एक उपयुक्त मॉडल से अवशेषों को एक निरंतर मतलब होने के रूप में वर्णित किया जा सकता है। इस प्रकार मूल श्रृंखला इस अर्थ में गैर-स्थिर है लेकिन अवशिष्ट श्रृंखला अपने अर्थ में स्थिर है। यदि पल्स, लेवल शिफ्ट्स, सीज़नल पल्सेस और / या लोकल टाइम ट्रेंड्स जैसी अवशिष्ट श्रृंखला में अनियोजित माध्य उल्लंघन हैं तो अवशिष्ट श्रृंखला (अनुपचारित) को इस अर्थ में गैर-स्थिर होने की विशेषता दी जा सकती है जबकि सूचक चर की एक श्रृंखला हो सकती है आसानी से पता चला और मॉडल में शामिल करने के लिए मॉडल अवशेषों को स्थिर करने के लिए माध्य में स्थिर किया। अब अगर मूल श्रृंखला का विचरण गैर-स्थिर विचरण प्रदर्शित करता है, तो एक त्रुटि प्रक्रिया को स्थिर करने के लिए फ़िल्टर / मॉडल को स्थिर करना काफी उचित है जिसमें निरंतर विचरण होता है। इसी प्रकार एक मॉडल के अवशेषों में गैर-निरंतर विचरण हो सकता है, जिसमें से तीन संभावित उपचारों की आवश्यकता होती है - मौसमी दालों और / या स्थानीय समय के रुझानों में अवशिष्ट श्रृंखला (अनुपचारित) को इस अर्थ में गैर-स्थिर होने की विशेषता दी जा सकती है, जबकि मॉडल के अवशेषों को स्थिर करने के लिए संकेतक चर की एक श्रृंखला को आसानी से पता लगाया और मॉडल में शामिल किया जा सकता है। । अब अगर मूल श्रृंखला का विचरण गैर-स्थिर विचरण प्रदर्शित करता है, तो एक त्रुटि प्रक्रिया को स्थिर करने के लिए फ़िल्टर / मॉडल को स्थिर करना काफी उचित है जिसमें निरंतर विचरण होता है। इसी प्रकार एक मॉडल के अवशेषों में गैर-निरंतर विचरण हो सकता है, जिसमें से तीन संभावित उपचारों की आवश्यकता होती है - मौसमी दालों और / या स्थानीय समय के रुझानों में अवशिष्ट श्रृंखला (अनुपचारित) को इस अर्थ में गैर-स्थिर होने की विशेषता दी जा सकती है, जबकि मॉडल के अवशेषों को स्थिर करने के लिए संकेतक चर की एक श्रृंखला को आसानी से पता लगाया और मॉडल में शामिल किया जा सकता है। । अब अगर मूल श्रृंखला का विचरण गैर-स्थिर विचरण प्रदर्शित करता है, तो एक त्रुटि प्रक्रिया को स्थिर करने के लिए फ़िल्टर / मॉडल को स्थिर करना काफी उचित है जिसमें निरंतर विचरण होता है। इसी प्रकार एक मॉडल के अवशेषों में गैर-निरंतर विचरण हो सकता है, जिसमें से तीन संभावित उपचारों की आवश्यकता होती है - अब अगर मूल श्रृंखला का विचरण गैर-स्थिर विचरण प्रदर्शित करता है, तो एक त्रुटि प्रक्रिया को स्थिर करने के लिए फ़िल्टर / मॉडल को स्थिर करना काफी उचित है जिसमें निरंतर विचरण होता है। इसी प्रकार एक मॉडल के अवशेषों में गैर-निरंतर विचरण हो सकता है, जिसमें से तीन संभावित उपचारों की आवश्यकता होती है - अब अगर मूल श्रृंखला का विचरण गैर-स्थिर विचरण प्रदर्शित करता है, तो एक त्रुटि प्रक्रिया को स्थिर करने के लिए फ़िल्टर / मॉडल को स्थिर करना काफी उचित है जिसमें निरंतर विचरण होता है। इसी प्रकार एक मॉडल के अवशेषों में गैर-निरंतर विचरण हो सकता है, जिसमें से तीन संभावित उपचारों की आवश्यकता होती है -

  1. भारित कम से कम वर्ग (मोटे तौर पर कुछ विश्लेषकों द्वारा अनदेखी)
  2. एक बॉक्स-कॉक्स परीक्षण और / या के माध्यम से पहचाने जाने वाली त्रुटियों के विचरण से अपेक्षित मूल्य को कम करने के लिए एक बिजली परिवर्तन
  3. स्क्वेअर अवशिष्ट में स्पष्ट एक ARIMA संरचना के लिए एक GARCH मॉडल की आवश्यकता है। यदि समय के साथ पैरामीटर बदलते हैं या मॉडल का रूप समय के साथ बदलता है, तो किसी को इस विशेषता का पता लगाने की आवश्यकता होती है और इसे डेटा विभाजन या TAR दृष्टिकोण ए ला टोंग के उपयोग के साथ हटा दिया जाता है।

34

स्टेशनरी का मतलब है कि प्रक्रिया का सीमांत वितरण समय के साथ नहीं बदलता है। एक कमजोर रूप बताता है कि माध्य और विचरण समय के साथ समान रहते हैं। जो कुछ भी इसका उल्लंघन करता है, उसे मूर्खतापूर्ण कारणों से गैर-स्थिर माना जाएगा। उदाहरण के लिए, एक नियतात्मक गैर-स्थिर है, क्योंकि इसका अर्थ बदलता रहता है, हालांकि इसके चेहरे पर, यह एक बहुत ही सरल और पूर्वानुमानित प्रक्रिया है।yटी=पापटी

आपके द्वारा विचार किए जा रहे सभी परीक्षण एक विशिष्ट विकल्प को ध्यान में रखते हैं: एक यादृच्छिक चलना प्रक्रिया या इसके कुछ आसान संशोधन (जैसे, अतिरिक्त lags ,

yटी=yटी-1+εटी
yटी-2yटी-3छोटे गुणांक के साथ)। यह एक कुशल वित्तीय बाजार का एक सरल मॉडल है, जहां कीमतों में भविष्य के परिवर्तनों की भविष्यवाणी करने के लिए किसी भी जानकारी का उपयोग नहीं किया जा सकता है। अधिकांश अर्थशास्त्री ARIMA मॉडल से आने वाले समय श्रृंखला के बारे में सोचते हैं; जब सामान होता है (महीने, तिमाही, या वर्ष), तो ये समय श्रृंखला अच्छी तरह से परिभाषित अवधि होती है, इसलिए यह शायद ही कभी उनके लिए एकीकृत समय श्रृंखला से भी बदतर हो जाता है। इसलिए इन परीक्षणों को स्थिरता के अधिक जटिल उल्लंघन के लिए डिज़ाइन नहीं किया गया है, जैसे कि परिवर्तन, विचरण परिवर्तन, ऑटोरेग्रेसिव गुणांक आदि में परिवर्तन, हालांकि इन प्रभावों के परीक्षण स्पष्ट रूप से विकसित किए गए हैं।

इंजीनियरिंग या प्राकृतिक विज्ञानों में, आप अधिक जटिल मुद्दों के साथ समय श्रृंखला का सामना करने की अधिक संभावना रखते हैं, जैसे लंबी दूरी की निर्भरता, आंशिक एकीकरण, गुलाबी शोर, आदि। विशिष्ट समय के पैमाने के बारे में प्रक्रिया के विवरण से स्पष्ट मार्गदर्शन की कमी के साथ ( जलवायु परिवर्तन कितनी बार होता है?), यह आमतौर पर आवृत्ति डोमेन में डेटा का विश्लेषण करने के लिए और अधिक समझ में आता है (जबकि अर्थशास्त्रियों के लिए, आवृत्ति डोमेन काफी स्पष्ट है: वार्षिक मौसमी चक्र हैं, साथ ही 3-4-5 साल के व्यापार चक्र भी हैं ; कुछ आश्चर्य अन्यथा हो सकते हैं)।

इसलिए मूल रूप से मैंने आपको बताया कि आप ऐसा क्यों नहीं करना चाहते हैं जो आप करने के लिए तैयार हैं। यदि आपको समय श्रृंखला समझ में नहीं आती है, तो आप किसी ऐसे व्यक्ति को खोजने से बेहतर होंगे जो परामर्श शुल्क का भुगतान करता हो, बल्कि आपके प्रोजेक्ट को खराब कर दिया हो क्योंकि आपने कुछ मूर्खतापूर्ण किया है। कहा कि, आपकी समस्या का समाधान औपचारिक जब, एक निर्दिष्ट श्रृंखला के लिए, कम से कम एक परीक्षण एक है एक स्थिर श्रृंखला के शून्य परिकल्पना को अस्वीकार करने के लिए किया जाएगा -value नीचे जहां की कुल संख्या है श्रृंखला, उन पर आपके द्वारा किए जाने वाले परीक्षणों की संख्या है, पसंदीदा 5% महत्व का स्तर है, और संपूर्ण अभिव्यक्ति को कई परीक्षण के लिए बोन्फ्रॉनी सुधार के रूप में जाना जाता है। आउटपुट नहीं दिखाता हैपी0.05/(3एम)एम30.05पीपर्याप्त सटीकता के साथ-साथ, इसलिए आपको उन्हें लौटे वर्ग के सदस्यों के रूप में खींचने की आवश्यकता होगी, जैसे कि pp.test(x)$p.value। आप इसे वैसे भी चक्र में कर रहे होंगे, इसलिए यदि आप सभी आउटपुट को दबा देते हैं, तो यह संभवतः पर्याप्त होगा, और केवल चर का नाम (ओं) का उत्पादन करते हैं जो स्थिरता को विफल करते हैं।


4

समय श्रृंखला स्थिर होती है यदि इसका माध्य स्तर और भिन्नता समय के साथ स्थिर रहती है। आप इस विषय पर (आर में प्रासंगिक परीक्षणों के विनिर्देशन के साथ), हमारी पोस्ट में अधिक पढ़ सकते हैं .. http://www.statosphere.com.au/check-time-series-stationary-r/


1
देर से टिप्पणी, लेकिन आपका क्या मतलब है कि माध्य और विचरण समय के साथ स्थिर रहते हैं? डेटा के दिए गए सेट के लिए माध्य और भिन्नता वे क्या हैं, सही है? या क्या आपका मतलब है कि डेटा के सभी सबसेट का मतलब / संस्करण समान होना चाहिए?
एरिक वेस्टरलुंड

2
मैंने लिंक किए गए पृष्ठ पर एक नज़र डाली। ऐसा कहा जाता है कि "द लजंग-बॉक्स परीक्षण इस बात की जांच करता है कि क्या केज 1-20 पर गैर-शून्य सहसंबंध के लिए महत्वपूर्ण सबूत हैं। छोटे पी-मान (यानी, 0.05 से कम) का सुझाव है कि श्रृंखला स्थिर है।" निष्कर्ष स्पष्ट गलत है। अशक्त यह है कि प्रेक्षण आईआईडी हैं। एक छोटे पी-मूल्य के आधार पर नल को अस्वीकार करना केवल यह दर्शाता है कि कम से कम एक महत्वपूर्ण अंतराल है। वेबसाइट पर निष्कर्ष का मतलब होगा, उस स्थिरता को कम से कम एक अंतराल के लिए महत्वपूर्ण स्वत :संबंध की आवश्यकता होती है। और यह सच नहीं है।
random_guy
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.