अच्छा उदाहरण जहां एक यूनिट रूट के बिना एक श्रृंखला गैर स्थिर है?


18

मैंने कई बार देखा है कि लोग संवर्धित डिकी-फुलर परीक्षण में अशक्तता को अस्वीकार करते हैं , और फिर दावा करते हैं कि यह दिखाता है कि उनकी श्रृंखला स्थिर है (दुर्भाग्य से, मैं इन दावों के स्रोत नहीं दिखा सकता, लेकिन मुझे लगता है कि इसी तरह के दावे यहां और वहां मौजूद हैं। एक या दूसरी पत्रिका)।

मैं तर्क देता हूं कि यह गलतफहमी है (एक इकाई जड़ की अशक्तता की अस्वीकृति जरूरी नहीं है कि एक स्थिर श्रृंखला होने के रूप में, विशेष रूप से चूंकि गैर-प्रत्यक्षता के वैकल्पिक रूपों की शायद ही कभी जांच की जाती है या इस तरह के परीक्षण किए जाने पर भी विचार किया जाता है)।

जो मैं चाहता हूं वह है:

a) दावे के लिए एक अच्छा स्पष्ट प्रतिधारण (मैं अभी एक जोड़े की कल्पना कर सकता हूं लेकिन मुझे यकीन है कि मेरे अलावा किसी और के पास मेरे दिमाग में कुछ बेहतर होगा)। यह एक विशिष्ट स्थिति का वर्णन हो सकता है, शायद डेटा के साथ (सिम्युलेटेड या वास्तविक; दोनों के अपने फायदे हैं); या

ख) एक ठोस तर्क में अस्वीकृति का तर्क क्यों एक स्थिर डिकी-फुलर को स्थिरता की स्थापना के रूप में देखा जाना चाहिए

(या यहां तक ​​कि दोनों) और (बी) यदि आप चालाक महसूस कर रहे हैं)


3
Xn=(1)n प्रायिकता के साथ 1.
कार्डिनल

@कार्डिनल वेल, जो निश्चित रूप से एडीएफ परीक्षण द्वारा एक अस्वीकृति प्राप्त करेगा (संपादित करें: हां, यह करता है), और यह स्पष्ट रूप से गैर-प्राथमिक है (यूनिट सर्कल पर एक जड़, लेकिन 1 एडीआर के बराबर कोई रूट नहीं है जो एडीएफ का पता लगाता है); ताकि गिनती होगी।
Glen_b -Reinstate मोनिका

ध्यान दें कि ADF परीक्षण के वेरिएंट हैं जहां प्रवृत्ति शामिल है। यदि नल खारिज कर दिया गया है, तो प्रवृत्ति को हटाए जाने पर श्रृंखला को स्थिर-स्थिर, यानी स्थिर है, लेकिन स्थिर नहीं है।
mpiktas

+1। Glen_b, क्या एक रेखीय प्रवृत्ति + स्थिर एआर (1) एक काउंटर-उदाहरण के रूप में शोर की गिनती होगी?
अमीबा का कहना है कि मोनिका

जवाबों:


15

यहां एक गैर-स्थिर श्रृंखला का एक उदाहरण है जो एक सफेद शोर परीक्षण का भी पता नहीं लगा सकता है (अकेले एक डिकी-फुलर परीक्षण परीक्षण दें):

this is not white noise

हां, यह आश्चर्यजनक हो सकता है लेकिन यह सफेद शोर नहीं है

अधिकांश गैर-स्थिर काउंटर उदाहरण स्थिर की पहली दो स्थितियों के उल्लंघन पर आधारित होते हैं: नियतात्मक रुझान (गैर-स्थिर माध्य) या यूनिट रूट / हेटेरोसेडैस्टिक समय श्रृंखला (गैर-स्थिर विचरण)। हालांकि, आपके पास गैर-स्थिर प्रक्रियाएं भी हो सकती हैं जिनके निरंतर मतलब और विचरण होते हैं, लेकिन वे तीसरी शर्त का उल्लंघन करते हैं: ऑटोकॉवेरियन फ़ंक्शन (ACVF) समय के साथ स्थिर होना चाहिए और एक फ़ंक्शन | s - t | केवल।cov(xs,xt)|st|

उपरोक्त समय श्रृंखला ऐसी श्रृंखला का एक उदाहरण है, जिसमें शून्य माध्य, इकाई विचरण है, लेकिन ACVF समय पर निर्भर करता है। अधिक सटीक रूप से, ऊपर दी गई प्रक्रिया स्थानीय स्तर पर स्थिर एमए (1) प्रक्रिया है, जिसमें ऐसे मानक होते हैं कि यह सफेद शोर बन जाता है (नीचे संदर्भ देखें): एमए प्रक्रिया का पैरामीटर परिवर्तनों पर समयxt=εt+θ1εt1

θ1(u)=0.51u,

जहां सामान्यीकृत समय है। इसका कारण सफेद शोर जैसा लगता है (भले ही गणितीय परिभाषा द्वारा यह स्पष्ट रूप से नहीं है), यह है कि समय बदलती ACVF समय के साथ शून्य से एकीकृत होती है। चूँकि नमूना ACVF औसत ACVF में परिवर्तित होता है, इसका मतलब है कि नमूना autocovariance (और autocorrelation (ACF)) एक फ़ंक्शन को परिवर्तित करेगा जो सफेद शोर जैसा दिखता है। तो भी एक Ljung- बॉक्स परीक्षण इस गैर-स्थिरता का पता लगाने में सक्षम नहीं होगा। स्थानीय स्तर पर स्थिर विकल्पों के खिलाफ सफेद शोर के लिए परीक्षण पर कागज (अस्वीकरण: मैं लेखक हूं) ऐसी स्थानीय स्टेशनरी प्रक्रियाओं से निपटने के लिए बॉक्स परीक्षणों का विस्तार प्रस्तावित करता है।u=t/T

अधिक आर कोड और अधिक विवरण के लिए इस ब्लॉग पोस्ट को भी देखें ।

Mpiktas टिप्पणी के बाद अपडेट करें :

यह सच है कि यह सिर्फ एक सैद्धांतिक रूप से दिलचस्प मामले की तरह लग सकता है जो व्यवहार में नहीं देखा गया है। मैं मानता हूं कि वास्तविक दुनिया के डेटासेट में प्रत्यक्ष रूप से इस तरह के सफेद शोर को देखने की संभावना नहीं है, लेकिन आप इसे स्थिर मॉडल के लगभग किसी भी अवशेष में देखेंगे। बहुत ज्यादा सैद्धांतिक विस्तार में जाने के बिना, सिर्फ एक सामान्य समय-अलग मॉडल की कल्पना एक समय बदलती सहप्रसरण समारोह के साथ गामा θ ( कश्मीर , यू ) । आप एक निरंतर मॉडल फिट हैं θ , तो यह अनुमान सही मॉडल के समय औसत के करीब होगा θ ( यू ) ; और स्वाभाविक रूप से अवशेष अब करीब होंगेθ(u)γθ(k,u)θ^θ(u) , जो के निर्माण से θ शून्य (लगभग) के लिए बाहर एकीकरण करेगा। विवरण के लिए Goerg (2012) देखें।θ(u)θ^θ^

आइए एक उदाहरण देखें

library(fracdiff)
library(data.table)

tree.ring <- ts(fread(file.path(data.path, "tree-rings.txt"))[, V1])
layout(matrix(1:4, ncol = 2))
plot(tree.ring)
acf(tree.ring)
mod.arfima <- fracdiff(tree.ring)
mod.arfima$d


## [1] 0.236507

इसलिए हम पैरामीटर के साथ आंशिक शोर फिट = 0.23 (के बाद से < 0.5 हम लगता है कि सब कुछ ठीक है और हम एक स्थिर मॉडल है)। चलो अवशेषों की जाँच करें:d^=0.23d^<0.5

arfima.res <- diffseries(tree.ring, mod.arfima$d)
plot(arfima.res)
acf(arfima.res)

time series and acf plot

अच्छा लग रहा है ना? खैर, मुद्दा यह है कि अवशिष्ट सफेद सफेद शोर हैं । मुझे कैसे पता चलेगा? पहले, मैं इसका परीक्षण कर सकता हूं

Box.test(arfima.res, type = "Ljung-Box")
## 
##  Box-Ljung test
## 
## data:  arfima.res
## X-squared = 1.8757, df = 1, p-value = 0.1708

Box.test.ls(arfima.res, K = 4, type = "Ljung-Box")
## 
##  LS Ljung-Box test; Number of windows = 4; non-overlapping window
##  size = 497
## 
## data:  arfima.res
## X-squared = 39.361, df = 4, p-value = 5.867e-08

और दूसरा, हम साहित्य से जानते हैं कि ट्री रिंग डेटा वास्तव में स्थानीय रूप से स्थिर आंशिक शोर है: गोर्ग (2012) और फरेरा, ओलिया और पाल्मा (2013) देखें

इससे पता चलता है कि मेरा - माना - सैद्धांतिक रूप से उदाहरण, वास्तव में सबसे वास्तविक दुनिया उदाहरणों में घटित हो रहा है।


+1, बहुत अच्छा उदाहरण! मुझे दिलचस्पी है हालांकि इस तरह की श्रृंखला के कोई वास्तविक जीवन उदाहरण हैं?
एमपिकटस

@mpiktas मैंने पोस्ट में एक अपडेट जोड़ा है जो आपके प्रश्न का उत्तर देना चाहिए।
जॉर्ज एम। गोर्ग

γ1(u)=θ(u)σ(u)σ(u1/T)θ(u)γ^101θ(u)du=001θ(u)σ2(u)du=0σ(यू)θ(यू)εटी

आपके दिए गए उदाहरण में कहा गया है कि जब हमारे पास समय-बदलती मॉडल होता है, तो गैर-समय बदलती मॉडल को फिट करने से गलत अनुमान लगाया जा सकता है। लेकिन यह कहने से बहुत दूर है कि प्रत्येक वास्तविक समय श्रृंखला को समय-भिन्न मॉडल के साथ मॉडल किया जा सकता है। दूसरी ओर आपके परीक्षण को समय-भिन्नता की उपस्थिति के लिए परीक्षण के लिए लागू किया जा सकता है। एक दिलचस्प अंतर्दृष्टि के लिए फिर से धन्यवाद।
mpiktas

σ(u)20.5T

7

उदाहरण 1

एक मजबूत नकारात्मक एमए घटक के साथ यूनिट-रूट प्रक्रियाओं को नाममात्र एक (जैसे , श्वर्ट, जेबीईएस 1989 ) की तुलना में अनुभवजन्य आकार के साथ एडीएफ परीक्षणों का नेतृत्व करने के लिए जाना जाता है ।

Yt=Yt1+ϵt+θϵt1,
θ1

T(ρ^1)

library(urca)
reps <- 1000
n <- 100
rejections <- matrix(NA,nrow=reps)

for (i in 1:reps){
  y <- cumsum(arima.sim(n = n, list(ma = -0.98)))
  rejections[i] <- (summary(ur.df(y, type = "drift", selectlags="Fixed",lags=12*(n/100)^.25))@teststat[1] < -2.89)
}
mean(rejections)

उदाहरण 2

Yt

परिवर्तन के प्रकार के आधार पर, ADF परीक्षण अभी भी अक्सर अस्वीकार करेगा। नीचे दिए गए मेरे उदाहरण में, हमारे पास एक नीचे की ओर विचरण है, जो परीक्षण को "विश्वास" करता है कि श्रृंखला परिवर्तित हो जाती है, जिससे एक यूनिट रूट की अशक्तता को खारिज कर दिया जाता है।

library(urca)
reps <- 1000
n <- 100
rejections <- matrix(NA,nrow=reps)

for (i in 1:reps){
  u_1 <- rnorm(n/2,sd=5)
  u_2 <- rnorm(n/2,sd=1)
  u <- c(u_1,u_2)
  y <- arima.sim(n=n,list(ar = 0.8),innov=u)
  rejections[i] <- (summary(ur.df(y, type = "drift"))@teststat[1] < -2.89)      
}
mean(rejections)

(एक तरफ के रूप में, ADF परीक्षण बिना शर्त हेट्रोसेकेडसिटी की उपस्थिति में अपने महत्वपूर्ण स्पर्शोन्मुख नल वितरण को खो देता है।)


@Glen_b, कि (मुझे आशा है) आपके पहले पैराग्राफ का उत्तर हो सकता है, लेकिन वास्तव में आपके प्रश्न के शीर्षक तक नहीं है - क्या मेरी ओर से कोई विसंगति या समझ की कमी है?
बजे क्रिस्टोफ़ हैनक

"दैट = उदाहरण 1
क्रिस्टोफ़ हैनक

यह इस बात पर निर्भर करता है कि "यूनिट रूट" क्या है। मैंने मूल रूप से इसे "यूनिट सर्कल पर रूट" (मापांक 1 की एक जड़) के रूप में सीखा था, लेकिन अब ऐसा प्रतीत होता है (और ADF परीक्षण के संदर्भ में) वास्तव में 1 के बराबर की विशेषता बहुपद की जड़ है । यहां तक ​​कि अगर मुझे शीर्षक में गलत समझ है, तो आपका उत्तर इच्छित प्रश्न का जवाब देता है, इसलिए सोचें कि यह ठीक है।
Glen_b -Reinstate मोनिका

मेरी बात शायद स्पष्ट रूप से सही नहीं है: शीर्षक में आप "बिना यूनिट रूट के" श्रृंखला के उदाहरणों की तलाश करते हैं, जबकि पहला पैराग्राफ (मेरे लिए) उन उदाहरणों की तलाश में लगता है जिनमें अस्वीकार करना गलत है। मेरा पहला उदाहरण बाद के मामले के लिए एक है, जिसमें एडीएफ को अस्वीकार करने की संभावना है, हालांकि प्रक्रिया में एक इकाई जड़ है।
बजे क्रिस्टोफ हनक

आह, माफ करना, मैं इसके बारे में ठीक से नहीं सोच रहा था। हां, कड़ाई से यह शीर्षक की व्याख्या के अनुरूप नहीं है, लेकिन यह अभी भी शरीर में व्यापक सवाल का जवाब देता है। (टाइटल आवश्यक रूप से कम बारीक होते हैं, इसलिए यह कोई समस्या नहीं है।) ... मुझे लगता है कि यह एक बहुत ही दिलचस्प जवाब है, और अगर कुछ भी मेरे वास्तविक उद्देश्य से बेहतर है कि शीर्षक क्या मांगता है।
Glen_b -Reinstate मोनिका

7

यूनिट रूट परीक्षण काफी मुश्किल है। एक परीक्षण का उपयोग करना आमतौर पर पर्याप्त नहीं होता है और आपको उन सटीक मान्यताओं के बारे में सावधान रहना चाहिए जो परीक्षण का उपयोग कर रहा है।

जिस तरह से ADF का निर्माण किया गया है, यह एक श्रृंखला के लिए संवेदनशील बनाता है जो कि जोड़ा गया सफेद शोर के साथ सरल गैर-रैखिक रुझान हैं। यहाँ एक उदाहरण है:

library(dplyr)
library(tseries)
set.seed(1000)
oo <- 1:1000  %>% lapply(function(n)adf.test(exp(seq(0, 2, by = 0.01)) + rnorm(201)))
pp <- oo %>% sapply("[[","p.value")

> sum(pp < 0.05)
[1] 680

यहां हमारे पास घातीय प्रवृत्ति है और हम देखते हैं कि एडीएफ काफी खराब प्रदर्शन करता है। यह समय के 30% इकाई रूट की अशक्तता को स्वीकार करता है और इसे 70% समय को अस्वीकार करता है।

आमतौर पर किसी भी विश्लेषण का परिणाम यह दावा नहीं करना है कि श्रृंखला स्थिर है या नहीं। यदि विश्लेषण में उपयोग की जाने वाली विधियों को स्थिरता की आवश्यकता होती है, तो गलत धारणा यह है कि श्रृंखला स्थिर होती है जब यह वास्तव में नहीं होती है, आमतौर पर किसी न किसी तरह से प्रकट होती है। इसलिए मैं व्यक्तिगत रूप से पूरे विश्लेषण को देखता हूं, न केवल इकाई रूट परीक्षण भाग। उदाहरण के लिए, ओएलएस और एनएलएस गैर-स्थिर डेटा के लिए ठीक काम करता है, जहां गैर-स्थिरता का मतलब है, अर्थात प्रवृत्ति। इसलिए यदि कोई गलत तरीके से दावा करता है कि श्रृंखला स्थिर है और ओएलएस / एनएलएस लागू करता है, तो यह दावा प्रासंगिक नहीं हो सकता है।


1
(+1) सिमुलेशन में लूप से बचने के लिए न केवल, बल्कि स्वच्छ तरीके से भी! ऐसा नहीं है कि यह समग्र निष्कर्ष के लिए मायने रखता है, लेकिन लगता है: 1000 में से 320 स्वीकार किए जाते हैं (पी>0.05), नहीं?
क्रिस्टोफ हनक

आह हां, मैंने संकेतों को भ्रमित किया। मैंने उसी हिसाब से जवाब तय किया। ध्यान देने के लिए धन्यवाद!
एमपिकटास

आपने उपयोग क्यों नहीं किया sapply(oo, "[[","p.value")?
जर्मनी

वैसे मैंने इसका इस्तेमाल किया, केवल पाइप सिंटैक्स के साथ। मुझे पाइप पसंद है :)
mpiktas 15

1
मुझे भी बहुत पसंद है। इस कोड के लिए यह अनावश्यक है, लोडिंग मैग्रीट पर्याप्त है।
mpiktas
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.