आर के ur.df (डिकी-फुलर यूनिट रूट टेस्ट) की व्याख्या करना


12

मैं पैकेज ur.df()में फ़ंक्शन का उपयोग करके समय श्रृंखला पर निम्नलिखित यूनिट रूट टेस्ट (डिक्की-फुलर) चला रहा हूं urca

आदेश है:

summary(ur.df(d.Aus, type = "drift", 6))

आउटपुट है:

############################################### 
# Augmented Dickey-Fuller Test Unit Root Test # 
############################################### 

Test regression drift 


Call:
lm(formula = z.diff ~ z.lag.1 + 1 + z.diff.lag)

Residuals:
      Min        1Q    Median        3Q       Max 
-0.266372 -0.036882 -0.002716  0.036644  0.230738 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)   
(Intercept)  0.001114   0.003238   0.344  0.73089   
z.lag.1     -0.010656   0.006080  -1.753  0.08031 . 
z.diff.lag1  0.071471   0.044908   1.592  0.11214   
z.diff.lag2  0.086806   0.044714   1.941  0.05279 . 
z.diff.lag3  0.029537   0.044781   0.660  0.50983   
z.diff.lag4  0.056348   0.044792   1.258  0.20899   
z.diff.lag5  0.119487   0.044949   2.658  0.00811 **
z.diff.lag6 -0.082519   0.045237  -1.824  0.06874 . 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 

Residual standard error: 0.06636 on 491 degrees of freedom
Multiple R-squared: 0.04211,    Adjusted R-squared: 0.02845 
F-statistic: 3.083 on 7 and 491 DF,  p-value: 0.003445 


Value of test-statistic is: -1.7525 1.6091 

Critical values for test statistics: 
      1pct  5pct 10pct
tau2 -3.43 -2.86 -2.57
phi1  6.43  4.59  3.78
  1. महत्व कोड (Signif। कोड) का क्या अर्थ है? मैंने देखा कि उनमें से कुछ जहां के खिलाफ लिखा था: z.lag.1, z.diff.lag.2, z.diff.lag.3 ("।" महत्व कोड) और z.diff.lag.5 (" ** (महत्व कोड)।

  2. आउटपुट मुझे टेस्ट स्टेटिस्टिक के दो (2) मान देता है: -1.7525 और 1.6091। मुझे पता है कि ADF परीक्षण आँकड़ा पहले वाला (यानी -1.7525) है। फिर दूसरा क्या है?

  3. अंत में, 95% महत्व स्तर पर यूनिट रूट के लिए परिकल्पना का परीक्षण करने के लिए, मुझे अपने एडीएफ टेस्ट स्टेटिस्टिक (यानी -1.7525) की तुलना एक महत्वपूर्ण मूल्य से करने की आवश्यकता है, जिसे मैं सामान्य रूप से एक तालिका से प्राप्त करता हूं। यहाँ आउटपुट मुझे आलोचनात्मक मूल्यों के माध्यम से दे रहा है। हालांकि, सवाल यह है: "ताऊ 2" और "फी 1" के बीच कौन से महत्वपूर्ण मूल्य का उपयोग करना चाहिए।

आपकी प्रतिक्रिया के लिए धन्यवाद।


1 - सिग्निफ़ कोड स्पष्ट होना चाहिए ... लैग में डबल स्टार है इसलिए यह p = 0.01 2- है जो अलग-अलग H0s का परीक्षण करते हैं: "कोई नहीं" या "बहाव" या "प्रवृत्ति" 3- महत्वपूर्ण मान, फिर से, एक ही बात, पर निर्भर करता है जिस पर आप H0 विचार करना चाहते हैं
संयुक्त_प

@joint_p मुझे खेद है, लेकिन मैं केवल एक शुरुआत हूं। आपके उत्तर बहुत सीधे-सीधे थे। क्या आपने जो कहा, उस पर अधिक विस्तार से बता सकते हैं? मुझे वास्तव में इसकी प्रशंसा करनी होगी। धन्यवाद।
SavedByJESUS

amazon.com/Analysis-Ingrgrated-Cointegrated-Time-Use/dp/… यह एक बहुत अच्छी पुस्तक है, मैं इसके साथ अध्ययन करता था
संयुक्त_प

जवाबों:


17

ऐसा लगता है कि इस विशेष आर कमांड के रचनाकारों का मानना ​​है कि मूल डिकी-फुलर सूत्रों से परिचित है, इसलिए मूल्यों की व्याख्या करने के लिए प्रासंगिक दस्तावेज प्रदान नहीं किया। मैंने पाया कि एंडर्स एक अविश्वसनीय रूप से सहायक संसाधन था (एप्लाइड इकॉनोमेट्रिक टाइम सीरीज़ 3e, 2010, पी। 206-209 - मुझे लगता है कि अन्य संस्करण भी ठीक होंगे)। नीचे मैं एक उदाहरण के रूप में डेनमार्क में URCA पैकेज, वास्तविक आय के डेटा का उपयोग करूंगा।

> income <- ts(denmark$LRY)

यह सबसे पहले उन 3 अलग-अलग फॉर्मूलों का वर्णन करने के लिए उपयोगी हो सकता है, जिनका इस्तेमाल डिक्की-फुलर ने अलग-अलग परिकल्पनाओं के लिए किया था, क्योंकि ये ur.df "प्रकार" विकल्पों से मेल खाते हैं। एंडर्स निर्दिष्ट करता है कि इन सभी 3 मामलों में, उपयोग किया गया सुसंगत शब्द गामा है, y के पिछले मान के लिए गुणांक है, अंतराल शब्द। यदि गामा = 0, तो एक यूनिट रूट (रैंडम वॉक, नॉनसेंटरी) है। जहां अशक्त परिकल्पना गामा = 0 है, यदि p <0.05, तो हम अशक्त (95% स्तर पर) को अस्वीकार करते हैं, और मान लें कि कोई इकाई जड़ नहीं है। यदि हम अशक्त (p> 0.05) को अस्वीकार करने में विफल रहते हैं तो हम मान लेते हैं कि एक इकाई जड़ मौजूद है। यहाँ से, हम ताऊ और फी की व्याख्या करने के लिए आगे बढ़ सकते हैं।

1) टाइप करें = "कोई नहीं": (एंडर्स p से सूत्र। 208)।Δy(टी)=γ*y(टी-1)+(टी)

(जहाँ त्रुटि शब्द है, सफेद शोर माना जाता है; from ; पिछले को संदर्भित करता है; y का मान, तो अंतराल अवधि है)(टी)γ=-1y=*y(टी-1)+(टी)y(टी-1)

प्रकार के लिए = "कोई नहीं," ताऊ (या आर आउटपुट में tau1) गामा के लिए अशक्त परिकल्पना है। 0. डेनमार्क आय उदाहरण का उपयोग करते हुए, मुझे "टेस्ट-स्टेटिस्टिक का मान 0.7944 है" और परीक्षण आँकड़ों के लिए महत्वपूर्ण मान हैं। : tau1 -2.6 -1.95 -1.61। यह देखते हुए कि परीक्षण आँकड़ा सभी 3 क्षेत्रों (1%, 5%, 10%) के भीतर है जहाँ हम अशक्त को अस्वीकार करने में विफल रहते हैं, हमें यह मान लेना चाहिए कि डेटा एक यादृच्छिक चलना है, अर्थात एक यूनिट रूट मौजूद है। इस मामले में, tau1 गामा = 0 परिकल्पना को संदर्भित करता है। "z.lag1" गामा शब्द है, अंतराल शब्द (y (t-1)) के लिए गुणांक, जो p = है 0.431, जिसे हम महत्वपूर्ण के रूप में अस्वीकार करने में विफल रहते हैं, बस यह अर्थ है कि गामा इस मॉडल के लिए सांख्यिकीय रूप से महत्वपूर्ण नहीं है। यहां आर के लिए आउटपुट है।

> summary(ur.df(y=income, type = "none",lags=1))
> 
> ############################################### 
> # Augmented Dickey-Fuller Test Unit Root Test # 
> ############################################### 
> 
> Test regression none 
> 
> 
> Call:
> lm(formula = z.diff ~ z.lag.1 - 1 + z.diff.lag)
> 
> Residuals:
>       Min        1Q    Median        3Q       Max 
> -0.044067 -0.016747 -0.006596  0.010305  0.085688 
> 
> Coefficients:
>             Estimate Std. Error t value Pr(>|t|)
> z.lag.1    0.0004636  0.0005836   0.794    0.431
> z.diff.lag 0.1724315  0.1362615   1.265    0.211
> 
> Residual standard error: 0.0251 on 51 degrees of freedom
> Multiple R-squared:  0.04696,   Adjusted R-squared:  0.009589 
> F-statistic: 1.257 on 2 and 51 DF,  p-value: 0.2933
> 
> 
> Value of test-statistic is: 0.7944 
> 
> Critical values for test statistics: 
>      1pct  5pct 10pct
> tau1 -2.6 -1.95 -1.61

Δy(टी)=0+γ*y(टी-1)+(टी)

γ=0γ=0
Phi1 शब्द दूसरी परिकल्पना को संदर्भित करता है, जो कि a0 = गामा = 0. की एक संयुक्त अशक्त परिकल्पना है। इसका मतलब है कि मूल्यों के BOTH का परीक्षण उसी समय 0 किया जाता है। यदि p <0.05 है, तो हम अशक्तता को अस्वीकार करते हैं, और मान लेते हैं कि इनमें से कोई एक असत्य है - अर्थात एक या दोनों पद a0 या गामा 0. नहीं हैं। इस अशक्त को अस्वीकार करने का अर्थ यह है कि दोनों का a0 और गामा = 0, 1) का अर्थ है कि गामा = 0 इसलिए एक इकाई जड़ मौजूद है, और 2) a0 = 0, इसलिए कोई बहाव शब्द नहीं है। यहाँ R आउटपुट है

> summary(ur.df(y=income, type = "drift",lags=1))
> 
> ############################################### 
> # Augmented Dickey-Fuller Test Unit Root Test # 
> ############################################### 
> 
> Test regression drift 
> 
> 
> Call:
> lm(formula = z.diff ~ z.lag.1 + 1 + z.diff.lag)
> 
> Residuals:
>       Min        1Q    Median        3Q       Max 
> -0.041910 -0.016484 -0.006994  0.013651  0.074920 
> 
> Coefficients:
>             Estimate Std. Error t value Pr(>|t|)
> (Intercept)  0.43453    0.28995   1.499    0.140
> z.lag.1     -0.07256    0.04873  -1.489    0.143
> z.diff.lag   0.22028    0.13836   1.592    0.118
> 
> Residual standard error: 0.0248 on 50 degrees of freedom
> Multiple R-squared:  0.07166,   Adjusted R-squared:  0.03452 
> F-statistic:  1.93 on 2 and 50 DF,  p-value: 0.1559
> 
> 
> Value of test-statistic is: -1.4891 1.4462 
> 
> Critical values for test statistics: 
>       1pct  5pct 10pct
> tau2 -3.51 -2.89 -2.58
> phi1  6.70  4.71  3.86

Δy(टी)=0+जी*y(टी-1)+2(टी)+(टी)

(जहाँ a2 (t) एक टाइम ट्रेंड टर्म है) The Hypotheses (Enders p। 208 से) इस प्रकार हैं: ताऊ: गामा = 0 phi3: गामा = a2 = 0 phi2: a0 = gam2 = 2 a2 = 0 यह समान है आर आउटपुट। इस मामले में, परीक्षण के आंकड़े -2.4216 2.1927 2.9343 हैं। इन सभी मामलों में, ये "शून्य को अस्वीकार करने में विफल" क्षेत्र के भीतर आते हैं (नीचे महत्वपूर्ण मान देखें)। ताऊ 3 का क्या अर्थ है, जैसा कि ऊपर है, यह है कि हम यूनिट रूट की अशक्तता को अस्वीकार करने में विफल रहते हैं, एक यूनिट रूट मौजूद है। फी 3 को अस्वीकार करने के लिए दो चीजों का अर्थ है: 1) गामा = 0 (यूनिट रूट) और 2) कोई समय प्रवृत्ति शब्द नहीं है, अर्थात, a2 = 0। यदि हमने इस अशक्तता को अस्वीकार कर दिया है, तो इसका अर्थ यह होगा कि इनमें से एक या दोनों शब्द 0. नहीं थे। phi2 को अस्वीकार करने के लिए 3 बातों का अर्थ है: 1) गामा = 0 और 2) कोई समय प्रवृत्ति अवधि और 3) कोई बहाव शब्द, अर्थात गामा = 0, वह a0 = 0, और वह a2 = 0।
यहाँ R आउटपुट है

> summary(ur.df(y=income, type = "trend",lags=1))
> 
> ############################################### 
> # Augmented Dickey-Fuller Test Unit Root Test # 
> ############################################### 
> 
> Test regression trend 
> 
> 
> Call:
> lm(formula = z.diff ~ z.lag.1 + 1 + tt + z.diff.lag)
> 
> Residuals:
>       Min        1Q    Median        3Q       Max 
> -0.036693 -0.016457 -0.000435  0.014344  0.074299 
> 
> Coefficients:
>               Estimate Std. Error t value Pr(>|t|)  
> (Intercept)  1.0369478  0.4272693   2.427   0.0190 *
> z.lag.1     -0.1767666  0.0729961  -2.422   0.0192 *
> tt           0.0006299  0.0003348   1.881   0.0659 .
> z.diff.lag   0.2557788  0.1362896   1.877   0.0665 .
> ---
> Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> 
> Residual standard error: 0.02419 on 49 degrees of freedom
> Multiple R-squared:  0.1342,    Adjusted R-squared:  0.08117 
> F-statistic: 2.531 on 3 and 49 DF,  p-value: 0.06785
> 
> 
> Value of test-statistic is: -2.4216 2.1927 2.9343 
> 
> Critical values for test statistics: 
>       1pct  5pct 10pct
> tau3 -4.04 -3.45 -3.15
> phi2  6.50  4.88  4.16
> phi3  8.73  6.49  5.47

उपरोक्त आपके विशिष्ट उदाहरण में, d.Aus डेटा के लिए, चूंकि दोनों परीक्षण आँकड़े "अस्वीकार करने में विफल" ज़ोन के अंदर हैं, इसका तात्पर्य है कि गामा = 0 और a0 = 0, जिसका अर्थ है कि एक यूनिट रूट है, लेकिन कोई बहाव शब्द नहीं।


@ जेरेमी, आपके विस्तृत उत्तर भाग 3 (प्रवृत्ति के साथ) में आपने उल्लेख किया है "इस मामले में, परीक्षण के आँकड़े -2.4216 2.1927 2.9343 हैं। इन सभी मामलों में," शून्य को अस्वीकार करने में विफल "ज़ोन के भीतर आते हैं (महत्वपूर्ण देखें) नीचे मूल्य)। " मेरा प्रश्न यह है कि अगर 2.1927 phi2 के लिए परीक्षण आँकड़ा है, तो क्या इसे phi2 6.50 4.88 4.16 के खिलाफ जाँचना चाहिए? और अगर यह सही है, तो phi2 H0 (प्रवृत्ति और बहाव के बिना इकाई जड़) को स्वीकार करने के लिए क्या शर्त है?
सराज़

5

जैसा कि संयुक्त पी पहले से ही बताया गया है, महत्व कोड काफी मानक हैं और वे पी-मूल्यों के अनुरूप हैं, यानी एक परिकल्पना परीक्षण का सांख्यिकीय महत्व। .01 के पी-मान का मतलब है कि यह निष्कर्ष 99% विश्वास के भीतर सही है।

डिकी-फुलर पर विकिपीडिया लेख डिक्की-फुलर परीक्षण के तीन संस्करणों का वर्णन करता है: "यूनिट रूट", "यूनिट रूट विथ ड्रिफ्ट", और "यूनिट रूट विथ ड्रिफ्ट एंड निर्धारक समय प्रवृत्ति", या जिसे क्या कहा जाता है। urcaक्रमशः प्रकार = "कोई नहीं", "बहाव" और "प्रवृत्ति" के रूप में प्रलेखन।

इनमें से प्रत्येक परीक्षण उत्तरोत्तर अधिक जटिल रैखिक प्रतिगमन है। उन सभी में जड़ है, लेकिन बहाव में एक बहाव गुणांक भी है, और प्रवृत्ति में एक प्रवृत्ति गुणांक भी है। इनमें से प्रत्येक गुणांक में एक संबद्ध महत्व स्तर होता है। जबकि मूल गुणांक का महत्व डीएफ परीक्षण का सबसे महत्वपूर्ण और मुख्य फोकस है, हमें यह जानने में भी रुचि हो सकती है कि क्या प्रवृत्ति / बहाव सांख्यिकीय रूप से भी महत्वपूर्ण है या नहीं। अलग-अलग विधाओं के साथ छेड़छाड़ करने और यह देखने के बाद कि कौन से गुणांक टी-परीक्षणों में दिखाई देते हैं / गायब हो जाते हैं, मैं आसानी से यह पहचानने में सक्षम था कि कौन सा गुणांक किस टी-टेस्ट के अनुरूप है।

उन्हें इस प्रकार लिखा जा सकता है (विकी पेज से):

Δyटी=δyटी-1+यूटी

Δyटी=δyटी-1+0+यूटी

Δyटी=δyटी-1+0+1टी+यूटी

δ01δ01


2

मैंने जेरेमी के उत्तर का पालन करना बहुत आसान पाया, लेकिन लगातार खुद को तर्क के माध्यम से सही ढंग से चलने और गलतियाँ करने का प्रयास करते पाया। मैंने एक आर फ़ंक्शन को कोडित किया है जो प्रत्येक तीन प्रकार के मॉडल की व्याख्या करता है, और चेतावनी देता है यदि असंगतताएं या अनिर्णायक परिणाम हैं (मुझे नहीं लगता कि मुझे एडीएफ गणित को सही ढंग से समझने पर कभी विसंगतियां नहीं होनी चाहिए, लेकिन मैंने अभी भी एक अच्छा सोचा है। अगर ur.df फ़ंक्शन में कोई ख़राबी है तो जाँच करें)।

कृपया देख लीजिये। टिप्पणी / सुधार / सुधार लेने के लिए खुश।

https://gist.github.com/hankroark/968fc28b767f1e43b5a33b151b771bf9


आपका कार्य ऐसा लगता है जैसे इसे बहुत प्रयासों के साथ बनाया गया था; हालाँकि, इसके लिए एक प्रतिलिपि प्रस्तुत करने योग्य उदाहरण जोड़ना मददगार होगा। आप एक समय श्रृंखला (शायद पहले से ही आर या पैकेज में उपलब्ध है) को चुनना चाहते हैं, उस पर डिकी फुलर परीक्षण चलाएं और फिर अपने फ़ंक्शन का उपयोग केवल इच्छुक लोगों के लिए देखें कि यह क्या करता है।
SavedByJESUS

प्रतिक्रमण उदाहरणinterp_urdf(urdf = ur.df(mtcars$mpg, type = "drift"))
MSD

1

डिकी फुलर टेस्ट का सारांश

रोजर परमान के व्याख्यान में अधिक जानकारी यूनिट रूट परीक्षणों पर ध्यान दें

एंडर्स, एप्लाइड इकोनोमेट्रिक टाइम सीरीज़ (4e) में तालिका 4.2 भी देखें, जो विभिन्न परिकल्पनाओं को संक्षेप में प्रस्तुत करता है जिसके लिए ये परीक्षण आँकड़े संदर्भित करते हैं। सामग्री ऊपर दी गई छवि से सहमत है।


0

बहुत ही रोचक पोस्ट और जवाब। मेरे पास उपयोगकर्ता 3096626 द्वारा बताई गई तालिका के संबंध में संदेह है। कौन सा सॉफ्टवेयर एडीएफ परीक्षण उत्पादन में रिपोर्ट के मूल्यों \tau_{\alpha \mu}, \tau_{\alpha \tau}और \tau_{\beta \tau}? जाहिर है, आर नहीं करता है


-4

phi1 phi2 phi3 ADF ढांचे में F- परीक्षणों के बराबर है


4
क्या आप इस उत्तर पर थोड़ा विस्तार कर सकते हैं? फिलहाल यह कुछ हद तक गूढ़ है। ये बराबर क्यों होना चाहिए?
एंडी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.