अवशिष्टों के स्वसंबंध का परीक्षण कैसे करें?


23

मेरे पास दो कॉलम वाला एक मैट्रिक्स है जिसकी कई कीमतें (750) हैं। नीचे दी गई छवि में मैंने फॉलो लीनियर रिग्रेशन के अवशेषों को प्लॉट किया:

lm(prices[,1] ~ prices[,2])

छवि को देखते हुए, यह अवशिष्टों का एक बहुत मजबूत स्वसंबंध प्रतीत होता है।

हालाँकि मैं कैसे परीक्षण कर सकता हूं यदि उन अवशेषों का स्वायत्तता मजबूत है? मुझे किस विधि का उपयोग करना चाहिए?

रेखीय प्रतिगमन के अवशिष्ट

धन्यवाद!


8
आपको स्वतःसंक्रमण के लिए परीक्षण करने की आवश्यकता नहीं है। यह वहाँ है। कथानक से पता चलता है कि आप इन अवशिष्टों (कार्य acf()) के स्वतःसंक्रमण समारोह को देख सकते हैं , लेकिन यह केवल इस बात की पुष्टि करेगा कि सादे आंखों से क्या देखा जा सकता है: पिछड़े हुए अवशिष्टों के बीच संबंध बहुत अधिक हैं।
वोल्फगैंग

@ वोल्फगैंग, हाँ, सही है, लेकिन मुझे इसे प्रोग्रामेटिक रूप से जांचना होगा .. मैं एक्यू फंक्शन पर नज़र डालूंगा। धन्यवाद!
Dail

@Wolfgang, मैं acf () देख रहा हूं, लेकिन मुझे यह समझने के लिए कि मुझे एक मजबूत सहसंबंध है या नहीं, एक प्रकार का पी-मूल्य नहीं दिखता है। इसके परिणाम की व्याख्या कैसे करें? धन्यवाद
सस्ता

H0 के साथ: सहसंबंध (r) = 0, तो r मतलब 0 के साथ एक सामान्य / t डिस्ट्रेस का अनुसरण करता है और sqrt का विचलन (टिप्पणियों की संख्या)। तो आपको 95% विश्वास अंतराल +/- का उपयोग करके मिल सकता हैqt(0.75, numberofobs)/sqrt(numberofobs)
जिम

@Jim सहसंबंध का विचलन । न ही मानक विचलन । लेकिन इसमें एक है। n nnn
Glen_b -Reinstate मोनिका

जवाबों:


17

ऐसा करने के कई तरीके हैं, लेकिन पहली बात जो दिमाग में आती है वह है लीनियर रिग्रेशन पर आधारित। आप एक दूसरे के खिलाफ लगातार अवशेष प्राप्त कर सकते हैं और एक महत्वपूर्ण ढलान के लिए परीक्षण कर सकते हैं। यदि ऑटो-सहसंबंध है, तो लगातार अवशिष्ट के बीच एक रैखिक संबंध होना चाहिए। आपके द्वारा लिखे गए कोड को पूरा करने के लिए, आप कर सकते हैं:

mod = lm(prices[,1] ~ prices[,2])
res = mod$res 
n = length(res) 
mod2 = lm(res[-n] ~ res[-1]) 
summary(mod2)

mod2 समय त्रुटि, का एक रैखिक प्रतिगमन है , समय त्रुटि, विरुद्ध । यदि रिस [1] के लिए गुणांक महत्वपूर्ण है, तो आपके पास अवशिष्टों में स्वतःसंबंध के सबूत हैं।ε टी टी - 1 ε टी - 1टीεटीटी-1εटी-1

नोट: यह परोक्ष मानता है कि बच अर्थ है कि केवल में autoregressive हैं महत्वपूर्ण है जब भविष्यवाणी है । वास्तव में लंबे समय तक निर्भरता हो सकती है। उस स्थिति में, मैंने जिस विधि का वर्णन किया है, उसे में वास्तविक autocorrelation संरचना के लिए एक-लैग ऑटोरेग्रेसिव सन्निकटन के रूप में व्याख्या की जानी चाहिए । ε टी εεटी-1εटीε


उदाहरण के लिए बहुत बहुत धन्यवाद। केवल एक ही संदेह, Res [-1] महत्वपूर्ण होने पर मैं कैसे परीक्षण कर सकता हूं?
Dail

पर नज़र - आप इसे उसी तरह आप किसी भी अन्य प्रतिगमन गुणांक होगा परीक्षण था -statistic और -valueपीटीपी
मैक्रो

के साथ एक तेज़ परीक्षण कर रहा है: lm (rnorm (1000) ~ घबराना (1: 1000)) मुझे मिलता है: अवशिष्ट मानक त्रुटि: स्वतंत्रता के 997 डिग्री पर 1.006 मल्टीपल आर-स्क्वॉयर: 0.0003463, समायोजित आर-स्क्वेर - -0.0006564 F-आँकड़ा : 0.3454 1 पर और 997 DF, पी-मूल्य: 0.5569 पी-मूल्य शून्य परिकल्पना को अस्वीकार नहीं कर सकते हैं
सस्ता

मैक्रो, मैंने ऊपर दिए गए चार्ट के अवशिष्टों का परीक्षण किया है, और परिणाम है: अवशिष्ट मानक त्रुटि: स्वतंत्रता के 747 डिग्री पर 0.04514 मल्टीपल आर-स्क्वॉयर: 0.9241, समायोजित आर-स्क्वैयर: 0.924 एफ-स्टेटिस्टिक: 9093 1 और 747 डीएफ, पी-मूल्य: <2.2e-16, यह बहुत अच्छा नहीं लगता है, यह बहुत अजीब है क्योंकि एक मजबूत ऑटोक्रेलेशन है, मैं क्या कर सकता था?
Dail

3
इसे ऑटोक्रॉलेशन के लिए ब्रेस्च-गॉडफ्रे टेस्ट कहा जाता है।
चार्ली

16

Lmtest पैकेज में कार्यान्वित डर्बिन -वाटसन परीक्षण का उपयोग करें ।

dwtest(prices[,1] ~ prices[,2])

बहुत अजीब मुझे मिलता है: पी-मूल्य <2.2e-16, यह कैसे संभव है? डेटा बहुत सहसंबद्ध लगता है!
Dail

4
पी-मूल्य शायद उतना ही सह-संबंध है जितना कि वास्तविक सहसंबंध नहीं होने पर मनाया जाता है। इसलिए यदि पी बहुत छोटा है, जैसा कि यह है, कि पता चलता है कि नमूने में बहुत अधिक सहसंबंध मौजूद है।
रोब हंडमैन

क्या आपका मतलब है कि इस तरह से एक पी-वैल्यू इंगित करता है कि अवशिष्ट बहुत स्वायत्त हैं?
Dail

हम्म अजीब, पर एक नज़र रखना: imageshack.us/f/59/17671620.png यह कैसे संभव है कि सही छवि स्वतःसंबंधित नहीं है?
Dail

: dail यह प्रतीत होता है कि बाईं छवि में विचरण में एक संरचनात्मक परिवर्तन है (देखें Ruey Tsay के लेख "आउटलेयर, लेवल शिफ्ट्स, और समय श्रृंखला में भिन्न परिवर्तन", पूर्वानुमान के जर्नल, VOl 7, 1-20 (1988) विवरण के लिए) जो इस मामले में DW को "भ्रमित" नहीं करता है, शायद इस तथ्य के कारण कि संपूर्ण वितरण अभी भी सामान्य है, जबकि सही छवि में कुछ स्पष्ट रूप से स्पष्ट (और आनुभविक रूप से पहचानी जाने वाली) विसंगतियाँ (दलहन) एक गैर-सामान्य (लेप्टोकोकोटिक) विकोपेडिया का निर्माण करती हैं: एक वितरण पॉज़िटिव अतिरिक्त कर्टोसिस को लेप्टोकोर्टिक) वितरण कहा जाता है जो डीडब्ल्यू के साथ कहर का कारण बनता है
आयरिशस्टैट

11

डीडब्ल्यू टेस्ट या रैखिक प्रतिगमन परीक्षण डेटा में विसंगतियों के लिए मजबूत नहीं हैं। यदि आपके पास दलहन, मौसमी दलहन, स्तर में बदलाव या स्थानीय समय के रुझान हैं, तो ये परीक्षण बेकार हैं क्योंकि ये अनुपचारित घटक त्रुटियों के विचलन को बढ़ाते हैं, इस प्रकार परीक्षण को कम करके आपको (जैसा कि आपको पता चला है) गलत तरीके से शून्य की परिकल्पना को स्वीकार करने के लिए प्रेरित करते हैं। ऑटो सहसंबंध। इन दो परीक्षणों या किसी भी अन्य पैरामीट्रिक परीक्षण से पहले जो मुझे पता है कि इसका उपयोग किया जा सकता है एक को "साबित" करना है कि अवशिष्ट का मतलब सांख्यिकीय रूप से 0.0 EVERYWHERE से अलग नहीं है अन्यथा अंतर्निहित धारणाएं अमान्य हैं। यह सर्वविदित है कि डीडब्ल्यू परीक्षण की बाधाओं में से एक इसकी धारणा है कि प्रतिगमन त्रुटियों को सामान्य रूप से वितरित किया जाता है। अन्य चीजों के बीच सामान्य रूप से वितरित नोट का मतलब है: कोई विसंगतियां (देखें)http://homepage.newschool.edu/~canjels/permdw12.pdf )। इसके अतिरिक्त DW परीक्षण केवल लैग के ऑटो-सहसंबंध के लिए परीक्षण करता है। 1. आपके डेटा में साप्ताहिक / मौसमी प्रभाव हो सकता है और यह बिना किसी कारण के होगा और इसके अलावा, अनुपचारित, DW परीक्षण को नीचे की ओर पूर्वाग्रह करेगा।


परीक्षण के लिए क्या परीक्षण हैं कि अवशेष शून्य से काफी अलग हैं? यदि प्रतिगमन में अवरोधन शामिल है, तो अवशिष्ट का मतलब बीजगणितीय शून्य है, इसलिए मैं उत्सुक हूं कि इस समस्या को कैसे कम किया जाए।
mpiktas

: mpkitas जैसा कि आपने कहा था कि जब आप त्रुटियों की निरंतरता को स्थिर करते हैं, तो 0.0 होने की गारंटी दी जाती है, लेकिन यह गारंटी नहीं देता कि त्रुटियों का मतलब हर जगह शून्य है। उदाहरण के लिए यदि किसी श्रंखला के अर्थ में परिवर्तन होता है, तो समग्र माध्य स्थिर रहेगा, लेकिन अवशिष्टों के दो "क्लंप्स" प्राप्त होंगे, जिनमें से प्रत्येक का अर्थ अलग होगा। आप विवरण के लिए रुए त्से के लेख "आउटलेयर, लेवल शिफ्ट्स और वियरेन्स चेंजेज इन टाइम सीरीज़", जर्नल ऑफ़ फोरकास्टिंग, वीओएल 7, 1-20 (1988) का अनुसरण कर सकते हैं। OR संकाय
.chicagobooth.edu

1
यह केवल मानक "कोई छोड़े गए चर" धारणा है जो सभी प्रतिगमन विश्लेषण में निहित है।
चार्ली
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.