ऑटोक्रेलेशन समय की परिभाषा (प्रभावी नमूना आकार के लिए)


23

मुझे साहित्य में कमजोर स्थैतिक समय श्रृंखला के स्वतःसंक्रमण समय के लिए दो परिभाषाएँ मिली हैं:

τa=1+2k=1ρkversusτb=1+2k=1|ρk|

जहाँ lag पर है । ρk=Cov[Xt,Xt+h]Var[Xt]k

ऑटोकैरेलेशन समय का एक अनुप्रयोग "प्रभावी नमूना आकार" खोजना है: यदि आपके पास किसी समय श्रृंखला के अवलोकन हैं, और आप इसके ऑटोक्रेलेशन समय जानते हैं , तो आप यह दिखावा कर सकते हैं कि आपके पास हैnτ

neff=nτ

माध्य खोजने के प्रयोजनों के लिए सहसंबद्ध लोगों के बजाय स्वतंत्र नमूने । आकलन डेटा से गैर तुच्छ है, लेकिन यह ऐसा करने का कुछ तरीके (देखें हैं थॉम्पसन 2010 )।nτ

पूर्ण मूल्यों के बिना परिभाषा, , साहित्य में अधिक सामान्य लगती है; लेकिन यह की संभावना को स्वीकार करता है । आर और "कोडा" पैकेज का उपयोग करना:τaτa<1

require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000)         # white noise 
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000)    # AR(1)
effectiveSize(ts.uncorr)                             # Sanity check
    # result should be close to 10000
effectiveSize(ts.corr)
    # result is in the neighborhood of 30000... ???

"कोडा" में "इफेक्टिवसाइज" फंक्शन , उपर्युक्त बराबर टाइम की परिभाषा का उपयोग करता है । वहाँ कुछ अन्य आर पैकेज हैं जो प्रभावी नमूना आकार या ऑटोक्रॉलेशन समय की गणना करते हैं, और मैंने जो भी प्रयास किए हैं वे इस के अनुरूप परिणाम देते हैं: कि एआर (1) एक नकारात्मक एआर गुणांक के साथ सहसंबंधित की तुलना में अधिक प्रभावी नमूने हैं समय श्रृंखला। यह अजीब लगता है। τa

जाहिर है, यह की परिभाषा में कभी नहीं हो सकता है ।τb

स्वायत्तता समय की सही परिभाषा क्या है? क्या प्रभावी नमूना आकारों की मेरी समझ में कुछ गड़बड़ है? ऊपर दिखाए गए परिणाम लगता है जैसे कि यह गलत होना चाहिए ... क्या हो रहा है?neff>n


बस यह सुनिश्चित करने के लिए कि मुझे गलत नहीं समझा गया है कि क्या h के बजाय चाहिए ? Cov(Xt,Xt+k)h
साचिन्रुक

2
मैं दूसरी परिभाषा, यानी, में दिलचस्पी है । क्या आप वह साहित्य प्रदान कर सकते हैं जहाँ आपने इसे पाया है? τb
हैरी

जवाबों:


17

सबसे पहले, "प्रभावी नमूना आकार" की उपयुक्त परिभाषा आईएमओ एक काफी विशिष्ट प्रश्न से जुड़ी है। यदि हूबहू मतलब के साथ वितरित कर रहे हैं μ और विचरण 1 अनुभवजन्य मतलब μ = 1X1,X2,μμ का निष्पक्ष अनुमानक है। लेकिन इसके विचरण का क्या? के लिएस्वतंत्रचर विचरण हैn-1। एक कमजोर स्थिर समय श्रृंखला के लिए, के विचरण μ है 1

μ^=1nk=1nXk
μn1μ^ सन्निकटन बड़े पर्याप्तn केलिए मान्य है। यदि हम परिभाषितneff=n/τएक, एक कमजोर स्थिर समय श्रृंखला के लिए अनुभवजन्य माध्य का विचरण लगभग हैn - 1 eff , जो एक ही विचरण है के रूप में अगर हम थाneffस्वतंत्र नमूने हैं। इस प्रकारneff=n/τएकअगर हम अनुभवजन्य औसत के विचरण के लिए पूछने के लिए एक उपयुक्त परिभाषा है। यह अन्य उद्देश्यों के लिए अनुपयुक्त हो सकता है।
1n2k,l=1ncov(Xk,Xl)=1n(1+2(n1nρ1+n2nρ2++1nρn1))τan.
nneff=n/τaneff1neffneff=n/τa

टिप्पणियों के बीच एक नकारात्मक सहसंबंध के साथ यह निश्चित रूप से संभव है कि विचरण ( n eff > n ) से छोटा हो सकता है । यह मोंटो कार्लो एकीकरण में एक प्रसिद्ध विचरण कमी तकनीक है: यदि हम सहसंबंध 0 के बजाय चरों के बीच नकारात्मक सहसंबंध का परिचय देते हैं, तो हम नमूना आकार को बढ़ाए बिना विचरण को कम कर सकते हैं।n1neff>n


2
जो कोई मोंटे कार्लो सिमुलेशन में नकारात्मक सहसंबंध के उपयोग के बारे में अधिक जानना चाहता है, उसके लिए "एंटीटेटिक वेरिएंट" को आज़माएं। पाठ्यक्रम नोटों में अधिक जानकारी यहाँ या यहाँ
andrewtinka

1

देख http://arxiv.org/pdf/1403.5536v1.pdf

तथा

https://cran.r-project.org/web/packages/mcmcse/mcmcse.pdf

प्रभावी नमूना आकार के लिए। मुझे लगता है कि बैच माध्य के माध्यम से नमूना विचरण और एसिम्प्टोटिक मार्कोव श्रृंखला विचरण के अनुपात का उपयोग करके वैकल्पिक सूत्रीकरण अधिक उपयुक्त अनुमानक है।


4
क्या आप उन लिंक की सामग्री पर विस्तार कर सकते हैं? जैसा कि यह खड़ा है, हमारे मानकों के अनुसार उत्तर के लिए यह बहुत छोटा है!
kjetil b halvorsen
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.