R (tsboot, MannKendall) में किए गए बूटस्ट्रैप के आउटपुट को समझना


11

मेरे पास आर। में tsboot कॉल की व्याख्या के बारे में एक प्रश्न है। मैंने केंडल और बूट पैकेज दोनों के प्रलेखन की जांच की, लेकिन मैं पहले से ज्यादा चालाक नहीं हूं।

जब मैं केंडल पैकेज में उदाहरण के लिए बूटस्ट्रैप का उपयोग करता हूं, जहां परीक्षण आँकड़ा केंडल का ताऊ है:

library(Kendall)
# Annual precipitation entire Great Lakes
# The Mann-Kendall trend test confirms the upward trend.
data(PrecipGL)
MannKendall(PrecipGL)

जो ऊपर की ओर प्रवृत्ति की पुष्टि करता है:

tau = 0.265, 2-sided pvalue =0.00029206

उदाहरण तब ब्लॉक बूटस्ट्रैप का उपयोग जारी रखता है:

#
#Use block bootstrap 
library(boot)
data(PrecipGL)
MKtau<-function(z) MannKendall(z)$tau
tsboot(PrecipGL, MKtau, R=500, l=5, sim="fixed")

मुझे निम्नलिखित परिणाम प्राप्त हुए:

BLOCK BOOTSTRAP FOR TIME SERIES
Fixed Block Length of 5 
Call:
tsboot(tseries = PrecipGL, statistic = MKtau, R = 500, l = 5, 
sim = "fixed")


Bootstrap Statistics :
 original     bias    std. error
t1* 0.2645801 -0.2670514  0.09270585

अगर मैं सही ढंग से समझूं, तो "t1 * मूल" मूल MKtau है, "पूर्वाग्रह" R = 500 बूटस्ट्रैप समय श्रृंखला से MKtau का मतलब है, और "std। त्रुटि" MKtaus का मानक विचलन है। 500 नमूने लिए।

मुझे यह समझने में परेशानी है कि इसका क्या अर्थ है - यह मूल रूप से मुझे बताता है कि सभी 500 MKTaus मूल से कम हैं, और मूल t1 * बूटस्ट्रैप्ड MKtaus के 3 sd की सीमा में है। यह काफी अलग है?

या मैं कहूंगा कि डेटा सेट के लिए MKtau 0.26 प्लस / माइनस मानक त्रुटि है?

मुझे लम्बे प्रश्न के लिए खेद है, लेकिन मैं एक नौसिखिया हूँ और आत्म-अध्ययन के माध्यम से सीख रहा हूँ, किसी को इस बात की कमी है कि यह वास्तव में सरल समस्या है।


6
उत्पादन में biasबस के बीच अंतर है मतलब 500 संग्रहीत बूटस्ट्रैप नमूनों की और मूल अनुमान। std. error500 बूटस्ट्रैप नमूने का मानक विचलन है और मानक त्रुटि के एक अनुमान है। आउटपुट आपको बताता है कि आपका मूल अनुमान 500 बूटस्ट्रैप किए गए अनुमानों की तुलना में अधिक है (इसलिए सभी बूटस्ट्रैप्ड एमकेटॉस कम नहीं हैं)। वितरण के बारे में धारणा बनाए बिना मानक त्रुटियों / विश्वास अंतराल की गणना करने के लिए अक्सर बूटस्ट्रैप का उपयोग किया जाता है। boot.ciआत्मविश्वास अंतराल की गणना करने के लिए फ़ंक्शन का उपयोग करें ।
15

@COOLSerdash, इसके लिए धन्यवाद! इसलिए अगर मेरा मूल आँकड़ा बूटस्ट्रैप्ड सांख्यिकीय के माध्य से 3 sd अधिक है, तो क्या मैं सीधे कुछ भी निष्कर्ष निकाल सकता हूं (कहो: आँकड़ा 0.99 पर महत्वपूर्ण है)? मैंने boot.ciआत्मविश्वास के अंतराल की गणना करने के लिए भी इस्तेमाल किया , और फिर, इन अंतरालों के बाहर मूल रूप से गणना किए गए सांख्यिकीय झूठ।
मारिया

नहीं, आप बूटस्ट्रैप किए गए आंकड़े की मूल सांख्यिकीय के साथ परिकल्पना परीक्षण के साथ तुलना नहीं करते हैं। मैं आपके मामले में बूटस्ट्रैप्ड मानक त्रुटि और आत्मविश्वास अंतराल का उपयोग / रिपोर्ट करूंगा।
COOLSerdash

जवाबों:


3

एक ही प्रश्न में चलने और इसे एक नियंत्रित डेटा सेट - मॉडल y = ax + b के साथ N (0, sig) त्रुटियों के साथ पता लगाया गया है , मुझे लगता है कि केंडल पैकेज विज्ञापन के रूप में काम नहीं कर सकता है। एक्स मेरे मामले में था 1:100, और y = एक्स , sig साथ = 100 (त्रुटि अवधि के विचरण)।

प्रतिगमन अच्छा लग रहा है, और ऐसा ही केंडल के ताऊ को भी दिखता है। लीनियर मॉडल से प्रेरित इसके अलावा यहां कोई ऑटोकैरेलेशन नहीं है। 1, 3, 5 और 10 की ब्लॉक लंबाई के साथ विज्ञापित केंडल परीक्षण चलाने से बहुत बड़े पूर्वाग्रह मूल्य प्राप्त होते हैं, और इसकी boot.ciप्रवृत्ति की रिपोर्ट करते हैं।

इसके बाद, मैंने इन ब्लॉक लंबाई के साथ डेटा के बूटस्ट्रैप को हाथ से कोडित किया, और मेरी नियंत्रण श्रृंखला के साथ, मुझे बूटस्ट्रैप नमूनों और उनके प्रसार के माध्यम के रूप में उचित परिणाम मिले। इसलिए, यह संभव है कि ब्लॉक बूटस्ट्रैप के संबंध में पैकेज केंडल के साथ कुछ गड़बड़ हो गई है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.