आप समय श्रृंखला डेटा के साथ बूटस्ट्रैपिंग कैसे करते हैं?


33

मैंने हाल ही में मानक त्रुटियों और आकलनकर्ताओं के लिए विश्वास अंतराल की गणना करने के लिए बूटस्ट्रैपिंग तकनीकों का उपयोग करने के बारे में सीखा। मैंने जो सीखा वह यह था कि यदि डेटा IID है, तो आप नमूना डेटा को आबादी के रूप में मान सकते हैं, और प्रतिस्थापन के साथ नमूना कर सकते हैं और यह आपको एक परीक्षण सांख्यिकीय के कई सिमुलेशन प्राप्त करने की अनुमति देगा।

समय श्रृंखला के मामले में, आप स्पष्ट रूप से ऐसा नहीं कर सकते हैं क्योंकि ऑटोक्रेलेशन के अस्तित्व में होने की संभावना है। मेरे पास एक समय श्रृंखला है और एक निश्चित तारीख से पहले और बाद में डेटा के माध्य की गणना करना चाहते हैं। क्या बूटस्ट्रैपिंग के संशोधित संस्करण का उपयोग करने का एक सही तरीका है?


16
कुंजी खोज शब्द: बूटस्ट्रैप ब्लॉक करें।
कार्डिनल

जवाबों:


26

@कार्डिनल बताते हैं, 'ब्लॉक बूटस्ट्रैप' पर बदलाव एक प्राकृतिक तरीका है। यहां, विधि के आधार पर, आप समय श्रृंखला के स्ट्रेच का चयन करते हैं, या तो ओवरलैपिंग या नहीं और निश्चित लंबाई या यादृच्छिक, जो नमूनों में स्थिरता की गारंटी दे सकते हैं ( पोलिटिस और रोमानो, 1991 ) फिर उन्हें फिर से जोड़कर पुन: सेट किए गए श्रृंखला बनाने के लिए जिस पर आप अपने आंकड़े की गणना करते हैं। आप लौकिक निर्भरता के मॉडल बनाने की भी कोशिश कर सकते हैं, जो मार्कोव के तरीकों, स्वायत्त सिस्टर्स और अन्य के लिए अग्रणी है। लेकिन ब्लॉक बूटस्ट्रैपिंग शायद इन तरीकों को लागू करने में सबसे आसान है।

गॉनक्लेव्स और पोलिटिस (2011) संदर्भों के साथ एक बहुत ही छोटी समीक्षा है। एक पुस्तक की लंबाई का इलाज लाहिड़ी (2010) है


@statnub यदि यह आपके पिछले साप्ताहिक बिक्री हस्तक्षेप प्रश्न से संबंधित है, तो ध्यान दें कि यदि आप उस मॉडल मान्यताओं पर भरोसा नहीं करते थे जो आप वहां तैनात कर रहे थे। पहली बार में एक उचित समय श्रृंखला मॉडल का उपयोग करके आदर्श रूप से उन चीजों के जोखिम को कम करना चाहिए जो इस तरह के बूटस्ट्रैपिंग को इंगित करते हैं ...
संयुग्मकपियर

6
अच्छा उत्तर। मुझे सिर्फ जोड़ने है कि आप उपयोग कर सकते हैं करते हैं tsbootमें bootअनुसंधान में पैकेज यह करने के लिए।
MnsnsT

@ मंगल अच्छा लगा। मैं उस पैकेज के बारे में नहीं जानता था।
संयुग्मप्यार 15

5

एफ्रॉन (1979) में शुरू की गई रेज़मैप्लिंग विधि को आईड यूनीवेट डेटा के लिए डिज़ाइन किया गया था, लेकिन इसे मल्टीवेरियन डेटा में आसानी से विस्तारित किया जाता है। जैसा कि चर्चा में है। यदि वैक्टर का एक नमूना है, तो नमूने में डेटा के सहसंयोजक संरचना को बनाए रखने के लिए। यह तुरंत स्पष्ट नहीं है कि क्या कोई एक बार श्रृंखला फिर से बना सकता है । एक समय श्रृंखला अनिवार्य रूप से स्टोकेस्टिक प्रक्रिया से आकार 1 का एक नमूना है। एक नमूना को फिर से खोलना मूल नमूना है, इसलिए कोई भी पुन: नमूना करके कुछ नहीं सीखता है। इसलिए, समय श्रृंखला को फिर से शुरू करने के लिए नए विचारों की आवश्यकता होती है।x1,···,xnx1,x2,···,xn

मॉडल-आधारित रीसम्पलिंग को आसानी से टाइम सीरीज़ के लिए अपनाया जाता है। समय श्रृंखला के मॉडल का अनुकरण करके resamples प्राप्त किए जाते हैं। उदाहरण के लिए, यदि मॉडल ARIMA (p, d, q) है, तो ऑटोरेग्रेसिव और मूविंग एवरेज गुणांक और शोर विचरण के MLE (अलग श्रृंखला से) के साथ एक ARIMA (p, q) मॉडल के अवशेष हैं। प्रतिकृतियाँ सिम्युलेटेड ARIMA (p, q) प्रक्रिया के आंशिक योग के क्रम हैं।

समय श्रृंखला के मॉडल-मुक्त पुनरुत्पादन को ब्लॉक रेज़म्पलिंग द्वारा पूरा किया जाता है, जिसे ब्लॉक बूटस्ट्रैप भी कहा जाता है, जिसे आर के बूट पैकेज में tsboot फ़ंक्शन का उपयोग करके लागू किया जा सकता है। यह विचार है कि श्रृंखला को लगभग अवलोकनों के बराबर-बराबर लंबाई वाले ब्लॉक में विभाजित किया जाए, ब्लॉक को प्रतिस्थापन के साथ फिर से विभाजित किया जाए, और फिर ब्लॉक को एक साथ चिपकाने के लिए। उदाहरण के लिए, यदि समय श्रृंखला लंबाई 200 की है और कोई लंबाई 20 के 10 ब्लॉकों का उपयोग करता है, तो ब्लॉक पहले 20 अवलोकन, अगले 20 और इसके बाद के हैं। एक संभावित पुनरुत्पादन चौथा ब्लॉक है (अवलोकन 61 से 80), फिर अंतिम ब्लॉक (अवलोकन 181 से 200), फिर दूसरा ब्लॉक (अवलोकन 21 से 40), फिर चौथा ब्लॉक फिर से, और इसी तरह जब तक 10 ब्लॉक नहीं हैं फिर से शुरू में।


1
ब्लॉक बूटस्ट्रैप के अन्य रूप हैं, जिसमें ओवरलैपिंग ब्लॉक बूटस्ट्रैप और सर्कुलर ब्लॉक बूटस्ट्रैप शामिल हैं, जो कि लाहिड़ी (2003) की पुस्तक "डिपेंडेंट डेटा के लिए रीसम्पलिंग तरीके" में विस्तार से वर्णित हैं। ये विधियां स्थिर समय श्रृंखला पर लागू होती हैं।
बजे माइकल आर। चेरिक डिक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.