बूटस्ट्रैप परिकल्पना परीक्षण में अशक्त परिकल्पना के तहत डेटा को फिर से क्यों रखा जाना चाहिए?


11

परिकल्पना परीक्षण करने के लिए बूटस्ट्रैप तरीकों में से सीधा आवेदन परीक्षण आंकड़ा के विश्वास अंतराल अनुमान लगाने के लिए है बार-बार चलाया नमूनों पर यह गणना के द्वारा (चलो आंकड़ा बूटस्ट्रैप से नमूना कहा जा )। हम को अस्वीकार करते हैं यदि पैरामीटर (जो आमतौर पर 0 के बराबर होता है) के विश्वास अंतराल के बाहर है । θ ^ θ * एच0θ0 ^ θ *θ^θ^θ^H0θ0θ^

मैंने पढ़ा है, कि इस विधि में कुछ शक्ति की कमी है। हॉल पी और विल्सन एसआर के लेख में "बूटस्ट्रैप परिकल्पना परीक्षण के लिए दो दिशानिर्देश" (1992) यह पहली दिशानिर्देश के रूप में लिखा गया है, कि किसी को , नहीं the । और यह वह हिस्सा है जिसे मैं नहीं समझता।^ θ * -θ0θ^θ^θ^θ0

क्या ऐसा नहीं है कि सिर्फ अनुमानक के के पूर्वाग्रह को मापता है ? निष्पक्ष अनुमान के लिए इस अभिव्यक्ति का आत्मविश्वास अंतराल हमेशा से छोटा होना चाहिए , लेकिन मैं यह देखने में विफल रहता हूं कि इसका परीक्षण के साथ क्या करना है ? कहीं नहीं है मैं देख सकता हूँ कि हम the बारे में जानकारी डाल सकते हैं ।^ θ * ^ θ * -θ0 θ =θ0θ0θ^θ^θ^θ^θ0θ^=θ0θ0


आप में से उन लोगों के लिए, जिनके पास इस लेख तक पहुंच नहीं है, यह संबंधित अनुच्छेद का एक उद्धरण है जो थीसिस के तुरंत बाद आता है:

यह जानना महत्वपूर्ण है कि यह महत्वपूर्ण क्यों है, निरीक्षण करें कि परीक्षण में को अस्वीकार करना शामिल होगा यदि बहुत बड़ा है।" यदि के सही मूल्य से एक लंबा रास्ता है (यानी, अगर निहायत त्रुटि है) तो अंतर nonparametric इस बूटस्ट्रैप वितरण की तुलना में बहुत ज्यादा बहुत बड़ा देखो कभी नहीं होगा। एक अधिक सार्थक तुलना के वितरण के साथ है। वास्तव में, अगर का वास्तविक मूल्य| Θ - θ 0 | θ 0 θ H 0 | Θ - θ 0 | | Θ - θ 0 | | ^ Θ * - θ | θ θ H0|θ^θ0|θ0θH0|θ^θ0||θ^θ0||θ^θ^|θθ1फिर बूटस्ट्रैप परीक्षण की शक्ति 1 के रूप में बढ़ जाती हैबढ़ जाती है, बशर्ते परीक्षण resampling पर आधारित हो , लेकिन शक्ति सबसे महत्वपूर्ण स्तर पर घट जाती है (as बढ़ जाती है) यदि परीक्षण resampling पर आधारित है | ^ Θ * - θ | | θ 1 - θ 0 | | Θ - θ 0 ||θ1θ0||θ^θ^||θ1θ0||θ^θ0|

जवाबों:


7

यह बूटस्ट्रैप सादृश्य सिद्धांत है। वास्तविक वितरण में अंतर्निहित (अज्ञात) ने हाथ को cdf साथ एक नमूना तैयार किया , जिसने बदले में कुछ कार्यात्मक लिए आँकड़ा उत्पादन किया । बूटस्ट्रैप का उपयोग करने का आपका विचार एक ज्ञात वितरण आधार पर नमूना वितरण के बारे में बयान करना है , जहां आप एक समान नमूना प्रोटोकॉल का उपयोग करने का प्रयास करते हैं (जो कि केवल iid डेटा के लिए संभव है; आश्रित डेटा हमेशा कैसे सीमाओं में ले जाता है; सही एक नमूना प्रक्रिया को पुन: पेश कर सकता है), और एक ही कार्यात्मक लागू करें । मैंने एक और पोस्ट में इसका प्रदर्शन कियाx 1 , ... , एक्स एन एफ एन θ = टी ( एफ एन ) टी ( ) ~ एफ टी ( ) θ - θ 0 θ * ~ एफ टी ( ) टी ( ~ एफ ) ~ एफ = एफ एन टी ( एफ एन ) θFx1,,xnFnθ^=T(Fn)T()F~T()के साथ (मुझे क्या लगता है) एक साफ आरेख है। तो की बूटस्ट्रैप एनालॉग (नमूना + व्यवस्थित) विचलन , अपने केंद्रीय ब्याज की मात्रा, बूटस्ट्रैप दोहराने का विचलन है क्या वितरण के लिए सच माना जाता है से , आपके द्वारा लागू की गई नमूना प्रक्रिया, और कार्यात्मक , यानी आपकी केंद्रीय प्रवृत्ति का माप । यदि आपने मूल डेटा से प्रतिस्थापन के साथ मानक nonparametric बूटस्ट्रैप का उपयोग किया है, तो आपका , इसलिए केंद्रीय प्रवृत्ति का आपका माप मूल डेटा के आधार पर होना चाहिए ।θ^θ0θ^F~T()T(F~)F~=Fnटी(एफn)θ^

अनुवाद के अलावा, बूटस्ट्रैप परीक्षण के साथ सबटलर मुद्दे चल रहे हैं जिन्हें कभी-कभी दूर करना मुश्किल होता है। अशक्त के तहत एक परीक्षण सांख्यिकीय का वितरण वैकल्पिक के तहत परीक्षण सांख्यिकीय के वितरण से काफी भिन्न हो सकता है (उदाहरण के लिए, पैरामीटर स्पेस की सीमा पर परीक्षण में जो बूटस्ट्रैप के साथ विफल होता है )। -टेस्ट जैसी अंडरग्रेजुएट कक्षाओं में आप जो सरल परीक्षण सीखते हैं, वह बदलाव के तहत अपरिवर्तनीय होता है, लेकिन यह सोचकर कि "वैसा ही है, मैं सब कुछ शिफ्ट कर देता हूं" एक बार असफल होने के बाद आपको वैचारिक जटिलता के अगले स्तर पर जाना होगा, एसिम्प्टॉटिक परीक्षण। इस बारे में सोचें: आप उस परीक्षण कर रहे हैं , और आपके देखे गए । फिर जब आप एक निर्माणχ 2 μ = 0 ˉ x = 0.78 χ 2 ( ˉ एक्स - μ ) 2 / ( रों 2 / n ) ˉ एक्स 2 / ( रों 2 / n ) ˉ एक्स 2 * / ( रों 2 * / n ) n S x 2 / s 2टीχ2μ=0एक्स¯=0.78χ2 परीक्षण बूटस्ट्रैप एनालॉग , तो इस परीक्षण में एक केंद्रीय परीक्षण होने के बजाय, शुरू से ही का एक गैर-केंद्रीयता है , जैसा कि हम यह होने की उम्मीद करेंगे। बूटस्ट्रैप परीक्षण को केंद्रीय बनाने के लिए, आपको वास्तव में मूल अनुमान को घटाना होगा।(एक्स¯-μ)2/(रों2/n)एक्स¯2/(रों2/n)एक्स¯*2/(रों*2/n)nएक्स¯2/रों2

परीक्षण मल्टीवेरिएट संदर्भों में अपरिहार्य हैं, पियर्सन से लेकर के लिए आकस्मिक तालिकाओं के लिए Böllen-स्टाइन बूटस्ट्रैप संरचनात्मक समीकरण मॉडल में परीक्षण आंकड़ा की। वितरण को शिफ्ट करने की अवधारणा इन स्थितियों में अच्छी तरह से परिभाषित करना बहुत कठिन है ... हालांकि बहुभिन्नरूपी कोवरियन मैट्रिस पर परीक्षणों के मामले में, यह एक उपयुक्त रोटेशन द्वारा संभव है ।χ 2χ2χ2


धन्यवाद। एक ऐसा विचार है जो मुझे अभी भी समझ में नहीं आया है: बूटस्ट्रैप में बारे में हम कहाँ जानकारी रखते हैं ? जहाँ असत्य है, वास्तविक वितरण से काफी दूर हो सकता है। एच 0 θ 0θ0एच0θ0
एडम रिक्ज़ोस्की

आप n-n के तहत पी-मान की गणना करते हैं, इसलिए आपको उस मामले पर विचार करना चाहिए जब नल के अनुरूप हो। विकल्प को ध्यान में रखते हुए वैकल्पिक के तहत करने लायक है, लेकिन यह है ... वाह ... यह बूटस्ट्रैप परीक्षण पद्धति का एक उन्नत उपयोग होगा। θ0
स्टैस्क

3

ठीक है, मुझे मिल गया है। इतने अच्छे उत्तर के लिए धन्यवाद, StasK। मैं इसे दूसरों के सीखने के लिए स्वीकार कर लूंगा, लेकिन मेरे विशेष मामले में मुझे एक बहुत ही साधारण तथ्य याद आ रहा था:

सरल एक-नमूना माध्य परीक्षण के लिए हॉल और विल्सन दिशानिर्देशों के अनुसार बूटस्ट्रैप की प्रक्रिया यह है (आर-प्रेरित छद्म कोड में):

1function(data, θθ 00 ^ θ *θ ^ θ *θθ0 ) {
2 θ^ t.test(data, mu = θ0 )$statistic
3 count 0
4for(i in 1:1000){
5 bdata sample(data)
6 θ*^ t.test(bdata, mu = θ^ )$statistic
7 if ( θ*^θ^ ) count++
8 }
9 count/1000
10 }

भाग मैं याद किया था कि "पुराना" था कतार में (जहां हम संदर्भ सेट θ )।θ02θ^

यह ध्यान रखना दिलचस्प है, कि लाइन में 2और 6हम समान रूप से p.valueइसके बजाय आसानी से उपयोग कर सकते हैं statistic। उस मामले में हम भी बदलना चाहिए में लाइन में ।7


मैं पहले उठी, लेकिन फिर महसूस किया कि यह वास्तव में गलत है। हॉल और विल्सन के अनुसार (धारा 2, पृ। का एक आकलनकर्ता है θ , नहीं परीक्षण आंकड़ा आप दिखाया है के रूप में। तरीका है कि θ 0 चलन में आता है कि हम के resampled वितरण फार्म ( θ * - θ ) , फिर देखें कि वह ( θ - θ 0 ) लग रहा है "अति" resampled वितरण की तुलना में। θ^θθ0(θ^*-θ^)(θ^-θ0)
आधा पास करें

1
शायद मददगार: माइकल चेरिक ने मेरे संबंधित प्रश्न के उत्तर में एक सहज ज्ञान युक्त अंतर्ज्ञान प्रदान किया। आंकड़े.stackexchange.com/questions/289236/… )
आधा पास करें
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.