गैर-पैरामीट्रिक बूटस्ट्रैप पी-मान बनाम आत्मविश्वास अंतराल


11

प्रसंग

यह कुछ हद तक इस प्रश्न के समान है , लेकिन मुझे नहीं लगता कि यह एक सटीक डुप्लिकेट है।

जब आप यह देखते हैं कि बूटस्ट्रैप परिकल्पना परीक्षण करने के लिए कैसे निर्देश हैं, तो आमतौर पर यह कहा जाता है कि आत्मविश्वास अंतराल के लिए अनुभवजन्य वितरण का उपयोग करना ठीक है लेकिन आपको पी पाने के लिए अशक्त परिकल्पना के तहत वितरण से सही ढंग से बूटस्ट्रैप करने की आवश्यकता है। मूल्य। एक उदाहरण के रूप में, इस प्रश्न का स्वीकृत उत्तर देखें । इंटरनेट पर एक सामान्य खोज ज्यादातर इसी तरह के उत्तरों को चालू करती है।

अनुभवजन्य वितरण के आधार पर पी-मूल्य का उपयोग नहीं करने का कारण यह है कि ज्यादातर समय हमारे पास अनुवाद इंवेरियन नहीं होता है।

उदाहरण

एक छोटा सा उदाहरण देता हूं। हमारे पास एक सिक्का है और हम यह देखने के लिए एकतरफा परीक्षण करना चाहते हैं कि सिर की आवृत्ति 0.5 से अधिक है या नहीं

हम परीक्षण करते हैं और सिर प्राप्त करते हैं। इस परीक्षण के लिए सही p- मान ।n=20k=14p=0.058

दूसरी ओर अगर हम अपने 20 में से 14 सिर बूटस्ट्रैप करते हैं, तो हम प्रभावी रूप से और साथ द्विपद वितरण से नमूना लेते हैं । 0.2 को घटाकर इस वितरण को स्थानांतरित करना, प्राप्त अनुभवजन्य वितरण के खिलाफ 0.7 के हमारे मनाया मूल्य का परीक्षण करते समय हम मुश्किल से महत्वपूर्ण परिणाम प्राप्त करेंगे।n=20p=1420=0.7

इस मामले में विसंगति बहुत कम है, लेकिन यह तब बड़ा हो जाता है जब हम जिस सफलता दर के खिलाफ परीक्षण करते हैं वह 1 के करीब हो जाती है।

सवाल

अब मैं अपने प्रश्न के वास्तविक बिंदु पर आता हूं: बहुत ही दोष विश्वास अंतराल के लिए भी है। वास्तव में, यदि किसी आत्मविश्वास अंतराल में कथित आत्मविश्वास स्तर तो शून्य परिकल्पना के तहत पैरामीटर नहीं होने वाला विश्वास अंतराल महत्व स्तर पर शून्य परिकल्पना को खारिज करने के बराबर है ।α1α

ऐसा क्यों है कि अनुभवजन्य वितरण के आधार पर विश्वास अंतराल व्यापक रूप से स्वीकार किए जाते हैं और पी-मूल्य नहीं?

क्या कोई गहरा कारण है या लोग केवल आत्मविश्वास के साथ रूढ़िवादी नहीं हैं?

इस जवाब में पीटर डेलगार्ड एक जवाब देते हैं जो मेरे तर्क से सहमत लगता है। वह कहता है:

इस तर्क की इस पंक्ति के बारे में कुछ भी विशेष रूप से गलत नहीं है, या कम से कम नहीं (बहुत) सीआई की गणना से भी बदतर है।

कहाँ (बहुत) से आ रहा है? तात्पर्य यह है कि पी-वैल्यू को उत्पन्न करने का तरीका थोड़ा खराब है, लेकिन बिंदु पर विस्तृत नहीं है।

अंतिम विचार

इसके अलावा एफ्रॉन और टिबशिरानी द्वारा बूटस्ट्रैप के लिए एक परिचय में वे आत्मविश्वास अंतराल के लिए बहुत सारे स्थान समर्पित करते हैं, लेकिन पी-मूल्यों के लिए नहीं जब तक कि वे एक उचित शून्य परिकल्पना वितरण के तहत उत्पन्न नहीं होते हैं, सामान्य समानता के बारे में एक फेंक लाइन के अपवाद के साथ। आत्मविश्वास परीक्षण और क्रमपरिवर्तन परीक्षण के बारे में अध्याय में पी-मान।

आइए हम पहले जुड़े हुए प्रश्न पर वापस आते हैं । मैं माइकल चेरिक के उत्तर से सहमत हूं, लेकिन फिर वह यह भी तर्क देता है कि अनुभवजन्य बूटस्ट्रैप वितरण के आधार पर आत्मविश्वास अंतराल और पी-मान दोनों कुछ परिदृश्यों में समान रूप से अविश्वसनीय हैं। यह व्याख्या नहीं करता है कि आप कई लोगों को यह क्यों बता रहे हैं कि अंतराल ठीक हैं, लेकिन पी-मान नहीं हैं।


मैं इस प्रश्न पर एक इनाम शुरू कर रहा हूं क्योंकि मुझे इस बात पर बहुत दिलचस्पी है कि कैसे और कब बूटस्ट्रैप CIs का उपयोग किसी परिकल्पना को स्वीकार / अस्वीकार करने के लिए किया जा सकता है। शायद आप इसे और अधिक संक्षिप्त और आकर्षक बनाने के लिए अपने प्रश्न को फिर से लिखना / सुधार कर सकते हैं? धन्यवाद !
जेवियर बोरेट सिस्कोट

मुझे लगता है कि ज्यादातर लोग इस बात से सहमत होंगे कि जब निम्नलिखित धारणाएं लागू होती हैं, तब परिकल्पना परीक्षण के लिए CI का उपयोग करना ठीक होता है: परीक्षण सांख्यिकीय, सममित परीक्षण सांख्यिकीय, सीएलटी आवेदन, कोई या कुछ उपद्रव मापदंडों आदि का सममितीय वितरण नहीं होता है। अजीब है या साबित नहीं हुआ है। यहाँ मैं एक वास्तविक उदाहरण पर काम कर रहा हूँ: उदाहरण के अनुपात के 75 वें प्रतिशत के बीच दो नमूना अंतर (दो रकम का अनुपात)
जेवियर बॉरेट सिस्कोट

सरल उत्तर नहीं है कि यह स्पष्ट है कि अशक्त परिकल्पना के तहत कैसे नमूना लिया जाए, इसलिए एक वैकल्पिक तरीका है जो स्पष्ट रूप से बेहतर है? बूटस्ट्रैप के तहत नमूनाकरण आमतौर पर अनुभवजन्य वितरण के तहत होता है, इसलिए सही डेटा जनरेटिंग तंत्र, ताकि स्पष्ट रूप से नल के नीचे नमूना लेने के बजाय इसका उपयोग न किया जाए। बूटस्ट्रैप्ड CI को सही डेटा जनरेटिंग मैकेनिज्म के तहत सैंपल डिस्ट्रीब्यूशन इनवर्ट करने से मिलता है। यह सच है कि यह सीआई अच्छी तरह से काम नहीं कर सकता है, लेकिन जैसे डलागार्ड ने कहा, यह स्पष्ट नहीं है कि इसे कैसे ठीक किया जाए।
jsk

मुझे स्पष्ट करना चाहिए कि अनुभवजन्य वितरण केवल सही डेटा जनरेटिंग तंत्र का एक अनुमान है। जिस हद तक यह सच्चाई का प्रतिनिधि नहीं है, वह अज्ञात दिशाओं में बूटस्ट्रैप्ड CI को 95% से कम कवरेज के लिए नकारात्मक रूप से प्रभावित करेगा।
jsk

1
अशक्त के तहत नमूना लेना स्पष्ट है जब परीक्षण साधन का अंतर है, लेकिन कई मामलों में यह स्पष्ट नहीं है कि नल को कैसे पुन: पेश किया जाए ... उदाहरण के लिए नल यह है कि दो अनुपातों का 75 वां प्रतिशत समान है ... कैसे मैं प्राप्त करने के लिए प्रत्येक नमूने में अनुपात के अनुपात और भाजक को स्थानांतरित करता हूं? इसके अलावा, मैं कैसे सुनिश्चित कर सकता हूं कि अनुपात के घटकों को स्थानांतरित करना वास्तव में अशक्त है?
जेवियर बोरेट सिसिलोट

जवाबों:


3

जैसा कि @MichaelChernick ने एक जुड़े सवाल के जवाब में एक टिप्पणी के जवाब में कहा :

आत्मविश्वास अंतराल और परिकल्पना परीक्षणों के बीच सामान्य रूप से 1-1 पत्राचार होता है। उदाहरण के लिए एक मॉडल पैरामीटर के लिए 95% विश्वास अंतराल उस पैरामीटर के मूल्य के संबंध में संबंधित 5% स्तर की परिकल्पना परीक्षण के लिए गैर-अस्वीकृति क्षेत्र का प्रतिनिधित्व करता है। जनसंख्या वितरण के आकार के बारे में कोई आवश्यकता नहीं है। जाहिर है अगर यह सामान्य रूप से आत्मविश्वास अंतराल पर लागू होता है तो यह बूटस्ट्रैप आत्मविश्वास अंतराल पर लागू होगा।

तो यह उत्तर दो संबंधित मुद्दों को संबोधित करेगा: (1) बूटस्ट्रैप परिणामों की प्रस्तुतियाँ पी- अंतराल के बजाय विश्वास अंतराल (सीआई) को निर्दिष्ट करने के लिए अधिक बार क्यों प्रतीत होती हैं, जैसा कि प्रश्न में सुझाव दिया गया है, और (2) जब दोनों पी- अंतराल हो सकते हैं और बूटस्ट्रैप द्वारा निर्धारित सीआई को अविश्वसनीय होने का संदेह है, इस प्रकार एक वैकल्पिक दृष्टिकोण की आवश्यकता होती है।

मुझे ऐसे डेटा की जानकारी नहीं है जो विशेष रूप से पहले प्रश्न पर इस प्रश्न में दावे का समर्थन करते हैं। शायद व्यवहार में कई बूटस्ट्रैप-व्युत्पन्न बिंदु अनुमान हैं (या कम से कम प्रतीत होते हैं) परीक्षण निर्णय सीमाओं से इतना दूर कि संबंधित अनुमान अनुमान में प्राथमिक रुचि के साथ संबंधित शून्य परिकल्पना के पी- रूल में बहुत कम रुचि है ; इसकी संभावना परिवर्तनशीलता के परिमाण के कुछ उचित माप।

दूसरे मुद्दे के संबंध में, कई व्यावहारिक अनुप्रयोगों में "टेस्ट स्टेटिस्टिक, पिवटल टेस्ट स्टेटिस्टिक, सीएलटी आवेदन, कोई या कुछ उपद्रव मापदंडों आदि" का सममित वितरण शामिल है (जैसा कि @XavierBourretSicitete ऊपर एक टिप्पणी में है), जिसके लिए थोड़ी कठिनाई है। सवाल तब बनता है कि इन स्थितियों से संभावित विचलन का पता कैसे लगाया जाए और जब वे उत्पन्न हों तो उनसे कैसे निपटें।

आदर्श व्यवहार से इन संभावित विचलन को दशकों से सराहा गया है, कई बूटस्ट्रैप सीआई दृष्टिकोण से निपटने के लिए जल्दी विकसित हुए हैं। स्टूडेंटाइज्ड बूटस्ट्रैप एक महत्वपूर्ण सांख्यिकीय प्रदान करने में मदद करता है , और बीसीए विधि बूटस्ट्रैप से अधिक विश्वसनीय सीआई प्राप्त करने के संदर्भ में पूर्वाग्रह और तिरछापन दोनों से संबंधित है। बूटस्ट्रैप्ड CI को निर्धारित करने से पहले डेटा के परिवर्तन को स्थिर करना , इसके बाद मूल पैमाने पर बैक-ट्रांसफॉर्मेशन भी मदद कर सकता है।

एक निष्पक्ष सिक्के से 20 tosses के 14 सिर से नमूने पर इस सवाल में उदाहरण अच्छी तरह से बीसीए विधि से सीआई का उपयोग करके नियंत्रित किया जाता है; आर में:

> dat14 <- c(rep(1,14),rep(0,6))
> datbf <- function(data,index){d <- data[index]; sum(d)}
> set.seed(1)
> dat14boot <- boot(dat14,datbf,R=999)
> boot.ci(dat14boot)
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 999 bootstrap replicates

CALL : 
boot.ci(boot.out = dat14boot)

Intervals : 
Level      Normal              Basic         
95%     (9.82, 18.22 )   (10.00, 18.00 )  

Level     Percentile            BCa          
95%       (10, 18 )         ( 8, 17 )  
Calculations and Intervals on Original Scale

अन्य सीआई का अनुमान है कि 20 सिर प्रति 10 सिर के जनसंख्या मूल्य के बहुत करीब या उसके किनारे होने की विख्यात समस्या है। स्काईनेस के लिए बीसीए सीआई खाता (जैसा कि दूर से भी द्विपद नमूना द्वारा पेश किया गया है), इसलिए वे अच्छी तरह से 10 के जनसंख्या मूल्य को शामिल करते हैं।

लेकिन आपको इन व्यवहारों का लाभ उठाने से पहले आदर्श व्यवहार से ऐसे विचलन की तलाश करनी होगी। इतने सारे सांख्यिकीय अभ्यास के रूप में, वास्तव में केवल एक एल्गोरिथ्म में प्लग करने के बजाय डेटा को देखना महत्वपूर्ण हो सकता है। उदाहरण के लिए, एक पक्षपाती बूटस्ट्रैप परिणाम के लिए CI के बारे में यह प्रश्न उपरोक्त कोड में दिखाए गए पहले 3 CI के लिए परिणाम दिखाता है, लेकिन बीसीए सीआई को छोड़कर। जब मैंने बीसीए सीआई को शामिल करने के लिए उस प्रश्न में दिखाए गए विश्लेषण को पुन: पेश करने की कोशिश की, तो मुझे इसका परिणाम मिला:

> boot.ci(boot(xi,H.boot,R=1000))
Error in bca.ci(boot.out, conf, index[1L], L = L, t = t.o, t0 = t0.o,  : 
estimated adjustment 'w' is infinite

जहाँ 'w' पूर्वाग्रह सुधार में शामिल है। जांच की जा रही आँकड़ा का एक निश्चित अधिकतम मूल्य होता है और प्लग-इन अनुमान जो बूटस्ट्रैप किया गया था, स्वाभाविक रूप से पक्षपाती था। इस तरह के परिणाम प्राप्त करना यह इंगित करना चाहिए कि बूटस्ट्रैप्ड अंतर्निहित सामान्य मान्यताओं का उल्लंघन किया जा रहा है।

एक महत्वपूर्ण मात्रा का विश्लेषण ऐसी समस्याओं से बचा जाता है; भले ही एक अनुभवजन्य वितरण के पास कड़ाई से उपयोगी आँकड़े नहीं हो सकते हैं, लेकिन उचित के रूप में करीब आना एक महत्वपूर्ण लक्ष्य है। इस उत्तर के अंतिम कुछ पैराग्राफ आगे की सहायता के लिए लिंक प्रदान करते हैं, जैसे बूटस्ट्रैप के माध्यम से अनुमान लगाने के लिए पिवट प्लॉट्स कि क्या एक आंकड़ा (संभवतः कुछ डेटा परिवर्तन के बाद) पिवटल के करीब है, और कम्प्यूटेशनल रूप से महंगा लेकिन संभावित निर्णायक डबल बूटस्ट्रैप है।


धन्यवाद edm! यदि CI और परिकल्पना परीक्षण के बीच 1-1 पुनरावृत्ति है- तो बूटस्ट्रैप परीक्षण में आमतौर पर नल को पुन: उत्पन्न करने के लिए डेटासेट को स्थानांतरित करना क्यों शामिल है? ऐसा करने से, उदाहरण के लिए अंतर के वितरण के CI की गणना करने से हमें जो परिणाम मिलेगा उससे अलग परिणाम नहीं मिल रहे हैं?
जेवियर बोरेट सिसिलोट

@XavierBourretSicotte मुझे नहीं लगता कि यह बहुत सही है कि "बूटस्ट्रैप परीक्षण में आमतौर पर नल को पुन: उत्पन्न करने के लिए डेटासेट को स्थानांतरित करना शामिल है।" प्रत्येक बूटस्ट्रैप नमूना मूल नमूना / प्रयोग को दोहराने का प्रयास है, जो अंतर्निहित आबादी का प्रतिनिधित्व करने के लिए हाथ में नमूने का उपयोग कर रहा है। यदि प्रश्न में आँकड़ा महत्वपूर्ण नहीं है, लेकिन, बूट किए गए नमूनों पर विकसित CI अंतर्निहित जनसंख्या पर विकसित CI का प्रतिनिधित्व नहीं करेगा। तो आपको बीसीए या अन्य दृष्टिकोणों के साथ, यह शून्य के नीचे क्या होता है, इसके प्रति सांख्यिकीय के वितरण को सही करने की आवश्यकता है ।
ईडीएम
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.