बूटस्ट्रैप: अनुमान विश्वास अंतराल के बाहर है


10

मैंने एक मिश्रित मॉडल के साथ बूटस्ट्रैपिंग किया (इंटरैक्शन और एक यादृच्छिक चर के साथ कई चर)। मुझे यह परिणाम मिला (केवल आंशिक):

> boot_out

ORDINARY NONPARAMETRIC BOOTSTRAP

Call:
boot(data = a001a1, statistic = bootReg, R = 1000)

Bootstrap Statistics :
          original        bias     std. error
t1*   4.887383e+01 -1.677061e+00 4.362948e-01
t2*   3.066825e+01  1.264024e+00 5.328387e-01
t3*   8.105422e+01  2.368599e+00 6.789091e-01
t4*   1.620562e+02  4.908711e+00 1.779522e+00
......

अब, मैं इंटरसेप्ट के लिए विश्वास अंतराल प्राप्त करना चाहता था:

> boot.ci(boot_out,type=c("norm","basic","perc"), index=1)
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 1000 bootstrap replicates

CALL : 
boot.ci(boot.out = boot_out, type = c("norm", "basic", 
"perc"), index = 1)

Intervals : 
Level      Normal              Basic              Percentile     
95%   (49.70, 51.41 )   (49.70, 51.41 )   (46.34, 48.05 )  
Calculations and Intervals on Original Scale

अनुमानित सही पूर्वाग्रह है:

48.873 -1.677
1 47.196

मेरे पास समस्या यह है कि सामान्य और बुनियादी सीआई अनुमान से बाहर हैं (मूल और सही)। मुझे आश्चर्य है कि कैसे सामना करना है।

अद्यतन 1:
यहाँ बहुत सी प्रतिक्रियाओं के साथ एक समान प्रश्न है।


2
बस एक टिप्पणी: क्लासिक पुस्तक में एफ्रॉन और टिब्शिरानी (1993) ने पूर्वाग्रह सुधार के खिलाफ तर्क देते हुए कहा था कि यह एक "खतरनाक" और "समस्याग्रस्त" अभ्यास है जो मानक त्रुटि को बढ़ा सकता है।
टिम

@ आपकी टिप्पणी के लिए धन्यवाद। मेरी नजर किताब पर होगी। हो सकता है, विश्वास अंतराल की गणना करने के लिए अनुमानों और बूटस्ट्रैप से * का उपयोग करने के लिए एक समाधान है। मेरे मामले में, पूर्वाग्रह केवल अनुमानों को थोड़ा प्रभावित करते हैं।
जिआर्डानो

जवाबों:


1

आप जिस कठिनाई का सामना कर रहे हैं वह निहित गणित से है। स्थान अनुमानक का एक केंद्र, या एक अंतराल अनुमानक, एक वितरण पर एक लागत समारोह के न्यूनतमकरण के रूप में सोचा जा सकता है। गाऊसी पर नमूना का मतलब द्विघात नुकसान को कम करता है, जबकि माध्य गौसेन पर पूर्ण रैखिक हानि कार्य को कम करता है। हालांकि आबादी में वे एक ही बिंदु पर स्थित हैं, फिर भी उन्हें विभिन्न लागत कार्यों का उपयोग करके खोजा जाता है।

हम आपको एक एल्गोरिथ्म देते हैं और कहते हैं "ऐसा करें," लेकिन इससे पहले कि एल्गोरिथ्म विकसित किया गया था किसी ने एक अनुकूलन समस्या हल की।

आपने तीन अंतराल और एक बिंदु अनुमानक देते हुए चार अलग-अलग लागत कार्यों को लागू किया है। चूंकि लागत कार्य अलग-अलग हैं, इसलिए वे आपको अलग-अलग बिंदु और अंतराल प्रदान करते हैं। मैन्युअल पद्धति को एकीकृत करने के अलावा इसके बारे में कुछ भी नहीं किया जाना है।

आपको अंतर्निहित कागजात खोजने की जरूरत है और अंतर्निहित कोड को देखने के लिए यह समझना होगा कि कौन से नक्शे किस प्रकार की समस्याओं के लिए हैं।

यह कहने के लिए क्षमा करें, लेकिन आपको सॉफ़्टवेयर द्वारा धोखा दिया गया था। इसने अपना काम किया, और औसतन यह बहुत अच्छा काम करता है, लेकिन आपको वह नमूना मिला जहां सॉफ्टवेयर काम नहीं करेगा। या, बल्कि, यह पूरी तरह से काम कर रहा है और आपको वास्तव में क्या कर रहा है यह निर्धारित करने के लिए साहित्य के माध्यम से अपने तरीके से पिछड़े काम करने की आवश्यकता है।


इसके लिए धन्यवाद ने अपना काम किया, और औसतन यह महान काम करता है, लेकिन आपको नमूना मिला जहां सॉफ्टवेयर काम नहीं करेगा और अन्य अंतर्दृष्टि। वास्तव में, नमूना अजीब है कि इसलिए मैं CI की गणना करने के लिए बूटस्ट्रैप का उपयोग करना चाहता था। जाहिर है, यह तरीका इतना सरल नहीं है जितना कि यह प्रतीत होता है।
जिओरडनो
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.