मिश्रित प्रभावों से अवशिष्टों को बूटस्ट्रैप करने से मॉडल विरोधी रूढ़िवादी विश्वास अंतराल क्यों पैदा होता है?


11

मैं आमतौर पर डेटा के साथ सौदा करता हूं, जहां प्रत्येक व्यक्ति 2 या अधिक स्थितियों में से प्रत्येक में कई बार मापा जाता है। मैं हाल ही में मिश्रित प्रभावों के साथ खेल रहा हूं, स्थितियों के बीच अंतर के सबूतों का मूल्यांकन करने के लिए, individualएक यादृच्छिक प्रभाव के रूप में मॉडलिंग करना । इस तरह के मॉडलिंग से भविष्यवाणियों के बारे में अनिश्चितता की कल्पना करने के लिए, मैं बूटस्ट्रैपिंग का उपयोग कर रहा हूं, जहां बूटस्ट्रैप के प्रत्येक पुनरावृत्ति पर दोनों व्यक्तियों और टिप्पणियों-भीतर-स्थितियों-भीतर-व्यक्तियों को प्रतिस्थापन के साथ नमूना किया जाता है और एक नया मिश्रित प्रभाव मॉडल की गणना की जाती है, जिसमें से भविष्यवाणियों की गणना की जाती है प्राप्त कर रहे हैं। यह गॉसियन त्रुटि मानने वाले डेटा के लिए ठीक काम करता है, लेकिन जब डेटा द्विपद होते हैं, तो बूटस्ट्रैपिंग में बहुत लंबा समय लग सकता है क्योंकि प्रत्येक पुनरावृत्ति को अपेक्षाकृत कंप्यूट-गहन द्विपद मिश्रित प्रभाव मॉडल की गणना करनी चाहिए।

एक विचार यह था कि मैं मूल मॉडल से संभवतः अवशिष्टों का उपयोग कर सकता हूं, फिर बूटस्ट्रैपिंग में कच्चे आंकड़ों के बजाय इन अवशिष्टों का उपयोग करें, जो मुझे बूटस्ट्रैप के प्रत्येक पुनरावृत्ति पर एक गाऊसी मिश्रित प्रभाव मॉडल की गणना करने की अनुमति देगा। कच्चे डेटा के द्विपद मॉडल से मूल भविष्यवाणियों को जोड़ना अवशिष्ट से बूटस्ट्रैप्ड भविष्यवाणियों से मूल भविष्यवाणियों के लिए 95% सीआई प्राप्त होता है।

हालाँकि, मैंने हाल ही में इस दृष्टिकोण का एक सरल मूल्यांकन कोडित किया है, दो स्थितियों के बीच कोई अंतर नहीं होने और 95% आत्मविश्वास अंतराल के अनुपात की गणना करने में शून्य को शामिल करने में विफल रहा है, और मैंने पाया कि उपरोक्त अवशिष्ट-आधारित बूटस्ट्रैपिंग प्रक्रिया पैदावार को काफी मजबूत करती है। रूढ़िवादी अंतराल (वे समय के 5% से अधिक शून्य को बाहर करते हैं)। इसके अलावा, मैंने तब कोड (पिछले लिंक के समान) को इस दृष्टिकोण के समान मूल्यांकन के रूप में डेटा पर लागू किया गया था जो मूल रूप से गाऊसी है, और यह समान (हालांकि चरम के रूप में नहीं) विरोधी रूढ़िवादी सीआईएस प्राप्त किया। किसी भी विचार क्यों यह हो सकता है?


हम्म, मैंने अभी देखा कि दोनों मामलों के लिए डेटा जनरेटिंग कोड में मैंने वास्तव में किसी भी वैयक्तिक परिवर्तनशीलता को नहीं जोड़ा है कि एक व्यक्ति को आमतौर पर रैंडम प्रभाव के रूप में मॉडलिंग व्यक्तियों द्वारा समाप्त करने में रुचि होती है। मैं देखूंगा कि क्या इस परिवर्तनशीलता को जोड़ने से परिणाम बदल जाता है; कुछ ही घंटों में वापस ...
माइक लॉरेंस

अगर मुझे सही से याद है, तो बूटस्ट्रैप अनुमान को सही जनसंख्या अनुमान के करीब बनाता है। यह विश्वास अंतराल के बारे में कुछ नहीं कहता है। (cf. केसर सिंह, एफ्रॉन के बूटस्ट्रैप की विषमतापूर्ण सटीकता पर। एन। सांख्यिकीविद, 1981, 9, 1187-1195)
suncoolsu

@me: मैं पुष्टि कर सकता हूं कि डेटा जनरेशन फ़ंक्शन में बीच-बीच की परिवर्तनशीलता के अलावा बूटस्ट्रैप के प्रदर्शन में सुधार नहीं होता है। मैंने उस कोड को अपलोड कर दिया है जिसका इस्तेमाल मैंने मूल पोस्ट में लिंक किए गए जिप को करने के लिए किया था।
माइक लॉरेंस

@suncoolsu: मुझे पूरा यकीन है कि बूटस्ट्रैप्ड आत्मविश्वास अंतराल काफी समय से मानक है। एफ्रॉन ने 1978 के बूटस्ट्रैपिंग प्रक्रिया का वर्णन करते हुए अपने 1978 के पेपर में उनका उल्लेख किया है, फिर उन्होंने 80 के दशक और 90 के दशक में बूटस्ट्रैप प्रक्रिया को अधिक सटीक आत्मविश्वास अंतराल (पूर्वाग्रह सुधार, अभिवृद्धि, छात्रकरण, आदि) के लिए कागजों का एक गुच्छा दिया था।
माइक लॉरेंस

1
क्या आपने मॉरिस द्वारा निम्नलिखित पेपर पढ़ा है: "जब बूटस्ट्रैपिंग की बात आती है तो BLUP सबसे अच्छा नहीं होता है"। यह आपके काम से संबंधित हो सकता है। लिंक
जूलियट

जवाबों:


7

याद रखें कि सभी बूटस्ट्रैप आत्मविश्वास अंतराल केवल कथित विश्वास स्तर पर ही हैं। बूटस्ट्रैप विश्वास अंतरालों का चयन करने के लिए संभावित तरीकों का एक समूह भी है, एफ्रॉन का प्रतिशत पद्धति, हॉल का प्रतिशत पद्धति, डबल बूटस्ट्रैप, बूटस्ट्रैप टी, झुका हुआ बूटस्ट्रैप, बीसी, बीसीए और शायद कुछ और। आपने हमें यह नहीं बताया कि आप किस विधि का उपयोग करते हैं। जेएएसए 1985 में शेंकर के पेपर से पता चला कि कुछ ची वर्ग वितरण के लिए बीसी बूटस्ट्रैप विश्वास अंतराल ने विज्ञापित प्रतिशत को कम कर दिया। छोटे नमूना आकार की समस्याओं में यह समस्या गंभीर हो सकती है। ला ब्यूडे और मेरे पास दो कागजात हैं जो दिखाते हैं कि कैसे छोटे नमूनों में भी बीसीए में बहुत खराब कवरेज हो सकता है जब एक तार्किक वितरण से भिन्नता का अनुमान लगाया जाता है और दो समानताओं की समानता के परीक्षण के लिए एक समान समस्या मौजूद होती है। यह सिर्फ एक साधारण समस्या के लिए है। मुझे उम्मीद है कि मिश्रित मॉडल से अवशेषों के साथ भी ऐसा ही हो सकता है। 2011 में विली द्वारा प्रकाशित हमारी नई पुस्तक "एन इंट्रोडक्शन टू बूटस्ट्रैप मेथड्स टू एप्लिकेशन विद आर" में हम इस विषय को धारा 3.7 में शामिल करते हैं और संदर्भ प्रदान करते हैं। आश्चर्य यह है कि कभी-कभी नमूना आकार छोटा होने पर उच्चतर क्रम सटीक बीसीए विधि से बेहतर होता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.