मैं आमतौर पर डेटा के साथ सौदा करता हूं, जहां प्रत्येक व्यक्ति 2 या अधिक स्थितियों में से प्रत्येक में कई बार मापा जाता है। मैं हाल ही में मिश्रित प्रभावों के साथ खेल रहा हूं, स्थितियों के बीच अंतर के सबूतों का मूल्यांकन करने के लिए, individual
एक यादृच्छिक प्रभाव के रूप में मॉडलिंग करना । इस तरह के मॉडलिंग से भविष्यवाणियों के बारे में अनिश्चितता की कल्पना करने के लिए, मैं बूटस्ट्रैपिंग का उपयोग कर रहा हूं, जहां बूटस्ट्रैप के प्रत्येक पुनरावृत्ति पर दोनों व्यक्तियों और टिप्पणियों-भीतर-स्थितियों-भीतर-व्यक्तियों को प्रतिस्थापन के साथ नमूना किया जाता है और एक नया मिश्रित प्रभाव मॉडल की गणना की जाती है, जिसमें से भविष्यवाणियों की गणना की जाती है प्राप्त कर रहे हैं। यह गॉसियन त्रुटि मानने वाले डेटा के लिए ठीक काम करता है, लेकिन जब डेटा द्विपद होते हैं, तो बूटस्ट्रैपिंग में बहुत लंबा समय लग सकता है क्योंकि प्रत्येक पुनरावृत्ति को अपेक्षाकृत कंप्यूट-गहन द्विपद मिश्रित प्रभाव मॉडल की गणना करनी चाहिए।
एक विचार यह था कि मैं मूल मॉडल से संभवतः अवशिष्टों का उपयोग कर सकता हूं, फिर बूटस्ट्रैपिंग में कच्चे आंकड़ों के बजाय इन अवशिष्टों का उपयोग करें, जो मुझे बूटस्ट्रैप के प्रत्येक पुनरावृत्ति पर एक गाऊसी मिश्रित प्रभाव मॉडल की गणना करने की अनुमति देगा। कच्चे डेटा के द्विपद मॉडल से मूल भविष्यवाणियों को जोड़ना अवशिष्ट से बूटस्ट्रैप्ड भविष्यवाणियों से मूल भविष्यवाणियों के लिए 95% सीआई प्राप्त होता है।
हालाँकि, मैंने हाल ही में इस दृष्टिकोण का एक सरल मूल्यांकन कोडित किया है, दो स्थितियों के बीच कोई अंतर नहीं होने और 95% आत्मविश्वास अंतराल के अनुपात की गणना करने में शून्य को शामिल करने में विफल रहा है, और मैंने पाया कि उपरोक्त अवशिष्ट-आधारित बूटस्ट्रैपिंग प्रक्रिया पैदावार को काफी मजबूत करती है। रूढ़िवादी अंतराल (वे समय के 5% से अधिक शून्य को बाहर करते हैं)। इसके अलावा, मैंने तब कोड (पिछले लिंक के समान) को इस दृष्टिकोण के समान मूल्यांकन के रूप में डेटा पर लागू किया गया था जो मूल रूप से गाऊसी है, और यह समान (हालांकि चरम के रूप में नहीं) विरोधी रूढ़िवादी सीआईएस प्राप्त किया। किसी भी विचार क्यों यह हो सकता है?