कई मानव प्रतिभागियों के साथ एक प्रयोग पर विचार करें, प्रत्येक ने दो स्थितियों में कई बार मापा। एक मिश्रित प्रभाव मॉडल तैयार किया जा सकता है ( lme4 सिंटैक्स का उपयोग करके ):
fit = lmer(
formula = measure ~ (1|participant) + condition
)
अब, मैं इस मॉडल की भविष्यवाणियों के लिए बूटस्ट्रैप्ड आत्मविश्वास अंतराल उत्पन्न करना चाहता हूं। मुझे लगता है कि मैं एक सरल और कम्प्यूटेशनल रूप से कुशल विधि के साथ आया हूं, और मुझे यकीन है कि मैं इसके बारे में सोचने वाला पहला नहीं हूं, लेकिन मुझे इस दृष्टिकोण का वर्णन करने वाले किसी भी पूर्व प्रकाशन को खोजने में परेशानी हो रही है। यह रहा:
- मॉडल को फिट करें (ऊपर के रूप में), इसे "मूल मॉडल" कहें
- मूल मॉडल से भविष्यवाणियों को प्राप्त करें, इन "मूल भविष्यवाणियों" को कॉल करें
- प्रत्येक भागीदार से प्रत्येक प्रतिक्रिया के साथ जुड़े मूल मॉडल से अवशेष प्राप्त करें
- प्रतिस्थापन के साथ अवशेषों, नमूना लेने वाले प्रतिभागियों को फिर से भरें
- अवशिष्ट के लिए गॉसियन त्रुटि के साथ एक रैखिक मिश्रित प्रभाव मॉडल को फिट करें, इसे "अंतरिम मॉडल" कहें।
- प्रत्येक स्थिति के लिए अंतरिम मॉडल से भविष्यवाणियों की गणना करें (ये पूर्वानुमान शून्य के बहुत करीब होंगे), इन्हें "अंतरिम भविष्यवाणियां" कहें।
- मूल भविष्यवाणियों में अंतरिम भविष्यवाणियों को जोड़ें, परिणाम को "पुनरावर्ती भविष्यवाणियों" को कॉल करें
- चरण 4 को 7 के माध्यम से कई बार दोहराएं, प्रत्येक स्थिति के लिए पुनरावर्तन भविष्यवाणियों का वितरण उत्पन्न करता है जिसमें से एक बार CI की गणना कर सकते हैं।
मैंने साधारण प्रतिगमन के संदर्भ में "अवशिष्ट बूटस्ट्रैपिंग" प्रक्रियाओं को देखा है (अर्थात एक मिश्रित मॉडल नहीं) जहां अवशेषों को पुन: नमूनाकरण की इकाई के रूप में नमूना लिया जाता है और फिर प्रत्येक पुनरावृत्ति के लिए एक नया मॉडल फिट करने से पहले मूल मॉडल की भविष्यवाणियों में जोड़ा जाता है। बूटस्ट्रैप, लेकिन यह मेरे दृष्टिकोण से भिन्न प्रतीत होता है, मैं वर्णन करता हूं कि जहां अवशिष्ट कभी नहीं बदलते हैं, लोग हैं, और केवल उसके बादअंतरिम मॉडल प्राप्त किया जाता है मूल मॉडल की भविष्यवाणी खेलने में आते हैं। इस अंतिम विशेषता का वास्तव में अच्छा पक्ष-लाभ है कि मूल मॉडल की जटिलता में कोई फर्क नहीं पड़ता, अंतरिम मॉडल हमेशा एक गाऊसी रैखिक मिश्रित मॉडल के रूप में फिट हो सकता है, जो कुछ मामलों में काफी तेजी से हो सकता है। उदाहरण के लिए, मेरे पास हाल ही में द्विपद डेटा और 3 भविष्यवक्ता चर थे, जिनमें से एक पर मुझे संदेह था कि यह दृढ़ता से गैर-रैखिक प्रभाव पैदा करेगा, इसलिए मुझे द्विपद लिंक फ़ंक्शन का उपयोग करके सामान्यीकृत मिश्रित मिश्रित मॉडलिंग को नियोजित करना था । इस मामले में मूल मॉडल को फिट करने में एक घंटे से अधिक का समय लगा, जबकि प्रत्येक पुनरावृत्ति पर गाऊसी LMM को फिट करने में मात्र कुछ सेकंड का समय लगा।
मैं वास्तव में इस पर प्राथमिकता का दावा नहीं करना चाहता हूं यदि यह पहले से ही एक ज्ञात प्रक्रिया है, तो मैं बहुत आभारी रहूंगा यदि कोई भी इस बारे में जानकारी प्रदान कर सकता है जहां यह पहले वर्णित किया गया हो। (इसके अलावा, अगर इस दृष्टिकोण के साथ कोई समस्या है, तो मुझे बताएं!)