क्या इस प्रकार के बूटस्ट्रैपिंग का कोई नाम है?


9

कई मानव प्रतिभागियों के साथ एक प्रयोग पर विचार करें, प्रत्येक ने दो स्थितियों में कई बार मापा। एक मिश्रित प्रभाव मॉडल तैयार किया जा सकता है ( lme4 सिंटैक्स का उपयोग करके ):

fit = lmer(
    formula = measure ~ (1|participant) + condition
)

अब, मैं इस मॉडल की भविष्यवाणियों के लिए बूटस्ट्रैप्ड आत्मविश्वास अंतराल उत्पन्न करना चाहता हूं। मुझे लगता है कि मैं एक सरल और कम्प्यूटेशनल रूप से कुशल विधि के साथ आया हूं, और मुझे यकीन है कि मैं इसके बारे में सोचने वाला पहला नहीं हूं, लेकिन मुझे इस दृष्टिकोण का वर्णन करने वाले किसी भी पूर्व प्रकाशन को खोजने में परेशानी हो रही है। यह रहा:

  1. मॉडल को फिट करें (ऊपर के रूप में), इसे "मूल मॉडल" कहें
  2. मूल मॉडल से भविष्यवाणियों को प्राप्त करें, इन "मूल भविष्यवाणियों" को कॉल करें
  3. प्रत्येक भागीदार से प्रत्येक प्रतिक्रिया के साथ जुड़े मूल मॉडल से अवशेष प्राप्त करें
  4. प्रतिस्थापन के साथ अवशेषों, नमूना लेने वाले प्रतिभागियों को फिर से भरें
  5. अवशिष्ट के लिए गॉसियन त्रुटि के साथ एक रैखिक मिश्रित प्रभाव मॉडल को फिट करें, इसे "अंतरिम मॉडल" कहें।
  6. प्रत्येक स्थिति के लिए अंतरिम मॉडल से भविष्यवाणियों की गणना करें (ये पूर्वानुमान शून्य के बहुत करीब होंगे), इन्हें "अंतरिम भविष्यवाणियां" कहें।
  7. मूल भविष्यवाणियों में अंतरिम भविष्यवाणियों को जोड़ें, परिणाम को "पुनरावर्ती भविष्यवाणियों" को कॉल करें
  8. चरण 4 को 7 के माध्यम से कई बार दोहराएं, प्रत्येक स्थिति के लिए पुनरावर्तन भविष्यवाणियों का वितरण उत्पन्न करता है जिसमें से एक बार CI की गणना कर सकते हैं।

मैंने साधारण प्रतिगमन के संदर्भ में "अवशिष्ट बूटस्ट्रैपिंग" प्रक्रियाओं को देखा है (अर्थात एक मिश्रित मॉडल नहीं) जहां अवशेषों को पुन: नमूनाकरण की इकाई के रूप में नमूना लिया जाता है और फिर प्रत्येक पुनरावृत्ति के लिए एक नया मॉडल फिट करने से पहले मूल मॉडल की भविष्यवाणियों में जोड़ा जाता है। बूटस्ट्रैप, लेकिन यह मेरे दृष्टिकोण से भिन्न प्रतीत होता है, मैं वर्णन करता हूं कि जहां अवशिष्ट कभी नहीं बदलते हैं, लोग हैं, और केवल उसके बादअंतरिम मॉडल प्राप्त किया जाता है मूल मॉडल की भविष्यवाणी खेलने में आते हैं। इस अंतिम विशेषता का वास्तव में अच्छा पक्ष-लाभ है कि मूल मॉडल की जटिलता में कोई फर्क नहीं पड़ता, अंतरिम मॉडल हमेशा एक गाऊसी रैखिक मिश्रित मॉडल के रूप में फिट हो सकता है, जो कुछ मामलों में काफी तेजी से हो सकता है। उदाहरण के लिए, मेरे पास हाल ही में द्विपद डेटा और 3 भविष्यवक्ता चर थे, जिनमें से एक पर मुझे संदेह था कि यह दृढ़ता से गैर-रैखिक प्रभाव पैदा करेगा, इसलिए मुझे द्विपद लिंक फ़ंक्शन का उपयोग करके सामान्यीकृत मिश्रित मिश्रित मॉडलिंग को नियोजित करना था । इस मामले में मूल मॉडल को फिट करने में एक घंटे से अधिक का समय लगा, जबकि प्रत्येक पुनरावृत्ति पर गाऊसी LMM को फिट करने में मात्र कुछ सेकंड का समय लगा।

मैं वास्तव में इस पर प्राथमिकता का दावा नहीं करना चाहता हूं यदि यह पहले से ही एक ज्ञात प्रक्रिया है, तो मैं बहुत आभारी रहूंगा यदि कोई भी इस बारे में जानकारी प्रदान कर सकता है जहां यह पहले वर्णित किया गया हो। (इसके अलावा, अगर इस दृष्टिकोण के साथ कोई समस्या है, तो मुझे बताएं!)


1
बस एक पक्ष टिप्पणी है, लेकिन यह प्रासंगिक हो सकता है। पीटर मैक्कुलघ का बर्नौली में एक पेपर है, जहां वह दिखाता है कि कोई बूटस्ट्रैप यादृच्छिक प्रभाव मॉडल में विचरण का सही अनुमान नहीं लगाता है।
कार्डिनल

@ माइक (+1) यह एक बहुत अच्छा प्रश्न है!
chl

1
आप प्रतिभागियों को प्रतिस्थापन के साथ फिर से क्यों नहीं भेजेंगे और फिर उनके डेटा को भी फिर से तैयार करेंगे? ऐसा लगता है कि एक वितरण के साथ बहुस्तरीय मॉडल की भावना को एक दूसरे के भीतर रखने के लिए अधिक है। एक और बिंदु यह है कि द्विपद डेटा के साथ एक संभावित समस्या है क्योंकि नमूनों के चरम सिरों के अभिसरण की संभावना कम होगी।
जॉन

@ जॉन: मैं अवशेषों को फिर से भरना पसंद करता हूं क्योंकि (1) यह उस समय के लिए तेज़ होता है जब मूल मॉडल अनुमान लगाने के लिए श्रमसाध्य होता है, और (2) यह CI उपज देता है जिसने प्रतिभागी साधनों के बीच परिवर्तनशीलता के कारण परिवर्तनशीलता को हटा दिया है। # 2 का मतलब है कि जब आप कच्चा डेटा और बार-बार प्रभाव दिखाना चाहते हैं, तो आपको कई प्लॉट नहीं बनाने होंगे; आप केवल कच्चे डेटा पर इन-विचरण-हटाए गए CI को प्लॉट कर सकते हैं और वे व्यक्तियों के भीतर दोहराए गए शर्तों की तुलना के लिए उपयुक्त होंगे। दी गई इस तरह के सीआई के अर्थ पर भ्रम हो सकता है, लेकिन यह आंकड़ा कैप्शन के लिए है।
माइक लॉरेंस

@ जॉन: क्या आप द्विपदीय डेटा के लिए इस दृष्टिकोण की प्रयोज्यता के बारे में अपने डर पर विस्तार से बता सकते हैं?
माइक लॉरेंस

जवाबों:


-1

मेरी पुस्तक बूटस्ट्रैप मेथड्स 2 संस्करण में 2007 तक की एक विशाल ग्रंथ सूची है। भले ही मैं पुस्तक में विषय को कवर नहीं करता हूं लेकिन संदर्भ ग्रंथ सूची में हो सकता है। बेशक सही शब्दों के साथ Google खोज बेहतर हो सकती है। फ्रीडमैन, पीटर्स और नवीदी ने रेखीय प्रतिगमन और अर्थमितीय मॉडल में भविष्यवाणी के लिए बूटस्ट्रैपिंग की, लेकिन मुझे यकीन नहीं है कि मिश्रित मॉडल मामले पर क्या किया गया है। रेजिन के लिए स्टाइन के 1985 जेएएसए पेपर बूटस्ट्रैप भविष्यवाणी अंतराल कुछ ऐसा है जो आपको बहुत दिलचस्प लगेगा यदि आपने इसे पहले से नहीं देखा है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.