मिश्रित मॉडल के लिए नमूना आकार की गणना


23

मैं सोच रहा हूं कि क्या मिश्रित मॉडल में नमूना आकार की गणना के लिए कोई तरीके हैं? मैं lmerमॉडल फिट करने के लिए आर में उपयोग कर रहा हूं (मेरे पास यादृच्छिक ढलान और इंटरसेप्ट्स हैं)।


3
सिमुलेशन हमेशा एक विकल्प होता है - अर्थात किसी विशेष वैकल्पिक परिकल्पना और नमूना आकार के तहत डेटा का अनुकरण करें और मॉडल को कई बार फिर से फिट करके देखें कि आप कितनी बार ब्याज की अशक्त परिकल्पना को अस्वीकार करते हैं। मेरे अनुभव से यह काफी (कंप्यूटर) समय लेने वाला है क्योंकि इसमें प्रत्येक मॉडल के फिट होने में कम से कम कुछ सेकंड लगते हैं।
मैक्रो

जवाबों:


29

longpowerपैकेज लागू लियू और लियांग (1997) और Diggle में नमूने का आकार गणना एट अल (2002)। प्रलेखन में उदाहरण कोड है। यहाँ एक है, lmmpower()फ़ंक्शन का उपयोग कर :

> require(longpower)
> require(lme4)
> fm1 <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy) 
> lmmpower(fm1, pct.change = 0.30, t = seq(0,9,1), power = 0.80)

     Power for longitudinal linear model with random slope (Edland, 2009) 

              n = 68.46972
          delta = 3.140186
         sig2.s = 35.07153
         sig2.e = 654.941
      sig.level = 0.05
              t = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
          power = 0.8
    alternative = two.sided
       delta.CI = 2.231288, 4.049084
           Days = 10.46729
        Days CI = 7.437625, 13.496947
           n.CI = 41.18089, 135.61202

यह भी जांचें कि liu.liang.linear.power()" रैखिक मिश्रित मॉडल के लिए नमूना आकार की गणना कौन करता है"

लियू, जी।, और लियांग, केवाई (1997)। सहसंबद्ध टिप्पणियों के साथ अध्ययन के लिए नमूना आकार की गणना। बॉयोमीट्रिक्स, 53 (3), 937-47।

डिगल पीजे, हेगर्टी पीजे, लियांग के, ज़ेगर एसएल। अनुदैर्ध्य डेटा का विश्लेषण। दूसरा प्रकाशन। ऑक्सफोर्ड। सांख्यिकीय विज्ञान Serires। 2002

संपादित करें: क्लस्टरिंग के प्रभाव के लिए एक और तरीका "सही" है। एक साधारण रेखीय मॉडल में प्रत्येक अवलोकन स्वतंत्र होता है, लेकिन क्लस्टरिंग टिप्पणियों की उपस्थिति स्वतंत्र नहीं होती है, जिसे कम स्वतंत्र टिप्पणियों के रूप में माना जा सकता है - प्रभावी नमूना आकार छोटा है। प्रभावशीलता के इस नुकसान को डिजाइन प्रभाव के रूप में जाना जाता है :

डी=1+(मीटर-1)ρ
जहां औसत क्लस्टर आकार है और इंट्राक्लास सहसंबंध गुणांक (विचरण विभाजन गुणांक) है। तो एक गणना के माध्यम से प्राप्त नमूना आकार जो क्लस्टरिंग को अनदेखा करता है, द्वारा नमूना आकार प्राप्त करने के लिए फुलाया जाता है जो क्लस्टरिंग के लिए अनुमति देता है।मीटरρडी

3
यह डिज़ाइन प्रभाव केवल समग्र रैखिक आँकड़ों (मतलब, योग) के लिए प्रासंगिक है। प्रतिगमन गुणांक के लिए, DEFF अधिक है जैसे जहाँ का ICC है और त्रुटि शब्द का ICC है। (समग्र त्रुटि = क्लस्टर यादृच्छिक प्रभाव + अवलोकन विशिष्ट प्रभाव)। सहसंबंधों के उत्पाद जो छोटे होते हैं, के कारण यह DEFF भी छोटा है।
डीएफएफ=1+(मीटर-1)ρएक्सρε,
ρएक्सρε
StasK

क्या आप मुझे इस सूत्र के लिए एक उद्धरण की ओर इशारा कर सकते हैं?
जोशुआ रोसेनबर्ग

10

सरल 2 नमूना परीक्षणों से परे कुछ के लिए मैं नमूना आकार या शक्ति अध्ययन के लिए सिमुलेशन का उपयोग करना पसंद करता हूं। पूर्व-नियोजित दिनचर्या के साथ आप कभी-कभी उन मान्यताओं के आधार पर कार्यक्रमों के परिणामों के बीच बड़े अंतर देख सकते हैं जो वे बना रहे हैं (और आप यह पता लगाने में सक्षम नहीं हो सकते हैं कि वे धारणाएं क्या हैं, अकेले रहने दें यदि वे आपके अध्ययन के लिए उचित हैं)। सिमुलेशन के साथ आप सभी मान्यताओं को नियंत्रित करते हैं।

यहाँ एक उदाहरण का लिंक दिया गया है:
https://stat.ethz.ch/pipermail/r-sig-mixed-models/2009q1/001790.html


बस सोच रहा था, यह भी GLMER मॉडल के लिए काम करता है?
चार्ली ग्लीज़

1
@CarlosGlez, हाँ, यह किसी भी मॉडल के लिए काम करता है जहाँ आप डेटा का अनुकरण कर सकते हैं और उसका विश्लेषण कर सकते हैं। मैंने यह GLMER मॉडल के लिए किया है।
ग्रेग स्नो

अच्छी तरह से कहा गया है, और मैं इसे "मान्यताओं को नियंत्रित करने" के अलावा जोड़ूंगा, आप यह भी पूछ सकते हैं कि "क्या अगर" प्रश्न, इन मान्यताओं को तोड़ते हैं, और मजबूती के कुछ व्यावहारिक अर्थ निर्धारित करते हैं, जैसे कि गैर-सामान्य यादृच्छिक प्रभाव वास्तव में दक्षता को बर्बाद करते हैं।
एडम
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.