साधनों में अंतर होने पर मूल्यांकन करने के लिए आप एक टी-टेस्ट का उपयोग कर सकते हैं। अलग-अलग सैंपल साइज़ टी-टेस्ट के लिए समस्या का कारण नहीं बनते हैं, और इसके लिए किसी अतिरिक्त देखभाल के साथ परिणामों की व्याख्या की आवश्यकता नहीं होती है। अंत में, आप किसी भी व्यक्ति को एक ज्ञात वितरण और माध्य और SD के साथ एक अनंत आबादी की तुलना कर सकते हैं; उदाहरण के लिए 130 के आईक्यू वाले व्यक्ति 97.7% से अधिक होशियार हैं। हालांकि ध्यान देने वाली एक बात, यह है कि दिए गए (यानी, कुल नमूना आकार) के लिए, पावर को अधिकतम किया जाता है यदि समूह बराबर है; अत्यधिक असमान समूह आकारों के साथ, आपको प्रत्येक अतिरिक्त अवलोकन के साथ उतना अतिरिक्त रिज़ॉल्यूशन नहीं मिलता है। एनएनn
सत्ता के बारे में अपनी बात स्पष्ट करने के लिए, यहाँ R के लिए एक बहुत ही सरल अनुकरण लिखा गया है:
set.seed(9) # this makes the simulation exactly reproducible
power5050 = vector(length=10000) # these will store the p-values from each
power7525 = vector(length=10000) # simulated test to keep track of how many
power9010 = vector(length=10000) # are 'significant'
for(i in 1:10000){ # I run the following procedure 10k times
n1a = rnorm(50, mean=0, sd=1) # I'm drawing 2 samples of size 50 from 2 normal
n2a = rnorm(50, mean=.5, sd=1) # distributions w/ dif means, but equal SDs
n1b = rnorm(75, mean=0, sd=1) # this version has group sizes of 75 & 25
n2b = rnorm(25, mean=.5, sd=1)
n1c = rnorm(90, mean=0, sd=1) # this one has 90 & 10
n2c = rnorm(10, mean=.5, sd=1)
power5050[i] = t.test(n1a, n2a, var.equal=T)$p.value # here t-tests are run &
power7525[i] = t.test(n1b, n2b, var.equal=T)$p.value # the p-values are stored
power9010[i] = t.test(n1c, n2c, var.equal=T)$p.value # for each version
}
mean(power5050<.05) # this code counts how many of the p-values for
[1] 0.7019 # each of the versions are less than .05 &
mean(power7525<.05) # divides the number by 10k to compute the %
[1] 0.5648 # of times the results were 'significant'. That
mean(power9010<.05) # gives an estimate of the power
[1] 0.3261
ध्यान दें कि सभी मामलों में , लेकिन यह कि पहले मामले में और , दूसरे मामले में और , और अंतिम स्थिति में और । आगे ध्यान दें कि मानकीकृत माध्य अंतर / डेटा जनरेटिंग प्रक्रिया सभी मामलों में समान थी। हालांकि, जबकि परीक्षण 50-50 नमूने के लिए 'महत्वपूर्ण' 70% था, शक्ति 75-25 के साथ 56% थी और केवल 33% थी जब समूह का आकार 90-10 था। एन 1 = 50 एन 2 = 50 एन 1 = 75 एन 2 = 25 एन 1 = 90 एन 2 = 10N=100n1=50n2=50n1=75n2=25n1=90n2=10
मैं सादृश्य द्वारा इस बारे में सोचता हूं। यदि आप एक आयत के क्षेत्र को जानना चाहते हैं, और परिधि तय हो गई है, तो क्षेत्र को अधिकतम किया जाएगा यदि लंबाई और चौड़ाई समान हो (यानी, यदि आयत एक वर्ग है )। दूसरी ओर, लंबाई और चौड़ाई के रूप में विचलन (जैसा कि आयत लम्बी हो जाती है), क्षेत्र सिकुड़ जाता है।