घातीय स्केल-शिफ्ट विकल्पों के खिलाफ शक्ति का पता लगाना काफी सरल है।
हालाँकि, मुझे नहीं पता कि आपको अपने डेटा से गणना करने के लिए मूल्यों का उपयोग करना चाहिए कि बिजली क्या हो सकती है। उस तरह की पोस्ट हॉक पॉवर गणना काउंटर-सहज (और शायद भ्रामक) निष्कर्ष के रूप में सामने आती है।
शक्ति, महत्व स्तर की तरह, एक घटना है जो आप इस तथ्य से पहले निपटते हैं; आप एक प्राथमिक समझ (सिद्धांत, तर्क या किसी भी पिछले अध्ययन सहित) का उपयोग करने पर विचार करने के लिए विकल्पों का एक उचित सेट और एक वांछनीय प्रभाव आकार तय करेंगे
आप कई अन्य विकल्पों पर भी विचार कर सकते हैं (जैसे आप अधिक या कम तिरछा मामलों के प्रभाव पर विचार करने के लिए गामा परिवार के अंदर घातांक को एम्बेड कर सकते हैं)।
शक्ति विश्लेषण द्वारा उत्तर देने के लिए सामान्य प्रश्न जो हो सकते हैं:
1) क्या शक्ति है, किसी दिए गए नमूना आकार के लिए, कुछ प्रभाव आकार या प्रभाव आकार के सेट पर *?
2) एक नमूना आकार और शक्ति दिया, कितना बड़ा प्रभाव का पता लगाने योग्य है?
3) एक विशेष प्रभाव आकार के लिए एक वांछित शक्ति को देखते हुए, नमूना आकार की क्या आवश्यकता होगी?
* (जहां 'प्रभाव का आकार' उदारतापूर्वक अभिप्रेत है, और उदाहरण के लिए हो सकता है, साधनों का एक विशेष अनुपात, या साधनों का अंतर, आवश्यक रूप से मानकीकृत नहीं है)।
स्पष्ट रूप से आपके पास पहले से ही एक नमूना आकार है, इसलिए आप मामले में नहीं हैं (3)। आप यथोचित मामले (2) या केस (1) पर विचार कर सकते हैं।
मैं मामला (1) सुझाता हूँ (जो केस (2) से निपटने का एक तरीका भी बताता है)।
केस (1) के लिए एक दृष्टिकोण को समझाने के लिए और देखें कि यह केस (2) से कैसे संबंधित है, आइए एक विशिष्ट उदाहरण पर विचार करें:
क्योंकि नमूना आकार अलग-अलग हैं, हमें उस मामले पर विचार करना होगा जहां नमूनों में से एक में फैले रिश्तेदार 1 से छोटे और बड़े दोनों हैं (यदि वे समान आकार थे, तो समरूपता विचार केवल एक पक्ष पर विचार करना संभव बनाते हैं)। हालांकि, क्योंकि वे एक ही आकार के काफी करीब हैं, प्रभाव बहुत छोटा है। किसी भी मामले में, नमूनों में से एक के लिए पैरामीटर को ठीक करें और दूसरे को अलग-अलग करें।
तो एक क्या करता है:
पहले से:
choose a set of scale multipliers representing different alternatives
select an nsim (say 1000)
set mu1=1
गणना करने के लिए:
for each possible scale multiplier, kappa
repeat nsim times
generate a sample of size n1 from Exp(mu1) and n2 from Exp(kappa*mu1)
perform the test
compute the rejection rate across nsim tests at this kappa
आर में, मैंने यह किया:
alpha = 0.05
n1 = 54
n2 = 64
nsim = 10000
s = c(1.1,1.2,1.5,2,2.5,3) # set up grid for kappa
s = c(1/rev(s),1,s) # also below and at 1
rr = array(NA,length(s)) # to hold rejection rates
for(i in seq_along(s)) rr[i]=mean(replicate(nsim,
ks.test(rexp(n1,1),rexp(n2,s[i]))$p.value)<alpha
)
plot(rr~s,log="x",ylim=c(0,1),type="n") #set up plot
points(rr~rev(s),col=3) # plot the reversed case to show the (tiny) asymmetry+noise
points(rr~s,col=1) # plot the "real" case last
abline(h=alpha,col=8,lty=2) # draw in alpha
जो निम्न शक्ति "वक्र" देता है
X- अक्ष एक लॉग-स्केल पर है, y- अक्ष अस्वीकृति दर है।
यहां बताना मुश्किल है, लेकिन काले बिंदु दाएं की तुलना में बाईं ओर थोड़ा अधिक हैं (अर्थात, जब बड़ा नमूना छोटे पैमाने पर होता है तो आंशिक रूप से अधिक शक्ति होती है)।
उलटा सामान्य सीएफडी का उपयोग अस्वीकृति दर के परिवर्तन के रूप में, हम परिवर्तित अस्वीकृति दर और लॉग कप्पा के बीच संबंध बना सकते हैं (कप्पा s
भूखंड में है, लेकिन एक्स-अक्ष लॉग-स्केल है) लगभग लगभग रैखिक (0 को छोड़कर) ), और सिमुलेशन की संख्या काफी अधिक थी कि शोर बहुत कम है - हम वर्तमान उद्देश्यों के लिए इसे अनदेखा कर सकते हैं।
तो हम सिर्फ रैखिक प्रक्षेप का उपयोग कर सकते हैं। नीचे दिखाए गए नमूने के आकार पर 50% और 80% शक्ति के लिए अनुमानित प्रभाव आकार हैं:
दूसरी तरफ (बड़े समूह में छोटे पैमाने पर) प्रभाव आकार केवल उस से थोड़ा स्थानांतरित कर दिया जाता है (एक छोटे से छोटे प्रभाव आकार उठा सकते हैं), लेकिन इससे थोड़ा अंतर पड़ता है, इसलिए मैं इस बिंदु पर श्रम नहीं करूंगा।
इसलिए परीक्षण एक बड़ा अंतर (1 के तराजू के अनुपात से) उठाएगा, लेकिन एक छोटा नहीं।
अब कुछ टिप्पणियों के लिए: मुझे नहीं लगता कि परिकल्पना परीक्षण विशेष रूप से ब्याज के अंतर्निहित प्रश्न के लिए प्रासंगिक हैं ( क्या वे काफी समान हैं? ), और नतीजतन ये शक्ति गणना हमें सीधे उस प्रश्न के लिए प्रासंगिक कुछ भी नहीं बताती हैं।
मुझे लगता है कि आप उस उपयोगी प्रश्न को संबोधित करते हैं जिसे आप "अनिवार्य रूप से समान" वास्तव में, संचालन के रूप में समझते हैं। वह - सांख्यिकीय गतिविधि के लिए तर्कसंगत रूप से पीछा किया - डेटा के सार्थक विश्लेषण के लिए नेतृत्व करना चाहिए।