क्या आप R में एक कोलमोगोरोव-स्मिरनोव परीक्षण की शक्ति की गणना कर सकते हैं?


10

क्या आर में 2-पक्षीय कोलमोगोरोव स्मिरनोव परीक्षण के लिए एक शक्ति विश्लेषण करना संभव है?

मैं परीक्षण कर रहा हूं कि क्या दो अनुभवजन्य वितरण ks.test () का उपयोग करके भिन्न हैं, और एक शक्ति विश्लेषण जोड़ने के लिए देख रहा हूं।

मैं आर। में किसी भी परीक्षण के लिए किसी भी निर्मित शक्ति विश्लेषण नहीं पा रहा हूँ। कोई सुझाव?

संपादित करें : ये बेतरतीब ढंग से उत्पन्न वितरण हैं जो मेरे डेटा को लगभग अनुमानित करते हैं (सही नमूना आकार और घातीय वितरण के लिए अनुमानित क्षय दर के साथ)

set.seed(100)
x <- rexp(64, rate=0.34)
y <- rexp(54,rate=0.37)

#K-S test: Do x and y come from same distribution?
ks.test(x,y)

ये डेटा दो अलग-अलग समूहों में शरीर के आकार के उपाय हैं। मैं यह बताना चाहता हूं कि दोनों समूहों में अनिवार्य रूप से समान वितरण है, लेकिन एक सहयोगी द्वारा मुझसे पूछा गया था कि क्या मेरे पास यह कहने की शक्ति है कि नमूना आकार के आधार पर। मैं यहां एक घातांक वितरण से अनियमित रूप से तैयार हूं, लेकिन ये वास्तविक डेटा के करीब हैं।

अब तक, मैंने कहा है कि दो-तरफा केएस परीक्षण के आधार पर इन वितरणों में कोई महत्वपूर्ण अंतर नहीं है। मैंने दो वितरण भी किए हैं। मैं कैसे दिखा सकता हूं कि मेरे पास x और y के लिए नमूना आकार और क्षय दर को देखते हुए, इस तरह के बयान देने की शक्ति है?


4
पावर कई चीजों पर निर्भर करेगा जो दो नमूना परीक्षण के लिए निर्मित नहीं होगी। आप दी गई स्थितियों के लिए अनुकरण कर सकते हैं। इसलिए: शक्ति ने स्थिति के बारे में क्या धारणा दी है? क्या विकल्प के खिलाफ या विकल्प के अनुक्रम? उदाहरण के लिए, आप स्केल शिफ्ट विकल्प के एक सेट के खिलाफ, घातीय वितरित डेटा के लिए एक पावर वक्र की गणना (अनुकरण) कर सकते हैं। या आप किसी स्थान-शिफ्ट के खिलाफ एक सामान्य के लिए शक्ति की गणना कर सकते हैं। या आप एक वाइबुल में शक्ति की गणना कर सकते हैं क्योंकि आप आकार पैरामीटर को बदलते हैं। क्या आपके पास कुछ अतिरिक्त विवरण हैं?
Glen_b -Reinstate मोनिका

वास्तव में शक्ति की गणना करने के लिए आपको नमूना आकार की भी आवश्यकता होगी। यदि आप किसी विशेष विकल्प के विरुद्ध दिए गए नमूने के आकार की पहचान करने की कोशिश कर रहे हैं, जो कि रूट-फाइंडिंग के माध्यम से किया जा सकता है, लेकिन अक्सर आप सरल दृष्टिकोणों द्वारा इस बिंदु को पा सकते हैं (नमूना आकार के एक जोड़े की कोशिश करना आमतौर पर बहुत करीब आने के लिए पर्याप्त है )।
Glen_b -Reinstate मोनिका

क्या चर मापा जा रहा है? क्या ये समय हैं?
Glen_b -Reinstate मोनिका

@Glen_b ये बार नहीं हैं। वे दो अलग-अलग समूहों में शरीर के आकार के उपाय हैं। मैं बताना चाहता हूं कि दो समूहों में अनिवार्य रूप से समान वितरण है, लेकिन यह पूछा गया कि क्या मेरे पास यह कहने की शक्ति थी कि मैं नमूना आकार पर आधारित हूं।
सारा

1
आह! यह उपयोगी संदर्भ के दो टुकड़े हैं जो आपके प्रश्न में मदद कर सकते हैं। तो विचार यह है कि यदि आप यह दिखाते हैं कि कुछ विशेष मामूली अंतरों की पहचान करने की शक्ति उचित थी, तो एक संकेत के रूप में अस्वीकार करने में विफलता ले सकता है कि अंतर छोटा था। हां, एक पूर्व शक्ति विश्लेषण उस तर्क को बनाने में मदद कर सकता है। इस तथ्य के बाद कि मैं पैमाने पर बदलाव के एक अनुमान (और विश्वास अंतराल) की तरह कुछ पर अधिक ध्यान केंद्रित करूंगा, यह संकेत के रूप में कि अंतर वास्तव में छोटा था, साथ ही दो नमूना सीडीएफएस के एक भूखंड के रूप में।
Glen_b -Reinstate मोनिका

जवाबों:


16

घातीय स्केल-शिफ्ट विकल्पों के खिलाफ शक्ति का पता लगाना काफी सरल है।

हालाँकि, मुझे नहीं पता कि आपको अपने डेटा से गणना करने के लिए मूल्यों का उपयोग करना चाहिए कि बिजली क्या हो सकती है। उस तरह की पोस्ट हॉक पॉवर गणना काउंटर-सहज (और शायद भ्रामक) निष्कर्ष के रूप में सामने आती है।

शक्ति, महत्व स्तर की तरह, एक घटना है जो आप इस तथ्य से पहले निपटते हैं; आप एक प्राथमिक समझ (सिद्धांत, तर्क या किसी भी पिछले अध्ययन सहित) का उपयोग करने पर विचार करने के लिए विकल्पों का एक उचित सेट और एक वांछनीय प्रभाव आकार तय करेंगे

आप कई अन्य विकल्पों पर भी विचार कर सकते हैं (जैसे आप अधिक या कम तिरछा मामलों के प्रभाव पर विचार करने के लिए गामा परिवार के अंदर घातांक को एम्बेड कर सकते हैं)।

शक्ति विश्लेषण द्वारा उत्तर देने के लिए सामान्य प्रश्न जो हो सकते हैं:

1) क्या शक्ति है, किसी दिए गए नमूना आकार के लिए, कुछ प्रभाव आकार या प्रभाव आकार के सेट पर *?

2) एक नमूना आकार और शक्ति दिया, कितना बड़ा प्रभाव का पता लगाने योग्य है?

3) एक विशेष प्रभाव आकार के लिए एक वांछित शक्ति को देखते हुए, नमूना आकार की क्या आवश्यकता होगी?

* (जहां 'प्रभाव का आकार' उदारतापूर्वक अभिप्रेत है, और उदाहरण के लिए हो सकता है, साधनों का एक विशेष अनुपात, या साधनों का अंतर, आवश्यक रूप से मानकीकृत नहीं है)।

स्पष्ट रूप से आपके पास पहले से ही एक नमूना आकार है, इसलिए आप मामले में नहीं हैं (3)। आप यथोचित मामले (2) या केस (1) पर विचार कर सकते हैं।

मैं मामला (1) सुझाता हूँ (जो केस (2) से निपटने का एक तरीका भी बताता है)।

केस (1) के लिए एक दृष्टिकोण को समझाने के लिए और देखें कि यह केस (2) से कैसे संबंधित है, आइए एक विशिष्ट उदाहरण पर विचार करें:

  • स्केल शिफ्ट विकल्प

  • घातीय आबादी

  • 64 और 54 के दो नमूनों में नमूना आकार

क्योंकि नमूना आकार अलग-अलग हैं, हमें उस मामले पर विचार करना होगा जहां नमूनों में से एक में फैले रिश्तेदार 1 से छोटे और बड़े दोनों हैं (यदि वे समान आकार थे, तो समरूपता विचार केवल एक पक्ष पर विचार करना संभव बनाते हैं)। हालांकि, क्योंकि वे एक ही आकार के काफी करीब हैं, प्रभाव बहुत छोटा है। किसी भी मामले में, नमूनों में से एक के लिए पैरामीटर को ठीक करें और दूसरे को अलग-अलग करें।

तो एक क्या करता है:

पहले से:

choose a set of scale multipliers representing different alternatives
select an nsim (say 1000)
set mu1=1

गणना करने के लिए:

for each possible scale multiplier, kappa 
  repeat nsim times
    generate a sample of size n1 from Exp(mu1) and n2 from Exp(kappa*mu1)
    perform the test
  compute the rejection rate across nsim tests at this kappa

आर में, मैंने यह किया:

alpha = 0.05
n1 = 54
n2 = 64
nsim = 10000
s = c(1.1,1.2,1.5,2,2.5,3) # set up grid for kappa
s = c(1/rev(s),1,s)        #  also below and at 1
rr = array(NA,length(s))   # to hold rejection rates

for(i in seq_along(s)) rr[i]=mean(replicate(nsim,
                                    ks.test(rexp(n1,1),rexp(n2,s[i]))$p.value)<alpha
                                 )

plot(rr~s,log="x",ylim=c(0,1),type="n") #set up plot
points(rr~rev(s),col=3) # plot the reversed case to show the (tiny) asymmetry+noise
points(rr~s,col=1) # plot the "real" case last 
abline(h=alpha,col=8,lty=2) # draw in alpha

जो निम्न शक्ति "वक्र" देता है

यहाँ छवि विवरण दर्ज करें

X- अक्ष एक लॉग-स्केल पर है, y- अक्ष अस्वीकृति दर है।

यहां बताना मुश्किल है, लेकिन काले बिंदु दाएं की तुलना में बाईं ओर थोड़ा अधिक हैं (अर्थात, जब बड़ा नमूना छोटे पैमाने पर होता है तो आंशिक रूप से अधिक शक्ति होती है)।

उलटा सामान्य सीएफडी का उपयोग अस्वीकृति दर के परिवर्तन के रूप में, हम परिवर्तित अस्वीकृति दर और लॉग कप्पा के बीच संबंध बना सकते हैं (कप्पा sभूखंड में है, लेकिन एक्स-अक्ष लॉग-स्केल है) लगभग लगभग रैखिक (0 को छोड़कर) ), और सिमुलेशन की संख्या काफी अधिक थी कि शोर बहुत कम है - हम वर्तमान उद्देश्यों के लिए इसे अनदेखा कर सकते हैं।

तो हम सिर्फ रैखिक प्रक्षेप का उपयोग कर सकते हैं। नीचे दिखाए गए नमूने के आकार पर 50% और 80% शक्ति के लिए अनुमानित प्रभाव आकार हैं:

यहाँ छवि विवरण दर्ज करें

दूसरी तरफ (बड़े समूह में छोटे पैमाने पर) प्रभाव आकार केवल उस से थोड़ा स्थानांतरित कर दिया जाता है (एक छोटे से छोटे प्रभाव आकार उठा सकते हैं), लेकिन इससे थोड़ा अंतर पड़ता है, इसलिए मैं इस बिंदु पर श्रम नहीं करूंगा।

इसलिए परीक्षण एक बड़ा अंतर (1 के तराजू के अनुपात से) उठाएगा, लेकिन एक छोटा नहीं।


अब कुछ टिप्पणियों के लिए: मुझे नहीं लगता कि परिकल्पना परीक्षण विशेष रूप से ब्याज के अंतर्निहित प्रश्न के लिए प्रासंगिक हैं ( क्या वे काफी समान हैं? ), और नतीजतन ये शक्ति गणना हमें सीधे उस प्रश्न के लिए प्रासंगिक कुछ भी नहीं बताती हैं।

मुझे लगता है कि आप उस उपयोगी प्रश्न को संबोधित करते हैं जिसे आप "अनिवार्य रूप से समान" वास्तव में, संचालन के रूप में समझते हैं। वह - सांख्यिकीय गतिविधि के लिए तर्कसंगत रूप से पीछा किया - डेटा के सार्थक विश्लेषण के लिए नेतृत्व करना चाहिए।


आपको बहुत - बहुत धन्यवाद! यह वास्तव में उपयोगी है, बहुत सराहना की।
सारा

0

चूंकि कोलमोगोरोव-स्मिरनोव गैर-पैरामीट्रिक है, इसलिए परिभाषा के अनुसार कोई लागू शक्ति विश्लेषण नहीं हो सकता है। किसी प्रकार का अनुमान लगाने के लिए, आपको एक पृष्ठभूमि मॉडल (और इस प्रकार गैर-पैरामीट्रिक दुनिया से ...) को हटाने की आवश्यकता है और इसका उपयोग निम्नलिखित में से किसी एक की गणना करने के लिए करें: नमूना-आकार, एमडीई या शक्ति (यानी, आप फिक्स / दो का चयन करें और तीसरे की गणना करें)।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.