निर्धारित करें कि यदि एक भारी पूंछ वितरित प्रक्रिया में काफी सुधार हुआ है


12

मैं यह जानने के लिए कि परिवर्तन से पहले प्रक्रिया में सुधार हुआ है या नहीं, किसी प्रक्रिया के प्रसंस्करण समय का निरीक्षण करें। यदि प्रसंस्करण समय कम हो जाता है, तो प्रक्रिया में सुधार हुआ है। प्रसंस्करण समय का वितरण वसा युक्त है, इसलिए औसत के आधार पर तुलना करना समझदारी नहीं है। इसके बजाय मैं यह जानना चाहूंगा कि क्या परिवर्तन के बाद कम प्रसंस्करण समय का निरीक्षण करने की संभावना 50% से अधिक है।

बता दें कि बदलाव के बाद प्रोसेसिंग समय के लिए रैंडम वैरिएबल है और पहले वाला है। यदि ऊपर है, तो मैं कहूंगा कि प्रक्रिया में सुधार हुआ है।XYP(X<Y)0.5

अब मेरे पास है टिप्पणियों की और टिप्पणियों के । मनाया की संभावना है ।n एक्स मीटर y जे वाई पी ( एक्स < Y ) पी = 1एक्समैंएक्सyजेYपी(एक्स<Y)पी^=1nΣमैंΣजे1एक्समैं<yजे

बारे में मैं क्या कह सकता हूं कि टिप्पणियों को और दिया गया है ?x i y jपी(एक्स<Y)एक्समैंyजे

जवाबों:


12

आपका अनुमान मैन-व्हिटनी स्टेटिस्टिक के बराबर है जिसे (थैंक्स, ग्लेन!) द्वारा विभाजित किया गया है , और इसलिए विल्कोनॉन रैंक-सम स्टैटिस्टिक (जिसे विल्कोक्सन-मान-व्हिटनी स्टेटिस्टिक के रूप में भी जाना जाता है ) के बराबर है। : , जहां का नमूना आकार है (कोई संबंध नहीं मानते।) इसलिए आप विलकॉक्सन परीक्षण के तालिकाओं / सॉफ्टवेयर का उपयोग कर सकते हैं और उन्हें वापस बदल सकते हैं। एक विश्वास अंतराल या प्राप्त करने के लिए -value।पी^यूnडब्ल्यूडब्ल्यू=यू+n(n+1)2nyयूपी

चलो के नमूने का आकार होना , = । फिर, asymptotically,एक्सएन+n

डब्ल्यू*=डब्ल्यू-(एन+1)2n(एन+1)12~एन(0,1)

स्रोत: हॉलैंडर और वोल्फ , नॉनपामेट्रिक सांख्यिकीय तरीके, लगभग पी। 117, लेकिन संभवत: अधिकांश गैर-समरूप सांख्यिकी पुस्तकें आपको वहां मिल जाएंगी।


@Glen_b - धन्यवाद, मैंने उत्तर अपडेट कर दिया है। आपने गलती के कारण के बारे में बहुत उदार अनुमान लगाया है!
जूलमैन

13

@jbowman के आकलन की समस्या के लिए एक अच्छा (अच्छा) मानक समाधान प्रदान करता है जिसे तनाव-शक्ति मॉडल के रूप में जाना जाता है ।θ=पी(एक्स<Y)

इस मामले के लिए बक्लिज़ी और ईदौस (2006) में एक और गैरपारंपरिक विकल्प प्रस्तावित किया गया था जहां और वाई स्वतंत्र हैं। यह नीचे वर्णित है।एक्सY

परिभाषा से हमारे पास ऐसा है

θ=पी(एक्स<Y)=-एफएक्स(y)Y(y)y,

जहां की CDF है एक्स और Y का घनत्व है वाई । फिर, के नमूने का उपयोग एक्स और वाई हम प्राप्त कर सकते हैं गिरी आकलनकर्ता के एफ एक्स और Y और फलस्वरूप और की आकलनकर्ता θएफएक्सएक्सYYएक्सYएफएक्सYθ

θ^=-एफ^एक्स(y)^Y(y)y

यह एक गाऊसी कर्नेल का उपयोग करके निम्नलिखित आर कोड में लागू किया गया है।

# Optimal bandwidth
h = function(x){
n = length(x)
return((4*sqrt(var(x))^5/(3*n))^(1/5))
}

# Kernel estimators of the density and the distribution
kg = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(dnorm((x[i]-data)/hb))/hb
return(r )
} 

KG = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(pnorm((x[i]-data)/hb))
return(r )
} 

# Baklizi and Eidous (2006) estimator
nonpest = function(dat1B,dat2B){
return( as.numeric(integrate(function(x) KG(x,dat1B)*kg(x,dat2B),-Inf,Inf)$value))  
}

# Example when X and Y are Cauchy
datx = rcauchy(100,0,1)
daty =  rcauchy(100,0,1)

nonpest(datx,daty)

लिए एक विश्वास अंतराल प्राप्त करने के लिए आप निम्नानुसार इस अनुमानक का बूटस्ट्रैप नमूना प्राप्त कर सकते हैं ।θ

# bootstrap
B=1000
p = rep(0,B)

for(j in 1:B){
dat1 =  sample(datx,length(datx),replace=T)
dat2 =  sample(daty,length(daty),replace=T)
p[j] = nonpest(dat1,dat2)
}

# histogram of the bootstrap sample
hist(p)

# A confidence interval (quantile type)
c(quantile(p,0.025),quantile(p,0.975))

अन्य प्रकार के बूटस्ट्रैप अंतराल को भी माना जा सकता है।


2
दिलचस्प और एक अच्छा पेपर संदर्भ (+1)। मैं इसे अपने प्रदर्शनों की सूची में जोड़ दूंगा!
16

0

एक्समैं-Yमैंपी(एक्समैं-Yमैं<0)=पीमैं{एक्समैं-Yमैं<0}मैं=1,2,,nएक्सएक्समैं<Yमैंn पी=पी(एक्समैं-Yमैं<0)एक्स/n


2
माइकल की जोड़ी बनाने का आधार क्या है?
whuber

ओपी ने कहा कि "X को परिवर्तन के बाद के प्रसंस्करण समय के लिए यादृच्छिक चर होना चाहिए और Y से पहले एक" तो शी हस्तक्षेप के बाद है और यी पहले है।
बजे माइकल आर। चेरनिक

=nएक्समैंYजे

1
आप सही हे। मुझे लगता है कि विल्कोक्सॉन जैसे कुछ सैंपल टेस्ट कुछ प्रकार के होते हैं, जैसा कि ऊपर दिए गए सुझाव के अनुसार होगा। यह दिलचस्प है कि मान-व्हिटनी के रूप में परीक्षण Xis <Yjs की संख्या को गिनता है।
माइकल आर। चेर्निक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.