यह कई दृष्टिकोणों की तुलना करने के लिए मान्य है, लेकिन हमारी इच्छाओं / विश्वासों के पक्षधर को चुनने के उद्देश्य से नहीं।
आपके प्रश्न का मेरा उत्तर है: यह संभव है कि दो वितरण ओवरलैप करते हैं, जबकि उनके पास अलग-अलग साधन होते हैं, जो कि आपका मामला लगता है (लेकिन हमें अधिक सटीक उत्तर प्रदान करने के लिए आपके डेटा और संदर्भ को देखने की आवश्यकता होगी)।
मैं सामान्य साधनों की तुलना करने के लिए दृष्टिकोण के एक जोड़े का उपयोग करके यह वर्णन कर रहा हूं ।
1. -टेस्टt
एक और से आकार दो सिम्युलेटेड नमूनों पर विचार करें , फिर आपके मामले में अंतराल लगभग (नीचे आर कोड देखें)।70N(10,1)N(12,1)t10
rm(list=ls())
# Simulated data
dat1 = rnorm(70,10,1)
dat2 = rnorm(70,12,1)
set.seed(77)
# Smoothed densities
plot(density(dat1),ylim=c(0,0.5),xlim=c(6,16))
points(density(dat2),type="l",col="red")
# Normality tests
shapiro.test(dat1)
shapiro.test(dat2)
# t test
t.test(dat1,dat2)
हालाँकि सघनता एक अतिव्यापी दिखाती है। लेकिन याद रखें कि आप साधनों के बारे में एक परिकल्पना का परीक्षण कर रहे हैं, जो इस मामले में स्पष्ट रूप से भिन्न हैं, लेकिन, के मूल्य के कारण , घनत्व का एक ओवरलैप है।σ
2. प्रोफाइल की संभावनाμ
प्रोफ़ाइल संभावना और परिभाषा की परिभाषा के लिए कृपया 1 और 2 देखें ।
इस स्थिति में, आकार और नमूना नमूने के की संभावना केवल ।μnx¯Rp(μ)=exp[−n(x¯−μ)2]
सिम्युलेटेड डेटा के लिए, इनकी गणना R में निम्नानुसार की जा सकती है
# Profile likelihood of mu
Rp1 = function(mu){
n = length(dat1)
md = mean(dat1)
return( exp(-n*(md-mu)^2) )
}
Rp2 = function(mu){
n = length(dat2)
md = mean(dat2)
return( exp(-n*(md-mu)^2) )
}
vec=seq(9.5,12.5,0.001)
rvec1 = lapply(vec,Rp1)
rvec2 = lapply(vec,Rp2)
# Plot of the profile likelihood of mu1 and mu2
plot(vec,rvec1,type="l")
points(vec,rvec2,type="l",col="red")
जैसा कि आप देख सकते हैं, और की संभावना अंतराल किसी भी उचित स्तर पर ओवरलैप नहीं है।μ1μ2
3. पूर्ववर्ती Jeffreys का उपयोग करके का पिछला भागμ
पर विचार करें जेफ्रेय्स पूर्व की(μ,σ)
π(μ,σ)∝1σ2
प्रत्येक डेटा सेट के लिए बाद की गणना निम्नानुसार की जा सकती हैμ
# Posterior of mu
library(mcmc)
lp1 = function(par){
n=length(dat1)
if(par[2]>0) return(sum(log(dnorm((dat1-par[1])/par[2])))- (n+2)*log(par[2]))
else return(-Inf)
}
lp2 = function(par){
n=length(dat2)
if(par[2]>0) return(sum(log(dnorm((dat2-par[1])/par[2])))- (n+2)*log(par[2]))
else return(-Inf)
}
NMH = 35000
mup1 = metrop(lp1, scale = 0.25, initial = c(10,1), nbatch = NMH)$batch[,1][seq(5000,NMH,25)]
mup2 = metrop(lp2, scale = 0.25, initial = c(12,1), nbatch = NMH)$batch[,1][seq(5000,NMH,25)]
# Smoothed posterior densities
plot(density(mup1),ylim=c(0,4),xlim=c(9,13))
points(density(mup2),type="l",col="red")
फिर, साधनों के लिए विश्वसनीयता अंतराल किसी भी उचित स्तर पर ओवरलैप नहीं होता है।
निष्कर्ष में, आप देख सकते हैं कि वितरण के ओवरलैपिंग के बावजूद, ये सभी दृष्टिकोण किस प्रकार महत्वपूर्ण अंतर का संकेत देते हैं (जो कि मुख्य रुचि है)।
⋆ एक अलग दृष्टिकोण तुलना
घनत्वों के अतिव्यापीकरण के बारे में आपकी चिंताओं को देखते हुए, ब्याज की एक और मात्रा , संभावना है कि पहला यादृच्छिक चर दूसरे चर की तुलना में छोटा है। इस उत्तर के रूप में इस मात्रा का गैर-अनुमानित रूप से अनुमान लगाया जा सकता है । ध्यान दें कि यहां कोई वितरण संबंधी धारणाएं नहीं हैं। सिम्युलेटेड डेटा के लिए, यह अनुमानक , इस अर्थ में कुछ ओवरलैप दिखा रहा है, जबकि साधन काफी भिन्न हैं। कृपया, नीचे दिखाए गए R कोड पर एक नज़र डालें।0.8823825P(X<Y)0.8823825
# Optimal bandwidth
h = function(x){
n = length(x)
return((4*sqrt(var(x))^5/(3*n))^(1/5))
}
# Kernel estimators of the density and the distribution
kg = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(dnorm((x[i]-data)/hb))/hb
return(r )
}
KG = function(x,data){
hb = h(data)
k = r = length(x)
for(i in 1:k) r[i] = mean(pnorm((x[i]-data)/hb))
return(r )
}
# Baklizi and Eidous (2006) estimator
nonpest = function(dat1B,dat2B){
return( as.numeric(integrate(function(x) KG(x,dat1B)*kg(x,dat2B),-Inf,Inf)$value))
}
nonpest(dat1,dat2)
आशा है कि ये आपकी मदद करेगा।