सबसे पहले, मैं जांच करूंगा कि क्या कार्य हाथ में लिए एक उचित सूचकांक है। यदि आप एक तिरछी वितरण के "एक विशिष्ट / या केंद्रीय मूल्य" की तलाश कर रहे हैं, तो इसका मतलब आपको गैर-प्रतिनिधि मूल्य के लिए इंगित कर सकता है। लॉग-सामान्य वितरण पर विचार करें:
x <- rlnorm(1000)
plot(density(x), xlim=c(0, 10))
abline(v=mean(x), col="red")
abline(v=mean(x, tr=.20), col="darkgreen")
abline(v=median(x), col="blue")
माध्य (लाल रेखा) डेटा के थोक से दूर है। 20% छंटनी का मतलब (हरा) और माध्य (नीला) "विशिष्ट" मान के करीब है।
परिणाम आपके "गैर-सामान्य" वितरण के प्रकार पर निर्भर करते हैं (आपके वास्तविक डेटा का हिस्टोग्राम सहायक होगा)। यदि यह तिरछा नहीं है, लेकिन भारी पूंछ है, तो आपके CI बहुत चौड़े होंगे।
किसी भी मामले में, मुझे लगता है कि वास्तव में बूटस्ट्रैपिंग एक अच्छा तरीका है, क्योंकि यह आपको विषमतापूर्ण सीआई भी दे सकता है। R
पैकेज simpleboot
एक अच्छी शुरुआत है:
library(simpleboot)
# 20% trimmed mean bootstrap
b1 <- one.boot(x, mean, R=2000, tr=.2)
boot.ci(b1, type=c("perc", "bca"))
... आपको निम्नलिखित परिणाम देता है:
# The bootstrap trimmed mean:
> b1$t0
[1] 1.144648
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 2000 bootstrap replicates
Intervals :
Level Percentile BCa
95% ( 1.062, 1.228 ) ( 1.065, 1.229 )
Calculations and Intervals on Original Scale