मेरे शोध के क्षेत्र में, डेटा को प्रदर्शित करने का एक लोकप्रिय तरीका "हैंडल-बार" के साथ एक बार चार्ट के संयोजन का उपयोग करना है। उदाहरण के लिए,
लेखक के आधार पर मानक त्रुटियों और मानक विचलन के बीच वैकल्पिक रूप से "हैंडल-बार"। आमतौर पर, प्रत्येक "बार" के लिए नमूना आकार काफी छोटा होता है - लगभग छह।
ये भूखंड जैविक विज्ञान में विशेष रूप से लोकप्रिय प्रतीत होते हैं - उदाहरण के लिए बीएमसी जीवविज्ञान, वॉल्यूम 3 के पहले कुछ पेपर देखें ।
तो आप इस डेटा को कैसे प्रस्तुत करेंगे?
मैं इन भूखंडों को नापसंद क्यों करता हूं
व्यक्तिगत रूप से मुझे ये प्लॉट पसंद नहीं हैं।
- जब नमूना आकार छोटा होता है, तो केवल व्यक्तिगत डेटा बिंदुओं को प्रदर्शित क्यों नहीं किया जाता है।
- क्या यह sd या se है जिसे प्रदर्शित किया जा रहा है? कोई भी सहमत नहीं है जिसका उपयोग करना है।
- बार का उपयोग क्यों करें। डेटा (आमतौर पर) 0 से नहीं जाता है, लेकिन ग्राफ में पहला पास यह बताता है कि यह करता है।
- रेखांकन डेटा की श्रेणी या नमूना आकार के बारे में एक विचार नहीं देता है।
आर स्क्रिप्ट
यह आर कोड है जिसका उपयोग मैंने प्लॉट जनरेट करने के लिए किया था। इस तरह से आप (यदि आप चाहें) एक ही डेटा का उपयोग कर सकते हैं।
#Generate the data
set.seed(1)
names = c("A1", "A2", "A3", "B1", "B2", "B3", "C1", "C2", "C3")
prevs = c(38, 37, 31, 31, 29, 26, 40, 32, 39)
n=6; se = numeric(length(prevs))
for(i in 1:length(prevs))
se[i] = sd(rnorm(n, prevs, 15))/n
#Basic plot
par(fin=c(6,6), pin=c(6,6), mai=c(0.8,1.0,0.0,0.125), cex.axis=0.8)
barplot(prevs,space=c(0,0,0,3,0,0, 3,0,0), names.arg=NULL, horiz=FALSE,
axes=FALSE, ylab="Percent", col=c(2,3,4), width=5, ylim=range(0,50))
#Add in the CIs
xx = c(2.5, 7.5, 12.5, 32.5, 37.5, 42.5, 62.5, 67.5, 72.5)
for (i in 1:length(prevs)) {
lines(rep(xx[i], 2), c(prevs[i], prevs[i]+se[i]))
lines(c(xx[i]+1/2, xx[i]-1/2), rep(prevs[i]+se[i], 2))
}
#Add the axis
axis(2, tick=TRUE, xaxp=c(0, 50, 5))
axis(1, at=xx+0.1, labels=names, font=1,
tck=0, tcl=0, las=1, padj=0, col=0, cex=0.1)