ऐसे कई मुद्दे हैं जो आपके बिखराव मैट्रिक्स से किसी भी उपयोगी जानकारी को निकालना मुश्किल या असंभव बना देते हैं।
आपके पास बहुत सारे चर एक साथ प्रदर्शित होते हैं। जब आपके पास स्कैल्पलोट मैट्रिक्स में बहुत सारे चर होते हैं, तो प्रत्येक प्लॉट उपयोगी होने के लिए बहुत छोटा हो जाता है। ध्यान देने वाली बात यह है कि कई भूखंडों की नकल की जाती है, जो अंतरिक्ष को बर्बाद करते हैं। इसके अलावा, यद्यपि आप हर संयोजन को देखना चाहते हैं, आपको उन सभी को एक साथ करने की आवश्यकता नहीं है। ध्यान दें कि आप एक स्कैल्पलॉट मैट्रिक्स को चार या पांच (एक संख्या जो उपयोगी दृश्यमान है) के छोटे ब्लॉकों में तोड़ सकते हैं। आपको बस प्रत्येक ब्लॉक के लिए कई प्लॉट बनाने होंगे।
चूंकि आपके पास अंतरिक्ष में असतत बिंदुओं पर बहुत अधिक डेटा है , इसलिए वे एक दूसरे के ऊपर स्टैकिंग को समाप्त करते हैं। इस प्रकार, आप यह नहीं देख सकते हैं कि प्रत्येक स्थान पर कितने अंक हैं। इससे निपटने में आपकी मदद करने के लिए कई तरकीबें हैं।
- .5
- इतने डेटा के साथ, यहां तक कि घबराना भी पेटेंट को मुश्किल बना देगा। आप ऐसे रंगों का उपयोग कर सकते हैं जो अत्यधिक संतृप्त हैं, लेकिन इसके लिए काफी हद तक पारदर्शी हैं । जहां एक-दूसरे के ऊपर ढेर सारा डेटा जमा होता है, वहां का रंग गहरा हो जाएगा, और जहां थोड़ा घनत्व होगा, वहां का रंग हल्का हो जाएगा।
- काम करने की पारदर्शिता के लिए, आपको अपना डेटा प्रदर्शित करने के लिए ठोस प्रतीकों की आवश्यकता होगी , जबकि R डिफ़ॉल्ट रूप से खोखले हलकों का उपयोग करता है।
इन रणनीतियों का उपयोग करते हुए, यहां कुछ उदाहरण आर कोड और किए गए भूखंड हैं:
# the alpha argument in rgb() lets you set the transparency
cols2 = c(rgb(red=255, green=0, blue=0, alpha=50, maxColorValue=255),
rgb(red=0, green=0, blue=255, alpha=50, maxColorValue=255) )
cols2 = ifelse(breast$class==2, cols2[1], cols2[2])
# here we jitter the data
set.seed(6141) # this makes the example exactly reproducible
jbreast = apply(breast[,1:9], 2, FUN=function(x){ jitter(x, amount=.5) })
jbreast = cbind(jbreast, class=breast[,10]) # the class variable is not jittered
windows() # the 1st 5 variables, using pch=16
pairs(jbreast[,1:5], col=cols2, pch=16)
windows() # the 2nd 5 variables
pairs(jbreast[,6:10], col=cols2, pch=16)
windows() # to match up the 1st & 2nd sets requires more coding
layout(matrix(1:25, nrow=5, byrow=T))
par(mar=c(.5,.5,.5,.5), oma=c(2,2,2,2))
for(i in 1:5){
for(j in 6:10){
plot(jbreast[,j], jbreast[,i], col=cols2, pch=16,
axes=F, main="", xlab="", ylab="")
box()
if(j==6 ){ mtext(colnames(jbreast)[i], side=2, cex=.7, line=1) }
if(i==5 ){ mtext(colnames(jbreast)[j], side=1, cex=.7, line=1) }
if(j==10){ axis(side=4, seq(2,10,2), cex.axis=.8) }
if(i==1 ){ axis(side=3, seq(2,10,2), cex.axis=.8) }
}
}