मेरे द्वारा उपयोग की जाने वाली एक विधि एक छाया मैट्रिक्स है, जिसमें डेटासेट में संकेतक चर होते हैं जहां 1 दिया जाता है यदि कोई मान मौजूद है, और 0 अगर यह नहीं है। एक दूसरे के साथ इनका परस्पर संबंध और मूल डेटा यह निर्धारित करने में मदद कर सकता है कि चर एक साथ गायब हो रहे हैं (मार्च) या नहीं (MCAR)। R
एक उदाहरण के लिए उपयोग करना (रॉबर्ट कबाकॉफ़ द्वारा पुस्तक "आर इन एक्शन" से उधार लेना):
#Load dataset
data(sleep, package = "VIM")
x <- as.data.frame(abs(is.na(sleep)))
#Elements of x are 1 if a value in the sleep data is missing and 0 if non-missing.
head(sleep)
head(x)
#Extracting variables that have some missing values.
y <- x[which(sapply(x, sd) > 0)]
cor(y)
#We see that variables Dream and NonD tend to be missing together. To a lesser extent, this is also true with Sleep and NonD, as well as Sleep and Dream.
#Now, looking at the relationship between the presence of missing values in each variable and the observed values in other variables:
cor(sleep, y, use="pairwise.complete.obs")
#NonD is more likely to be missing as Exp, BodyWgt, and Gest increases, suggesting that the missingness for NonD is likely MAR rather than MCAR.