अवशिष्टों की सामान्यता के लिए परीक्षण पर भरोसा करने के बजाय, तर्कसंगत निर्णय के साथ सामान्यता का आकलन करने का प्रयास करें। सामान्यता परीक्षण आपको यह नहीं बताते हैं कि आपका डेटा सामान्य है, केवल यह नहीं है। लेकिन यह देखते हुए कि डेटा एक नमूना है आप काफी कुछ हो सकता है वे वास्तव में एक परीक्षण के बिना सामान्य नहीं हैं। आवश्यकता लगभग सामान्य है। परीक्षण आपको यह नहीं बता सकता है। टेस्ट बड़े एन या अधिक गंभीरता से बहुत संवेदनशील हो जाते हैं, एन के साथ संवेदनशीलता में भिन्नता होती है। आपका एन उस सीमा में होता है, जहां संवेदनशीलता अधिक होने लगती है। यदि आप R में कई बार निम्नलिखित सिमुलेशन चलाते हैं और भूखंडों को देखते हैं तो आप देखेंगे कि सामान्यता परीक्षण सामान्य वितरण की अच्छी संख्या पर "सामान्य नहीं" कह रहा है।
# set the plot area to show two plots side by side (make the window wide)
par(mfrow = c(1, 2))
n <- 158 # use the N we're concerned about
# Run this a few times to get an idea of what data from a
# normal distribution should look like.
# especially note how variable the histograms look
y <- rnorm(n) # n numbers from normal distribution
# view the distribution
hist(y)
qqnorm(y);qqline(y)
# run this section several times to get an idea what data from a normal
# distribution that fails the normality test looks like
# the following code block generates random normal distributions until one
# fails a normality test
p <- 1 # set p to a dummy value to start with
while(p >= 0.05) {
y <- rnorm(n)
p <- shapiro.test(y)$p.value }
# view the distribution that failed
hist(y)
qqnorm(y);qqline(y)
उम्मीद है, सिमुलेशन के माध्यम से जाने के बाद आप देख सकते हैं कि एक सामान्यता परीक्षण आसानी से सुंदर दिखने वाले डेटा को अस्वीकार कर सकता है और सामान्य वितरण से डेटा सामान्य से काफी दूर लग सकता है। यदि आप उस कोशिश का एक चरम मूल्य देखना चाहते हैंn <- 1000
। वितरण सभी सामान्य दिखेंगे, लेकिन फिर भी निम्न एन मान के समान दर पर परीक्षण में विफल रहेंगे। और इसके विपरीत, कम एन वितरण के साथ जो परीक्षा पास करते हैं, सामान्य से बहुत दूर दिख सकते हैं।
एसपीएसएस में मानक अवशिष्ट भूखंड सामान्यता का आकलन करने के लिए बहुत उपयोगी नहीं है। आप आउटलेर, रेंज, फिट की अच्छाई, और शायद उत्तोलन भी देख सकते हैं। लेकिन सामान्यता इससे प्राप्त करना मुश्किल है। हिस्टोग्राम, क्वांटाइल-क्वांटाइल सामान्य भूखंडों और अवशिष्ट भूखंडों की तुलना करते हुए निम्नलिखित अनुकरण का प्रयास करें।
par(mfrow = c(1, 3)) # making 3 graphs in a row now
y <- rnorm(n)
hist(y)
qqnorm(y); qqline(y)
plot(y); abline(h = 0)
अंतिम कथानक से सामान्यता, या किसी भी चीज़ के बारे में बताना असाधारण रूप से कठिन है, इसलिए सामान्य रूप से बहुत निदान नहीं है।
सारांश में, यह आम तौर पर सामान्यता परीक्षणों पर निर्भर नहीं करने की सिफारिश की जाती है, बल्कि अवशिष्ट के नैदानिक भूखंडों पर। उन भूखंडों या आपके प्रश्न में वास्तविक मूल्यों के बिना, किसी को भी आपके लिए विश्लेषण या परिवर्तन के संदर्भ में आपके डेटा की ठोस सलाह देना बहुत कठिन है। सबसे अच्छी मदद पाने के लिए, कच्चा डेटा प्रदान करें।