निम्नलिखित स्थिति मान लें:
हमारे पास एक बड़ी संख्या है (उदाहरण के लिए 20) छोटे समूह के आकार (जैसे n = 3) के साथ। मैंने देखा कि अगर मैं समान वितरण से मान उत्पन्न करता हूं, तो अवशिष्ट लगभग सामान्य दिखाई देंगे, भले ही त्रुटि वितरण समान हो। निम्नलिखित आर कोड इस व्यवहार को प्रदर्शित करता है:
n.group = 200
n.per.group = 3
x <- runif(n.group * n.per.group)
gr <- as.factor(rep(1:n.group, each = n.per.group))
means <- tapply(x, gr, mean)
x.res <- x - means[gr]
hist(x.res)
यदि मैं तीन के समूह में एक नमूने के अवशिष्ट को देखता हूं, तो व्यवहार का कारण स्पष्ट है:
चूँकि यादृच्छिक चर का योग है, न कि भिन्न मानक विचलन के साथ इसका वितरण व्यक्तिगत शर्तों की तुलना में सामान्य वितरण के काफी करीब है।
अब मान लें कि नकली डेटा के बजाय वास्तविक डेटा के साथ मेरी भी यही स्थिति है। मैं आकलन करना चाहता हूं कि सामान्यता के संबंध में एनोवा की धारणाएं हैं या नहीं। अधिकांश अनुशंसित प्रक्रियाएं अवशिष्ट के दृश्य निरीक्षण (जैसे QQ- प्लॉट) या अवशिष्ट पर एक सामान्यता परीक्षण की सलाह देती हैं। जैसा कि ऊपर दिया गया मेरा उदाहरण छोटे समूहों के आकार के लिए वास्तव में इष्टतम नहीं है।
जब मेरे पास छोटे आकार के कई समूह हैं तो क्या कोई बेहतर विकल्प है?