मैं एक Shapiro Wilk W परीक्षण करना चाहता हूँ और Kolmogorov-Smirnov परीक्षण एक रेखीय मॉडल के अवशिष्ट पर सामान्यता की जाँच करने के लिए। मैं बस सोच रहा था कि इसके लिए कौन से अवशिष्ट का उपयोग किया जाना चाहिए - कच्चे अवशिष्ट, पियर्सन अवशिष्ट, छात्र अवशिष्ट या मानकीकृत अवशिष्ट? शापिरो-विल्क के डब्ल्यू परीक्षण के लिए यह प्रतीत होता है कि कच्चे और पियरसन अवशिष्ट के लिए परिणाम समान हैं, लेकिन दूसरों के लिए नहीं।
fit=lm(mpg ~ 1 + hp + wt, data=mtcars)
res1=residuals(fit,type="response")
res2=residuals(fit,type="pearson")
res3=rstudent(fit)
res4=rstandard(fit)
shapiro.test(res1) # W = 0.9279, p-value = 0.03427
shapiro.test(res2) # W = 0.9279, p-value = 0.03427
shapiro.test(res3) # W = 0.9058, p-value = 0.008722
shapiro.test(res4) # W = 0.9205, p-value = 0.02143
केएस के लिए एक ही सवाल, और यह भी कि क्या अवशेषों को एक सामान्य वितरण (pnorm) के खिलाफ परीक्षण किया जाना चाहिए
ks.test(res1, "pnorm") # D = 0.296, p-value = 0.005563
या एक टी-स्टूडेंट डिस्ट्रीब्यूशन ऑफ एनके -2 डिग्री ऑफ फ्रीडम, इन
ks.test(res3, "pt",df=nrow(mtcars)-2-2)
कोई सलाह शायद? इसके अलावा, परीक्षण आँकड़ों डब्ल्यू (> 0.9?) और डी के लिए अनुशंसित मूल्य क्या हैं जो वितरण के लिए पर्याप्त रूप से सामान्यता के करीब हैं और आपके अनुमान को बहुत अधिक प्रभावित नहीं करते हैं?
अंत में, क्या यह दृष्टिकोण फिटेड lm गुणांक में अनिश्चितता को ध्यान में रखता है, या इस संबंध cumres()
में पैकेज में कार्य करना gof()
बेहतर होगा?
चीयर्स, टॉम