आर में, मेरे पास 348 उपायों का एक नमूना है, और जानना चाहता हूं कि क्या मैं यह मान सकता हूं कि यह सामान्य रूप से भविष्य के परीक्षणों के लिए वितरित किया गया है।
अनिवार्य रूप से एक और स्टैक उत्तर के बाद , मैं घनत्व प्लॉट और QQ प्लॉट को देख रहा हूं:
plot(density(Clinical$cancer_age))
qqnorm(Clinical$cancer_age);qqline(Clinical$cancer_age, col = 2)
मेरे पास सांख्यिकी में एक मजबूत अनुभव नहीं है, लेकिन वे सामान्य वितरण के उदाहरणों की तरह दिखते हैं जिन्हें मैंने देखा है।
फिर मैं शापिरो-विलक परीक्षण चला रहा हूं:
shapiro.test(Clinical$cancer_age)
> Shapiro-Wilk normality test
data: Clinical$cancer_age
W = 0.98775, p-value = 0.004952
अगर मैं इसे सही ढंग से व्याख्या करता हूं, तो यह बताता है कि यह अशक्त परिकल्पना को अस्वीकार करना सुरक्षित है, जो कि वितरण सामान्य है।
हालांकि, मुझे दो स्टैक पोस्ट ( यहां और यहां ) का सामना करना पड़ा है , जो इस परीक्षण की उपयोगिता को दृढ़ता से रेखांकित करता है। ऐसा लगता है कि यदि नमूना बड़ा है (348 बड़ा माना जाता है?), तो यह हमेशा कहेगा कि वितरण सामान्य नहीं है।
मुझे वह सब कैसे समझाना चाहिए? क्या मुझे क्यूक्यू प्लॉट के साथ रहना चाहिए और मान लेना चाहिए कि मेरा वितरण सामान्य है?