क्यूक्यू की साजिश सामान्य लगती है लेकिन शापिरो-विल्क परीक्षण अन्यथा कहता है

आर में, मेरे पास 348 उपायों का एक नमूना है, और जानना चाहता हूं कि क्या मैं यह मान सकता हूं कि यह सामान्य रूप से भविष्य के परीक्षणों के लिए वितरित किया गया है।

अनिवार्य रूप से एक और स्टैक उत्तर के बाद , मैं घनत्व प्लॉट और QQ प्लॉट को देख रहा हूं:

plot(density(Clinical$cancer_age))

qqnorm(Clinical$cancer_age);qqline(Clinical$cancer_age, col = 2)

मेरे पास सांख्यिकी में एक मजबूत अनुभव नहीं है, लेकिन वे सामान्य वितरण के उदाहरणों की तरह दिखते हैं जिन्हें मैंने देखा है।

फिर मैं शापिरो-विलक परीक्षण चला रहा हूं:

shapiro.test(Clinical$cancer_age)

> Shapiro-Wilk normality test

data:  Clinical$cancer_age
W = 0.98775, p-value = 0.004952

अगर मैं इसे सही ढंग से व्याख्या करता हूं, तो यह बताता है कि यह अशक्त परिकल्पना को अस्वीकार करना सुरक्षित है, जो कि वितरण सामान्य है।

हालांकि, मुझे दो स्टैक पोस्ट ( यहां और यहां ) का सामना करना पड़ा है , जो इस परीक्षण की उपयोगिता को दृढ़ता से रेखांकित करता है। ऐसा लगता है कि यदि नमूना बड़ा है (348 बड़ा माना जाता है?), तो यह हमेशा कहेगा कि वितरण सामान्य नहीं है।

मुझे वह सब कैसे समझाना चाहिए? क्या मुझे क्यूक्यू प्लॉट के साथ रहना चाहिए और मान लेना चाहिए कि मेरा वितरण सामान्य है?

r normal-distribution

— francoiskroll
स्रोत

क्यू प्लॉट पूंछ में सामान्य से एक प्रस्थान दिखा रहा है। साथ ही फिट की अच्छाई का कोई भी उपयोगी परीक्षण बहुत बड़े नमूनों में अस्वीकार कर देगा क्योंकि सामान्यता से छोटे प्रस्थान होंगे जिनका पता लगाया जाता है .. यह शापिरो - विलक परीक्षण की आलोचना नहीं है, बल्कि फिट की अच्छाई के लिए परीक्षण की एक विशेषता है।

— माइकल आर। चेर्निक

आपके लिए एक सामान्य वितरण महत्वपूर्ण क्यों माना जा रहा है? आप उस धारणा के आधार पर क्या करने का इरादा रखते हैं?

— रोलैंड

रोलांड की टिप्पणियों को जोड़ने के लिए- कई परीक्षण जो औपचारिक रूप से एक सामान्य वितरण मानते हैं, वास्तव में सामान्यता से मामूली प्रस्थान के तहत काफी मजबूत होते हैं (उदाहरण के लिए क्योंकि परीक्षण सांख्यिकीय का वितरण विषम रूप से सही है)। यदि आप इस बारे में विस्तार से बता सकते हैं कि आप क्या करने का इरादा रखते हैं तो आपको अधिक उपयोगी उत्तर मिल सकते हैं।

— P.Windridge 13

@mdewey, तीक्ष्ण अवलोकन! यह घटना की उम्र नहीं है, लेकिन डीएनए मिथाइलेशन द्वारा मापा गया ट्यूमर का "उम्र" है।

— फ्रैंककोइरॉल

मुझे लगता है कि यह जांचने के लायक होगा कि क्या वे माप त्रुटियां हैं या नहीं।

— mdewey

जवाबों:

आपको यहां कोई समस्या नहीं है। आपका डेटा मेरा थोड़ा गैर-सामान्य है, लेकिन यह सामान्य है कि यह किसी भी समस्या का सामना नहीं करना चाहिए। कई शोधकर्ता सांख्यिकीय परीक्षण करते हैं जो आपके पास मौजूद सामान्य डेटा की तुलना में बहुत कम है।

मुझे तुम्हारी आँखों पर भरोसा होगा। घनत्व और क्यूक्यू प्लॉट उचित दिखते हैं, पूंछ पर कुछ मामूली सकारात्मक तिरछा होने के बावजूद। मेरी राय में, आपको इन आंकड़ों के लिए गैर-सामान्यता के बारे में चिंता करने की आवश्यकता नहीं है।

आपके पास लगभग 350 का एक एन है, और पी-मान नमूना आकारों पर बहुत निर्भर हैं। एक बड़े नमूने के साथ, लगभग कुछ भी महत्वपूर्ण हो सकता है। इस पर यहां चर्चा की गई है।

इस बहुत लोकप्रिय पोस्ट पर कुछ अविश्वसनीय उत्तर हैं जो मूल रूप से इस निष्कर्ष पर पहुंचे हैं कि गैर-सामान्यता के लिए एक अशांति-परिकल्पना महत्व परीक्षण करना "अनिवार्य रूप से बेकार है।" उस पोस्ट पर स्वीकृत उत्तर एक शानदार प्रदर्शन है, जो तब भी जब डेटा लगभग एक गाऊसी प्रक्रिया से उत्पन्न हुआ था, एक उच्च पर्याप्त नमूना आकार गैर-सामान्य परीक्षण को महत्वपूर्ण बनाता है।

क्षमा करें, मुझे एहसास हुआ कि मैंने आपके मूल प्रश्न में वर्णित एक पोस्ट से लिंक किया था। मेरा निष्कर्ष अभी भी खड़ा है, हालांकि: आपका डेटा इतना गैर-सामान्य नहीं है कि इससे समस्याएं पैदा हों।

— सफेद निशान
स्रोत

सिर्फ इसलिए कि some.researchers बहुत मैला हैं इसका मतलब यह नहीं है कि आप थोड़े टेढ़े हो सकते हैं :)। हालाँकि, मैं इस बात से सहमत हूँ कि कई सांख्यिकीय परीक्षण जो औपचारिक रूप से सामान्यता को मानते हैं, वास्तव में आप क्या खिलाते हैं

— P.Windridge

"सिर्फ इसलिए कि some.researchers बहुत मैला हैं इसका मतलब यह नहीं है कि आप थोड़े टेढ़े हो सकते हैं :)" फेयर पॉइंट; यह मेरी ओर से एक बुरा तर्क था। "हालांकि मैं इस बात से सहमत हूं कि औपचारिक रूप से सामान्यता मानने वाले कई सांख्यिकीय परीक्षण वास्तव में आपके द्वारा खिलाए जाने वाले चीजों के प्रति काफी सहिष्णु हैं।" हाँ सचमुच। किसी भी मात्रा के प्रोफेसर को मैंने इस तरह से QQ भूखंडों पर देखा है और कहा, "हाँ, यह ठीक है।"

— मार्क व्हाइट

आपका वितरण सामान्य नहीं है। पूंछ देखें (या उसके अभाव)। नीचे आप एक सामान्य क्यूक्यू प्लॉट से क्या अपेक्षा करेंगे।

विभिन्न क्यूक्यू भूखंडों की व्याख्या करने के तरीके पर इस पोस्ट का संदर्भ लें ।

ध्यान रखें कि जबकि वितरण तकनीकी रूप से सामान्य नहीं हो सकता है, यह एल्गोरिदम के लिए अर्हता प्राप्त करने के लिए सामान्य हो सकता है, जिसके लिए सामान्य स्थिति की आवश्यकता होती है।

— प्रतिकार
स्रोत

आप किस बारे में बात कर रहे हैं, मैंने 9 सामान्य qq प्लॉट बनाए, नमूने सीधे कोड set.seed (100) par (mfrow = c (3,3)) का उपयोग करके एक सामान्य वितरण बनाते हैं (i के लिए 1: 9) {x < - rnorm (350) qnnorm (x) qqline (x)} और प्लॉट (3,2) ओपी की स्थिति के समान दिखते हैं।

— जोश

आमतौर पर, आप पूंछ पर ध्यान केंद्रित नहीं करना चाहते हैं क्योंकि वे अक्सर अजीब होंगे, हालांकि बेहद खराब पूंछ आपको खराब परिणाम देंगे। आप वास्तव में मध्य पर ध्यान केंद्रित करना चाहते हैं।

— जोश

आप गलत जोश हैं। कृपया सामान्य परीक्षण के लिए अपील करें कि सामान्य स्थिति की अशक्त परिकल्पना खारिज कर दी जाए या नहीं।

— निवारण करें

आप सही हे। मैंने शुरू में आपकी पोस्ट को पढ़ा क्योंकि क्यूक प्लॉट्स सामान्य रूप से पर्याप्त नहीं थे, और मैं माफी माँगता हूँ।

— जोश

@ जोश, वितरण का मध्य शायद ही परिकल्पना परीक्षणों के लिए मायने रखता है; यह उस बात की पूंछ है। आपके पास वह पीछे है।

— गंग - मोनिका