शापिरो-विल्क परीक्षण की व्याख्या


29

मैं आंकड़ों के लिए बहुत नया हूं और मुझे आपकी मदद की जरूरत है।
मेरे पास एक छोटा सा नमूना है, इस प्रकार है:

  H4U
  0.269
  0.357
  0.2
  0.221
  0.275
  0.277
  0.253
  0.127
  0.246

मैंने R का उपयोग करके शापिरो-विल्क परीक्षण चलाया:

shapiro.test(precisionH4U$H4U)

और मुझे निम्नलिखित परिणाम मिला:

 W = 0.9502, p-value = 0.6921

अब, यदि मैं पी-मान से 0.05 पर महत्व स्तर मानता हूं तो अल्फा (0.6921> 0.05) बड़ा है और मैं सामान्य वितरण के बारे में अशक्त परिकल्पना को अस्वीकार नहीं कर सकता, लेकिन क्या यह मुझे यह कहने की अनुमति देता है कि नमूना का सामान्य वितरण है ?

धन्यवाद!

जवाबों:


28

नहीं - आप यह नहीं कह सकते कि "नमूना का सामान्य वितरण है" या "नमूना एक आबादी से आता है जिसका सामान्य वितरण होता है", लेकिन केवल "आप इस परिकल्पना को अस्वीकार नहीं कर सकते हैं कि नमूना एक सामान्य वितरण से आता है"।

वास्तव में नमूना का सामान्य वितरण नहीं होता है ( नीचे qqplot देखें), लेकिन आप इसकी अपेक्षा नहीं करेंगे क्योंकि यह केवल एक नमूना है। अंतर्निहित आबादी के वितरण के रूप में सवाल खुला रहता है।

qqnorm( c(0.269, 0.357, 0.2, 0.221, 0.275, 0.277, 0.253, 0.127, 0.246) )

qqplot


2
qqplot मुझे लगता है कि सामान्य की तरह बहुत सुंदर लग रहा है ... आप qqnorm(rnorm(9))कई बार कोशिश कर सकते हैं ...
उत्सुक

2
@ टॉमास: शायद यह कहना बेहतर है कि "क़ाप्लॉट ऐसा लगता है जैसे कि यह एक सामान्य आबादी से आ सकता है"। इसके बजाय यह भारी पूंछ वाले वितरण से आया हो सकता है।
हेनरी

हां, qqnorm(runif(9))समान परिणाम उत्पन्न कर सकते हैं। इसलिए हम वास्तव में कुछ नहीं कह सकते ...
उत्सुक

"नमूना का सामान्य वितरण है" और "नमूना एक सामान्य वितरण है जो जनसंख्या से आता है" के बीच अंतर क्या है?
आभा डेम

1
एक सामान्य वितरण सभी लोकों पर एक निरंतर वितरण है। एक नमूना (परिमित या यहां तक ​​कि अनंत रूप से) इस तरह का वितरण स्वयं नहीं हो सकता है, भले ही यह इस वितरण वाली आबादी से खींचा गया हो।
हेनरी

17

अशक्त परिकल्पना को अस्वीकार करने में असफल होना एक संकेत है कि आपके पास जो नमूना है वह बहुत छोटा है जो आपके पास सामान्यता से विचलन लेने के लिए है - लेकिन आपका नमूना इतना छोटा है कि सामान्यता से भी काफी विचलन का पता नहीं चलेगा।

हालाँकि अधिकांश मामलों में इस परिकल्पना का परीक्षण बहुत अधिक होता है कि लोग इसके लिए सामान्यता की परीक्षा का उपयोग करते हैं - आप वास्तव में उस प्रश्न का उत्तर जानते हैं जिसका आप परीक्षण कर रहे हैं - आपके डेटा से जनसंख्या का वितरण सामान्य होने वाला नहीं है। । (यह कभी-कभी बहुत करीब हो सकता है, लेकिन वास्तव में सामान्य है?)

आपको जिस प्रश्न पर ध्यान देना चाहिए वह है 'वह वितरण वे सामान्य से खींचे जाते हैं' (यह नहीं होगा)। वास्तव में आपको जिस प्रश्न पर ध्यान देना चाहिए वह यह है कि 'क्या मैं सामान्यता से विचलन कर रहा हूं जो मेरे परिणामों को प्रभावित करने वाला है।' यदि यह संभावित रूप से एक समस्या है, तो आप एक विश्लेषण पर विचार कर सकते हैं जो उस समस्या की संभावना कम है।


10

टी

टीटी

मैं आगे अनुमान लगाता हूं कि आप अनुपात देख रहे हैं, यदि आप मान्यताओं के उल्लंघन के बारे में चिंतित थे, तो आप एक द्विपद वितरण का उपयोग कर सकते हैं।

अगर यह कुछ और चिंता थी जो आपको शापिरो परीक्षणों के लिए मिली, तो आप मेरी कही गई हर बात को अनदेखा कर सकते हैं।


आपने इसे सही पाया, मैं जानना चाहता था कि क्या मैं अपने नमूने के लिए टी परीक्षण का उपयोग कर सकता हूं। धन्यवाद!
याकूब

4

जैसा कि हेनरी ने पहले ही कहा था कि आप यह सामान्य नहीं कह सकते। बस R में कई बार निम्नलिखित कमांड चलाने का प्रयास करें:

shapiro.test(runif(9)) 

यह समान वितरण से 9 नंबरों के नमूने का परीक्षण करेगा। कई बार पी-मान 0.05 से बहुत बड़ा होगा - जिसका अर्थ है कि आप यह निष्कर्ष नहीं निकाल सकते हैं कि वितरण सामान्य है।


4

मैं यह भी देख रहा था कि शापिरो-विल्क परीक्षण में डब्ल्यू मान को ठीक से कैसे समझा जाए और एमिल ओडब्ल्यू किर्केगार्ड के लेख के अनुसार " शापिरो-विल्क परीक्षण के डब्ल्यू मान अलग-अलग डेटासेट के साथ देखे गए " सामान्यता के बारे में कुछ भी कहना बहुत मुश्किल है वितरण केवल डब्ल्यू मूल्य को देख रहा है।

जैसा कि वह निष्कर्ष में बताता है:

आम तौर पर हम देखते हैं कि एक बड़ा नमूना दिया गया, एसडब्ल्यू गैर-सामान्यता से प्रस्थान के प्रति संवेदनशील है। यदि प्रस्थान बहुत छोटा है, हालांकि, यह बहुत महत्वपूर्ण नहीं है।

हम यह भी देखते हैं कि यदि कोई जानबूझकर कोशिश करता है, तो भी डब्ल्यू मूल्य को कम करना मुश्किल है। इसके लिए अत्यधिक गैर-सामान्य वितरण का परीक्षण करने की आवश्यकता है, ताकि इसकी सराहना की जा सके।

अधिक जानकारी के लिए मूल लेख देखें।


1

पिछले उत्तर द्वारा उल्लेखित एक महत्वपूर्ण मुद्दा परीक्षण सीमाएँ हैं:

परीक्षण की सीमाएं हैं, सबसे महत्वपूर्ण बात यह है कि परीक्षण में नमूना आकार के आधार पर पूर्वाग्रह है । जितना बड़ा नमूना होगा, उतनी अधिक संभावना होगी कि आपको सांख्यिकीय रूप से महत्वपूर्ण परिणाम मिलेगा।

मूल प्रश्न (बहुत छोटा नमूना आकार) का उत्तर देने के लिए: इस विशिष्ट मामले के लिए क्यूक्यू प्लॉट और हिस्टोग्राम जैसे बेहतर विकल्पों के बारे में निम्नलिखित लेख देखें ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.