अवशेषों को सामान्य रूप से वितरित किए जाने की पुष्टि करने के लिए मैं किन परीक्षणों का उपयोग करता हूं?


20

मेरे पास कुछ आंकड़े हैं जो लगभग बनाम सामान्य समय के अवशेषों के ग्राफ को प्लॉट करने से दिखता है लेकिन मैं निश्चित होना चाहता हूं। मैं त्रुटि अवशेषों की सामान्यता के लिए कैसे परीक्षण कर सकता हूं?


3
बारीकी से संबंधित: उपयुक्त-सामान्यता-परीक्षण-के लिए छोटे-नमूने । यहाँ संभावित हित के अन्य सवालों के एक जोड़े हैं: सामान्यता परीक्षण-अनिवार्य रूप से बेकार है , सामान्यता परीक्षण के मूल्य की चर्चा के लिए, और क्या-अगर-अवशिष्ट-सामान्य-वितरित-लेकिन-वाई-है- नहीं , एक चर्चा / स्पष्टीकरण के लिए जिसमें सामान्यता एक रेखीय मॉडल की धारणा है।
गुंग - को पुनः स्थापित मोनिका

एक शापिरो विलक परीक्षण के जिस्ट के बहुत आम गलतफहमी को देखा जा सकता है! H0 के पक्ष में सही अर्थ है, H0 को अस्वीकार नहीं किया जा सकता है, लेकिन BEWARE! इसका स्वचालित रूप से मतलब नहीं है "डेटा सामान्य रूप से वितरित किया जाता है" !!! वैकल्पिक परिणाम "डेटा सामान्य रूप से वितरित नहीं किया जाता है"।
जो हॉलेंबेक

जवाबों:


28
  1. कोई भी परीक्षण आपको यह नहीं बताएगा कि आपके अवशेष सामान्य रूप से वितरित किए गए हैं। वास्तव में, आप मज़बूती से शर्त लगा सकते हैं कि वे नहीं हैं

  2. परिकल्पना परीक्षण आम तौर पर आपकी धारणाओं पर जाँच के रूप में एक अच्छा विचार नहीं है। आपके अनुमान पर गैर-सामान्यता का प्रभाव आम तौर पर नमूना आकार * का कार्य नहीं है, लेकिन एक महत्व परीक्षण का परिणाम है । सामान्यता से एक छोटा विचलन एक बड़े नमूने के आकार में स्पष्ट होगा, भले ही वास्तविक ब्याज ('किस हद तक मेरे प्रभाव को प्रभावित करता है') के प्रश्न का उत्तर 'शायद ही' हो। इसके विपरीत, एक छोटे से नमूना आकार में सामान्यता से एक बड़ा विचलन महत्व नहीं हो सकता है।

    * (संपादित में जोड़ा गया) - वास्तव में यह बहुत ज्यादा कमजोर है। गैर-सामान्यता का प्रभाव वास्तव में नमूना आकार के साथ बहुत कम हो जाता है किसी भी समय सीएलटी और स्लटस्की के प्रमेय को धारण करने जा रहा है, जबकि सामान्यता को अस्वीकार करने की क्षमता (और संभवतः सामान्य-सिद्धांत प्रक्रियाओं से बचें) नमूना आकार के साथ बढ़ जाती है - इसलिए बस जब आप सबसे अधिक गैर-सामान्य की पहचान करने में सक्षम हो, जब यह बात नहीं है हो जाता है वैसे भी ... और परीक्षण जब यह वास्तव में मायने रखती है छोटे नमूनों में कोई मदद नहीं करता है।

    कम से कम, जहां तक ​​महत्व का स्तर है, कम से कम । पावर अभी भी एक मुद्दा हो सकता है, अगर हम बड़े नमूनों पर विचार कर रहे हैं, तो यह एक समस्या के रूप में भी कम हो सकता है।

  3. प्रभाव के आकार को मापने के करीब जो आता है वह कुछ नैदानिक ​​(या तो एक प्रदर्शन या एक आंकड़ा) है जो किसी तरह से गैर-सामान्यता की डिग्री को मापता है। क्यूक्यू प्लॉट एक स्पष्ट प्रदर्शन है, और एक नमूना आकार और एक अलग नमूना आकार में एक ही आबादी से एक क्यूक्यू प्लॉट कम से कम एक ही वक्र के दोनों शोर अनुमान हैं - लगभग एक ही 'गैर-सामान्यता' दिखा रहा है; यह कम से कम ब्याज के सवाल के वांछित जवाब से संबंधित होना चाहिए।

यदि आप एक परीक्षण का उपयोग करना चाहिए, Shapiro-Wilk शायद के रूप में के रूप में कुछ और अच्छा है (चेन- Shapiro परीक्षण आम तौर पर आम हित के विकल्पों पर थोड़ा बेहतर है, लेकिन कार्यान्वयन को खोजने के लिए कठिन है) - लेकिन यह एक सवाल का जवाब दे रहा है पहले से ही जवाब पता है; हर बार जब आप अस्वीकार करने में विफल रहते हैं, तो यह उत्तर दे रहा है कि आप सुनिश्चित कर सकते हैं कि यह गलत है।


4
+1 Glen_b क्योंकि आप कई अच्छे अंक बनाते हैं। हालांकि मैं फिट परीक्षणों की अच्छाई के उपयोग के बारे में इतना नकारात्मक नहीं होगा। जब नमूना आकार छोटा या मध्यम होता है तो परीक्षण में सामान्य वितरण से मामूली प्रस्थान का पता लगाने के लिए पर्याप्त शक्ति नहीं होगी। बहुत बड़े अंतर के परिणामस्वरूप बहुत छोटे पी-मान हो सकते हैं (जैसे 0.0001 या उससे कम)। क्यूक प्लॉट के दृश्य अवलोकन की तुलना में ये अधिक औपचारिक संकेत हो सकते हैं लेकिन फिर भी बहुत उपयोगी हैं। कोई तिरछा और कर्टोसिस के अनुमानों को भी देख सकता है। यह बहुत बड़े नमूनों में है कि फिट परीक्षणों की अच्छाई समस्याग्रस्त है।
माइकल आर। चेरिक

4
उन मामलों में छोटे प्रस्थानों का पता लगाया जाएगा। जब तक विश्लेषक यह स्वीकार करते हैं कि व्यवहार में जनसंख्या वितरण बिल्कुल सामान्य नहीं होगा और अशक्त हाइपोथिसिस को खारिज करना केवल उसे बता रहा है कि उसका वितरण थोड़ा गैर-सामान्य है, वह भटक नहीं जाएगा। अन्वेषक को तब खुद के लिए न्याय करना चाहिए कि क्या सामान्यता की धारणा एक चिंता है या परीक्षण को पता नहीं चलता है। शापिरो-विल्क वास्तव में सामान्यता की परिकल्पना के खिलाफ अधिक शक्तिशाली परीक्षणों में से एक है।
माइकल आर। चेरिक

+1, मुझे विशेष रूप से बिंदु # 2 पसंद है; उन पंक्तियों के साथ, यह ध्यान देने योग्य है कि भले ही तिरछा या कुर्तोसिस काफी खराब हो, डब्ल्यू / वास्तव में बड़े एन, केंद्रीय सीमा प्रमेय आपको कवर करेगा, ताकि समय आपको कम से कम सामान्यता की आवश्यकता हो।
गुंग - को पुनः स्थापित मोनिका

3
@ गुंग कुछ ऐसी परिस्थितियाँ हैं जब सामान्यता के लिए एक अच्छा सन्निकटन मायने रखेगा। उदाहरण के लिए, सामान्य अनुमानों का उपयोग करते हुए भविष्यवाणी अंतराल का निर्माण करते समय। लेकिन मैं अभी भी एक निदान पर अधिक भरोसा करता हूं (एक जो दिखाता है कि यह कितना गैर-सामान्य है) एक परीक्षण की तुलना में
Glen_b -Reinstate Monica

भविष्यवाणी अंतराल के बारे में आपकी बात अच्छी है।
गंग -

8

शापिरो-विल्क परीक्षण एक संभावना है।

शापिरो-विल्क परीक्षण

यह परीक्षण लगभग सभी सांख्यिकीय सॉफ्टवेयर पैकेजों में लागू किया गया है। अशक्त परिकल्पना है अवशिष्ट सामान्य रूप से वितरित होते हैं, इस प्रकार एक छोटा पी-मूल्य इंगित करता है कि आपको अशक्त को अस्वीकार करना चाहिए और निष्कर्ष निकालना चाहिए कि अवशिष्ट सामान्य रूप से वितरित नहीं हैं।

ध्यान दें कि यदि आपका नमूना आकार बड़ा है, तो आप लगभग हमेशा अस्वीकार कर देंगे, इसलिए अवशिष्टों का दृश्य अधिक महत्वपूर्ण है।


यह "विलक" है "विल्क्स" नहीं।
माइकल आर। चेरिक

1

विकिपीडिया से:

अविभाज्य सामान्यता के परीक्षण में डी 'ऑगस्टीनो के के-स्क्वार्ड परीक्षण, जार्के-बेरा परीक्षण, एंडरसन-डार्लिंग परीक्षण, क्रैमेर-वॉन मिज़ कसौटी, सामान्यता के लिलिफ़ोर्स परीक्षण (स्वयं कोलमोगोरोव-स्मिरनोव परीक्षण का एक अनुकूलन) शामिल हैं। शापिरो-विल्क परीक्षण, पियर्सन का ची-स्क्वेर्ड परीक्षण और शापिरो-फ्रांसिया परीक्षण। द जर्नल ऑफ स्टैटिस्टिकल मॉडलिंग एंड एनालिटिक्स [1] के 2011 के एक पेपर का निष्कर्ष है कि शापिरो-विल्क के पास एक दिए गए महत्व के लिए सबसे अच्छी शक्ति है, इसके बाद शापिरो-विल्क, कोलमोगोव-स्मिरनोव, लिलीफोरस और एंडरसन- एंडरसन की तुलना करते हुए एंडरसन-डार्लिंग के पास सबसे अच्छी शक्ति है। डार्लिंग टेस्ट।


1
-1: आप विकिपीडिया पृष्ठ पर एक लिंक शामिल करना चाहते हैं, फुटनोट ("[1]") को हटा सकते हैं और ब्लॉकक्वाओट फ़ंक्शन का उपयोग कर सकते हैं।
बेरंड वीस

1
Glen_b जो कैविटी देता है, वह इस बात को ध्यान में रखने के लिए है कि जब भी इन परीक्षणों में से किसी का भी उपयोग किया जाए। मुझे लगता है कि शापिरो-विल्क के बारे में आप जो नतीजा निकालते हैं, वह उतना सामान्य नहीं होता जितना आप इसे बनाने के लिए करते हैं। मेरा मानना ​​है कि सामान्यता के लिए विश्व स्तर पर सबसे शक्तिशाली परीक्षण है।
माइकल आर। चेरिक

2
n1

@GregSnow मेरे पास आपके पैकेज के माध्यम से पूरी तरह से देखने का समय नहीं है और मैं सब कुछ का पालन करने के लिए R के साथ पर्याप्त रूप से निपुण नहीं हो सकता। क्या आप कह रहे हैं कि सामान्यता के लिए विश्व स्तर पर सबसे शक्तिशाली परीक्षण है या क्या आप कह रहे हैं कि आप यह दिखाने के लिए उदाहरण प्रदान करते हैं कि विभिन्न परीक्षण सबसे शक्तिशाली हैं और इसलिए वैश्विक अस्तित्व नहीं है। मुझे संदेह है कि एक मौजूद है और मुझे नहीं लगता कि शापिरो-विलक यह होगा। यदि आप दावा कर रहे हैं कि कोई मौजूद है, तो मैं एक गणितीय प्रमाण या एक संदर्भ देखना चाहूंगा।
माइकल आर। चेरिक

1
@MichaelChernick, मेरा दावा है कि मेरे परीक्षण में सामान्यता के किसी भी अन्य परीक्षण के रूप में अधिक सटीक रूप से आने वाले डेटा की अशक्त परिकल्पना को अस्वीकार करने की अधिक शक्ति या अधिक होगी (या अधिक होने की संभावना है)। आर कोड का पालन करना मुश्किल नहीं है, पी-मूल्य की गणना के लिए मुख्य कोड "tmp.p <- अगर (कोई (is.rational (x))) {0" है, तो इसकी शक्ति का प्रमाण स्पष्ट होना चाहिए ( मैंने केवल यह दावा किया है कि यह शक्तिशाली है और प्रलेखन उपयोगी हो सकता है, यह नहीं कि परीक्षण स्वयं उपयोगी है, "कोक्रेन का काम" के लिए Google)।
ग्रेग स्नो
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.