आपको सामान्यता के लिए परीक्षण क्यों करना चाहिए?
रैखिक प्रतिगमन में मानक धारणा यह है कि सैद्धांतिक अवशिष्ट स्वतंत्र और सामान्य रूप से वितरित होते हैं। अवलोकन किए गए अवशेष सैद्धांतिक अवशेषों का एक अनुमान हैं, लेकिन स्वतंत्र नहीं हैं (अवशेषों पर रूपांतरण हैं जो कुछ निर्भरता को दूर करते हैं, लेकिन अभी भी केवल सही अवशेषों का एक अनुमान देते हैं)। इसलिए देखे गए अवशेषों पर एक परीक्षण इस बात की गारंटी नहीं देता है कि सैद्धांतिक अवशेषों का मिलान होता है।
यदि सैद्धांतिक अवशिष्टों को सामान्य रूप से वितरित नहीं किया जाता है, लेकिन नमूना आकार काफी बड़ा है, तो केंद्रीय सीमा प्रमेय का कहना है कि सामान्य अनुमान (परीक्षण और आत्मविश्वास अंतराल, लेकिन जरूरी नहीं कि भविष्यवाणी अंतराल) सामान्यता की धारणा के आधार पर अभी भी लगभग सही होंगे। ।
यह भी ध्यान दें कि सामान्यता के परीक्षण नियम परीक्षण हैं, वे आपको बता सकते हैं कि डेटा के सामान्य वितरण से आने की संभावना नहीं है। लेकिन यदि परीक्षण महत्वपूर्ण नहीं है, तो इसका मतलब यह नहीं है कि डेटा एक सामान्य वितरण से आया है, इसका मतलब यह भी हो सकता है कि आपके पास अंतर देखने के लिए पर्याप्त शक्ति नहीं है। बड़े नमूना आकार गैर-सामान्यता का पता लगाने के लिए अधिक शक्ति देते हैं, लेकिन बड़े नमूने और सीएलटी का मतलब है कि गैर-सामान्यता कम से कम महत्वपूर्ण है। तो छोटे नमूना आकारों के लिए सामान्यता की धारणा महत्वपूर्ण है लेकिन परीक्षण व्यर्थ हैं, बड़े नमूना आकारों के लिए परीक्षण अधिक सटीक हो सकते हैं, लेकिन सटीक सामान्यता का प्रश्न अर्थहीन हो जाता है।
तो उपरोक्त सभी को मिलाकर, सटीक सामान्यता के परीक्षण से अधिक महत्वपूर्ण बात यह है कि डेटा के पीछे विज्ञान की समझ यह देखने के लिए है कि क्या जनसंख्या सामान्य से काफी करीब है। क्यूप्लॉट्स जैसे रेखांकन अच्छे निदान हो सकते हैं, लेकिन विज्ञान की समझ की भी आवश्यकता है। यदि यह चिंता है कि आउटलेयर के लिए बहुत अधिक तिरछा या क्षमता है, तो गैर-पैरामीट्रिक तरीके उपलब्ध हैं जिन्हें सामान्यता धारणा की आवश्यकता नहीं है।