सामान्यता के शापिरो-विलक परीक्षण और सामान्यता के कोलमोगोरोव-स्मिरनोव परीक्षण के बीच अंतर क्या है? इन दोनों विधियों के परिणाम अलग-अलग कब होंगे?
सामान्यता के शापिरो-विलक परीक्षण और सामान्यता के कोलमोगोरोव-स्मिरनोव परीक्षण के बीच अंतर क्या है? इन दोनों विधियों के परिणाम अलग-अलग कब होंगे?
जवाबों:
आप वास्तव में दोनों की तुलना नहीं कर सकते क्योंकि कोलमोगोरोव-स्मिरनोव पूरी तरह से निर्दिष्ट वितरण के लिए है (इसलिए यदि आप सामान्यता का परीक्षण कर रहे हैं, तो आपको माध्य और विचरण को निर्दिष्ट करना होगा; वे डेटा से अनुमानित नहीं हो सकते हैं), जबकि; शापिरो-विल्क सामान्यता के लिए है, अनिर्दिष्ट माध्य और विचरण के साथ।
* आप सामान्य मानक के लिए अनुमानित मापदंडों और परीक्षण का उपयोग करके भी मानकीकरण नहीं कर सकते हैं; यह वास्तव में एक ही बात है।
तुलना करने का एक तरीका शापिरो-विल्क को सामान्य और विचरण के लिए एक परीक्षण के साथ पूरक करना होगा (किसी तरह से परीक्षणों का संयोजन), या केएस तालिकाओं को पैरामीटर अनुमान के लिए समायोजित करके (लेकिन तब यह अब वितरण नहीं है -मुक्त)।
ऐसा एक परीक्षण है (अनुमानित मापदंडों के साथ कोलमोगोरोव-स्मिरनोव के बराबर) - लिलीफोरस परीक्षण; सामान्यता-परीक्षण संस्करण शापिरो-विल्क (और आमतौर पर कम शक्ति होगा) की तुलना में वैध रूप से हो सकता है। अधिक प्रतिस्पर्धी एंडरसन-डार्लिंग परीक्षण है (जिसे मान्य होने की तुलना के लिए पैरामीटर अनुमान के लिए भी समायोजित किया जाना चाहिए)।
जैसा कि वे परीक्षण करते हैं - केएस परीक्षण (और लिलिफ़ोर्स) अनुभवजन्य सीडीएफ और निर्दिष्ट वितरण के बीच सबसे बड़ा अंतर दिखता है, जबकि शापिरो विलक प्रभावी रूप से विचरण के दो अनुमानों की तुलना करता है; बारीकी से संबंधित शापिरो-फ्रांसिया को क्यूक्यू प्लॉट में चुकता सहसंबंध का एक मोनोटोनिक कार्य माना जा सकता है; अगर मुझे सही तरीके से याद है, तो शापिरो-विल्क भी आदेश के आँकड़ों के बीच सहसंबंधों को ध्यान में रखता है।
[यह ध्यान में रखा जाना चाहिए कि सामान्यता के लिए कई और परीक्षण हैं जो इन की तुलना में उपलब्ध हैं।]
hist(replicate(1000,ks.test(scale(rnorm(x)),pnorm)$p.value))
- यदि p- मान वैसा ही हो जैसा कि उन्हें होना चाहिए, जो एक समान दिखाई देगा!
संक्षेप में कहा गया है, शापिरो-विल्क परीक्षण सामान्यता के लिए एक विशिष्ट परीक्षण है, जबकि कोलमोगोरोव-स्मिर्नोव परीक्षण द्वारा उपयोग की जाने वाली विधि अधिक सामान्य है, लेकिन कम शक्तिशाली (इसका अर्थ है कि यह सामान्यता की अशक्त परिकल्पना को कम बार अस्वीकार करता है)। दोनों आँकड़े सामान्यता को शून्य के रूप में लेते हैं और नमूने के आधार पर एक परीक्षण आँकड़ा स्थापित करते हैं, लेकिन वे ऐसा कैसे करते हैं यह एक दूसरे से उन तरीकों से अलग है जो उन्हें सामान्य वितरण की विशेषताओं के लिए कम या ज्यादा संवेदनशील बनाते हैं।
वास्तव में डब्ल्यू (शापिरो-विल्क के लिए परीक्षण आँकड़ा) की गणना कैसे की गई है , इसमें थोड़ा सा शामिल है , लेकिन वैचारिक रूप से, इसमें नमूना मूल्यों को आकार देना और अपेक्षित साधनों, भिन्नताओं और सहूलियतों के विरुद्ध फिट को मापना शामिल है। सामान्यता के खिलाफ ये कई तुलनाएं, जैसा कि मैं इसे समझता हूं, परीक्षण को कोलमोगोरोव-स्मिरनोव परीक्षण की तुलना में अधिक शक्ति देता है, जो एक तरीका है जिसमें वे भिन्न हो सकते हैं।
इसके विपरीत, सामान्यता के लिए कोलमोगोरोव-स्मिरनोव परीक्षण अनुभवजन्य संचयी वितरण के खिलाफ अपेक्षित संचयी वितरण की तुलना करके फिट की अच्छाई का आकलन करने के लिए एक सामान्य दृष्टिकोण से लिया गया है:
जैसे, यह वितरण के केंद्र में संवेदनशील है, और पूंछ नहीं। हालांकि, केएस परीक्षण अभिसरण है, इस अर्थ में कि जैसे एन अनंत तक जाता है, परीक्षण सही उत्तर में संभाव्यता में परिवर्तित हो जाता है (मेरा मानना है कि ग्लेवेनको-केंटेली प्रमेय यहां लागू होता है, लेकिन कोई मुझे सही कर सकता है)। ये दो और तरीके हैं जिनमें ये दोनों परीक्षण सामान्यता के मूल्यांकन में भिन्न हो सकते हैं।