यदि डेटा घातीय या सामान्य वितरण का अनुसरण करता है तो मानक सांख्यिकीय परीक्षण क्या हैं?
यदि डेटा घातीय या सामान्य वितरण का अनुसरण करता है तो मानक सांख्यिकीय परीक्षण क्या हैं?
जवाबों:
ऐसा लगता है कि आप यह तय करने की कोशिश कर रहे हैं कि सामान्य या घातीय वितरण का उपयोग करके अपने डेटा को मॉडल करें या नहीं। यह मुझे कुछ अजीब लगता है, क्योंकि ये वितरण एक दूसरे से बहुत अलग हैं।
सामान्य वितरण सममित है जबकि घातांक वितरण दाईं ओर तिरछा है, जिसमें कोई नकारात्मक मान नहीं है। आमतौर पर घातांक वितरण से एक नमूना में कई अवलोकनों को अपेक्षाकृत करीब और कुछ अवलोकनों को शामिल किया जाएगा जो कि 0 से दायीं ओर दूर तक विचलित होते हैं । यह अंतर अक्सर रेखांकन देखने में आसान होता है।
यहाँ एक उदाहरण है जहाँ मैंने अवलोकनों को सामान्य वितरण से माध्य 2 और विचरण 4 तथा माध्य 2 और विचरण 4 के साथ घातांक वितरण किया है :
सामान्य वितरण की समरूपता और घातीय के तिरछेपन को हिस्टोग्राम, बॉक्सप्लाट्स और स्कैल्प्लॉट्स का उपयोग करते हुए देखा जा सकता है, जैसा कि ऊपर की आकृति में दिखाया गया है।
एक और बहुत उपयोगी उपकरण एक QQ- प्लॉट है । नीचे दिए गए उदाहरण में, अंक को लाइन का अनुसरण करना चाहिए यदि नमूना एक सामान्य वितरण से आता है। जैसा कि आप देख सकते हैं, यह सामान्य डेटा के लिए मामला है, लेकिन घातीय डेटा के लिए नहीं।
यह परीक्षण वास्तव में आउटलेर्स के लिए ग्रब्स के परीक्षण का एकतरफा संस्करण है । आप इसे अधिकांश सांख्यिकीय सॉफ़्टवेयरों में कार्यान्वित पाएंगे (लेकिन यह सुनिश्चित करें कि आप सही संस्करण का उपयोग करते हैं - बाहरी परीक्षण के लिए उपयोग किए जाने वाले कई वैकल्पिक परीक्षण आँकड़े हैं!)।
इंजीनियरिंग डिजाइन में केसी कपूर और एलआर लैम्बर्सन विश्वसनीयता देखें । विले 1977।
सामान्यता के लिए एंडरसन-डार्लिंग और शापिरो-विल्क को सबसे अच्छा माना जाता है। घातीय Lillerfors परीक्षण के लिए विशेष रूप से इसके लिए डिज़ाइन किया गया है।
क्या आपने ग्राफिकल तरीकों पर विचार किया है कि डेटा कैसे व्यवहार करता है?
प्रायिकता ग्राफ तकनीक में आमतौर पर डेटा को क्रमबद्ध करना, उलटा सीडीएफ को लागू करना और फिर कार्तीय तल पर परिणामों की साजिश करना शामिल होता है। यह आपको यह देखने की अनुमति देता है कि क्या कई मान परिकल्पित वितरण से विचलित होते हैं और संभवतः विचलन के कारण के लिए खाते हैं।