यदि डेटा घातीय या सामान्य वितरण का अनुसरण करता है तो मानक सांख्यिकीय परीक्षण क्या हैं?


12

यदि डेटा घातीय या सामान्य वितरण का अनुसरण करता है तो मानक सांख्यिकीय परीक्षण क्या हैं?


2
सबसे अच्छा परीक्षण संभवतः इस बात पर निर्भर करता है कि आप सामान्यता / घातांक के लिए परीक्षण क्यों कर रहे हैं (इसलिए कुछ पृष्ठभूमि सहायक होगी) लेकिन आप हमेशा कोलमोगोरोव स्मिरनोव परीक्षण का उपयोग कर सकते हैं कि क्या किसी दिए गए डेटा सेट में कोई पूर्व-निर्धारित वितरण ( en.wikipedia) फिट बैठता है .org / विकी / कोलमोगोरोव% E2% 80% 93Smirnov_test )। सामान्य वितरण के लिए विशेष रूप से उपयोग किए जाने वाले बहुत सारे तरीके हैं: en.wikipedia.org/wiki/Normality_test
मैक्रो

जिन चरों के साथ मैं काम कर रहा हूं, वे सामान्य या घातीय वितरण का पालन करने की संभावना रखते हैं। इसके अलावा, मेरे पास एक कारक है जिसकी मुझे परवाह नहीं है। हालाँकि, यह मेरे डेटा पर कुछ परिवर्तनशीलता को लागू करता है। इसलिए, मैं इस उपद्रव कारक के प्रभाव को दबाने के लिए चर को सामान्य करना चाहूंगा। इसलिए, मैंने सोचा कि प्रत्येक अंतर्निहित वितरण के आधार पर प्रत्येक संस्करण को सामान्य करना बेहतर है। इसलिए मुझे इन दो वितरणों के बीच निर्णय लेने के लिए एक परीक्षण की आवश्यकता है।
एसएमओ

1
इस वाक्य में सामान्य होने का क्या मतलब है: मैंने सोचा कि प्रत्येक अंतर्निहित वितरण के आधार पर प्रत्येक भिन्न को सामान्य करना बेहतर है ?
मैक्रो

2
एक परीक्षण नहीं है, जबकि QQ भूखंड आपके डेटा के वितरण से मेल खाते के त्वरित सहज निरीक्षण करने के लिए भयानक हैं।
n

जवाबों:


13

ऐसा लगता है कि आप यह तय करने की कोशिश कर रहे हैं कि सामान्य या घातीय वितरण का उपयोग करके अपने डेटा को मॉडल करें या नहीं। यह मुझे कुछ अजीब लगता है, क्योंकि ये वितरण एक दूसरे से बहुत अलग हैं।

सामान्य वितरण सममित है जबकि घातांक वितरण दाईं ओर तिरछा है, जिसमें कोई नकारात्मक मान नहीं है। आमतौर पर घातांक वितरण से एक नमूना में कई अवलोकनों को अपेक्षाकृत करीब और कुछ अवलोकनों को शामिल किया जाएगा जो कि 0 से दायीं ओर दूर तक विचलित होते हैं । यह अंतर अक्सर रेखांकन देखने में आसान होता है।00

यहाँ एक उदाहरण है जहाँ मैंने अवलोकनों को सामान्य वितरण से माध्य 2 और विचरण 4 तथा माध्य 2 और विचरण 4 के साथ घातांक वितरण किया है :n=1002424

सामान्य बनाम घातांक: सिम्युलेटेड डेटा

सामान्य वितरण की समरूपता और घातीय के तिरछेपन को हिस्टोग्राम, बॉक्सप्लाट्स और स्कैल्प्लॉट्स का उपयोग करते हुए देखा जा सकता है, जैसा कि ऊपर की आकृति में दिखाया गया है।

एक और बहुत उपयोगी उपकरण एक QQ- प्लॉट है । नीचे दिए गए उदाहरण में, अंक को लाइन का अनुसरण करना चाहिए यदि नमूना एक सामान्य वितरण से आता है। जैसा कि आप देख सकते हैं, यह सामान्य डेटा के लिए मामला है, लेकिन घातीय डेटा के लिए नहीं।

QQ- प्लॉट सिम्युलेटेड डेटा के लिए

+1

टी,एन=एक्स¯-एक्स(1)रों
एक्स¯एक्स(1)रोंटी,एन

यह परीक्षण वास्तव में आउटलेर्स के लिए ग्रब्स के परीक्षण का एकतरफा संस्करण है । आप इसे अधिकांश सांख्यिकीय सॉफ़्टवेयरों में कार्यान्वित पाएंगे (लेकिन यह सुनिश्चित करें कि आप सही संस्करण का उपयोग करते हैं - बाहरी परीक्षण के लिए उपयोग किए जाने वाले कई वैकल्पिक परीक्षण आँकड़े हैं!)।

टी,एन


ओपी ने पूछा कि क्या आप सामान्यता के लिए परीक्षण करते हैं कि आप किस स्थिति में अदन का चयन करेंगे यदि आप घातीय परीक्षण करते हैं तो आप किस परीक्षण का उपयोग करेंगे। मैंने इस कथन को नहीं पढ़ा कि वह एक ही डेटा सेट पर दोनों परीक्षणों की कोशिश करने का सुझाव दे रहा था।
माइकल आर। चेरिक

मैंने इस तरह से इसकी व्याख्या की, क्योंकि सवाल का अनुसरण करने वाली टिप्पणी में, ओपी ने लिखा "जिन चरों के साथ मैं काम कर रहा हूं, वे सामान्य या घातीय वितरण का पालन करने की संभावना रखते हैं। [...] इसलिए मुझे परीक्षण की आवश्यकता है। इन दो वितरणों के बीच निर्णय लें। ”
मॉन्सट

मैंने उस पर ध्यान नहीं दिया। उस स्थिति में आपका उत्तर बहुत उपयुक्त है। मैं जवाब दे रहा था जैसे कि वह एक समय में एक परीक्षण कर रहा था।
माइकल आर। चेरनिक

@ मिचेल: मैंने इसकी व्याख्या उस तरह से की जब मैंने मूल प्रश्न को पढ़ा, लेकिन टिप्पणी पढ़ने के बाद अपना उत्तर लिखने का फैसला किया। अन्यथा, मुझे नहीं लगता कि आपके (+1) उत्तर को जोड़ने के लिए बहुत कुछ होगा (अन्य छोटी टिप्पणियों के अलावा जो मैंने वहाँ टिप्पणी की है)।
मॉनसून

5

बीnY¯लॉगY¯Yमैं

बीn=n×{लॉगY¯-लॉगY¯}n=2n×{1+(n+1)/(6n)}-1
बीn~χ2(n-1)

इंजीनियरिंग डिजाइन में केसी कपूर और एलआर लैम्बर्सन विश्वसनीयता देखें । विले 1977।


2
मैं घातीयता के परीक्षण के लिए कुछ और हालिया और व्यापक स्रोतों के पार आया। 1) एक लेख: ए हेंज़े, एन। और मींटानिस, एसजी (2005): 'हाल और शास्त्रीय परीक्षण घातीयता के लिए: तुलनाओं के साथ एक आंशिक समीक्षा'। मेट्रिका, वॉल्यूम। 61, पीपी। 29-45। 2) उल्लेखित लेख के परीक्षणों को लागू करने के लिए 'एक्सटेस्ट' नामक एक क्रैन आर पैकेज।
यवस

B_n का वितरण बहुत स्पष्ट नहीं है। क्या यह एन -1 डीएफ के साथ ची स्क्वायर, या एन -1 डीएफ के साथ ची स्क्वायर एन -1 से गुणा है?
डोविनी जयसिंह

लिखित रूप में काम करता है। आप R कोड की कुछ पंक्तियों का उपयोग करके इसे देख सकते हैं।
यवेस

धन्यवाद। तो यह गुणा होना चाहिए जैसा कि मैं देख सकता था। इस मायने में, स्वतंत्रता की डिग्री n-1 होनी चाहिए?
डोविनी जयसिंघ

बीnn-1

4

सामान्यता के लिए एंडरसन-डार्लिंग और शापिरो-विल्क को सबसे अच्छा माना जाता है। घातीय Lillerfors परीक्षण के लिए विशेष रूप से इसके लिए डिज़ाइन किया गया है।


5
इस उत्तर को थोड़ा विस्तार से देखा जा सकता है कि क्यों प्रत्येक परीक्षा को दूसरों की तुलना में अच्छा / बेहतर माना जाता है।
n

ये परीक्षण इस मायने में बेहतर हैं कि सामान्य (एंडरसन-डार्लिंग) और घातांक (लिलीफ़ोर्स) से प्रस्थान करने के लिए सबसे शक्तिशाली हैं। मुझे नहीं लगता है कि यह आसान है कि वह परीक्षण के रूप में एक ituitive स्पष्टीकरण प्रदान करता है।
माइकल आर। चेर्निक

3
@ मिचेल: सामान्यता के लिए एंडरसन-डार्लिंग परीक्षण (जैसे शापिरो-विल्क डिटो) में विकल्पों की एक विस्तृत श्रृंखला के खिलाफ सम्मानजनक शक्ति है, लेकिन यह निश्चित रूप से सबसे शक्तिशाली नहीं है (न तो सामान्य रूप से या औसतन)। परीक्षण का विकल्प हाथ में विकल्प पर निर्भर होना चाहिए। मैंने Lillerfors परीक्षण के बारे में कभी नहीं सुना है - क्या आपका मतलब है Lilliefors परीक्षण (जो वास्तव में सामान्यता के लिए एक परीक्षण है और घातीयता के लिए परीक्षण नहीं है)?
7

बेशक मैं घातांकता के लिए लिलेफोर्स परीक्षण का उल्लेख कर रहा था क्योंकि यह वही था जो मैं घातीय मान्यताओं के लिए सुझा रहा था। मैंने शापिरो-विल्क को एंडरसन-डार्लिंग सूचीबद्ध किया क्योंकि मेरे ज्ञान के सर्वश्रेष्ठ के लिए वे सामान्यता के बीच परीक्षणों में सबसे शक्तिशाली हैं। अधिक शक्तिशाली परीक्षण क्या हैं जिनका आप उल्लेख कर रहे हैं?
माइकल आर। चेरनिक

1
यह इस पर निर्भर करता है कि आपके पास किस प्रकार का विकल्प है। उदाहरण के लिए, तिरछा विकल्पों के खिलाफ, नमूना तिरछापन अक्सर SW और AD की तुलना में अधिक शक्तिशाली होता है। उत्तरार्द्ध सर्वग्राही परीक्षण हैं जो औसत रूप से बहुत अच्छे हैं, लेकिन अगर आप जानते हैं कि आप किस तरह की गैर-सामान्यता के बारे में चिंता कर रहे हैं, तो निर्देशित परीक्षण का उपयोग करना बेहतर है (जैसे कि नमूना तिरछा परीक्षण, जो कि स्काई विकल्प पर निर्देशित है) ।
MånsT

4

क्या आपने ग्राफिकल तरीकों पर विचार किया है कि डेटा कैसे व्यवहार करता है?

प्रायिकता ग्राफ तकनीक में आमतौर पर डेटा को क्रमबद्ध करना, उलटा सीडीएफ को लागू करना और फिर कार्तीय तल पर परिणामों की साजिश करना शामिल होता है। यह आपको यह देखने की अनुमति देता है कि क्या कई मान परिकल्पित वितरण से विचलित होते हैं और संभवतः विचलन के कारण के लिए खाते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.