एनोवा में सामान्य धारणा से प्रस्थान: कुर्तोसिस या तिरछापन अधिक महत्वपूर्ण है?


12

कुटनेर एट अल द्वारा लागू रैखिक सांख्यिकीय मॉडल। एनोवा मॉडल की सामान्यता धारणा से निम्नलिखित प्रस्थान के बारे में बताता है: त्रुटि वितरण का कुर्तोसिस (या तो सामान्य वितरण की तुलना में कम या ज्यादा), इनफ़ेक्शंस पर प्रभाव के संदर्भ में वितरण की विषमता से अधिक महत्वपूर्ण है

मैं इस कथन से थोड़ा हैरान हूं और किसी भी संबंधित जानकारी को खोजने के लिए प्रबंधन नहीं किया, या तो किताब में या ऑनलाइन। मैं भ्रमित हूं क्योंकि मैंने यह भी सीखा है कि भारी पूंछ वाले क्यूक्यू-प्लॉट एक संकेत हैं कि रैखिक प्रतिगमन मॉडल के लिए सामान्यता धारणा "काफी अच्छी" है, जबकि तिरछी क्यूक्यू-प्लॉट एक चिंता का अधिक है (यानी एक परिवर्तन उपयुक्त हो सकता है) ।

क्या मैं सही हूं कि एनोवा के लिए भी यही तर्क दिया जाता है और उनकी पसंद का शब्द ( इनफैक्शन पर प्रभाव के संदर्भ में अधिक महत्वपूर्ण ) सिर्फ खराब तरीके से चुना गया? यानी तिरछे वितरण के अधिक गंभीर परिणाम होते हैं और इससे बचा जाना चाहिए, जबकि कुर्तोसिस की थोड़ी मात्रा स्वीकार्य हो सकती है।

EDIT: जैसा कि rolando2 ने माना है, यह बताना मुश्किल है कि सभी मामलों में एक दूसरे से ज्यादा महत्वपूर्ण है, लेकिन मैं केवल कुछ सामान्य अंतर्दृष्टि की तलाश कर रहा हूं। मेरा मुख्य मुद्दा यह है कि मुझे सिखाया गया था कि सरल रेखीय प्रतिगमन में, भारी पूंछ (= कुर्तोसिस?) वाले क्यूक्यू-प्लॉट ठीक हैं, क्योंकि एफ-परीक्षण इसके खिलाफ काफी मजबूत है। दूसरी ओर, तिरछी क्यूक्यू-भूखंड (परबोला के आकार का) आमतौर पर एक बड़ी चिंता का विषय है। ऐसा लगता है कि मेरी पाठ्यपुस्तक ANOVA के लिए दिए गए दिशा-निर्देशों के विपरीत सीधे जाती है, भले ही ANOVA मॉडल को प्रतिगमन मॉडल में परिवर्तित किया जा सकता है और समान धारणाएं होनी चाहिए।

मुझे यकीन है कि मैं किसी चीज़ की अनदेखी कर रहा हूं या मेरी झूठी धारणा है, लेकिन मैं यह पता नहीं लगा सकता कि यह क्या हो सकता है।


3
कुर्टोसिस की अपनी समीक्षा में, डेकार्लो (1997) ने सटीक विपरीत सुझाव दिया, कि एनोवा और अन्य साधनों की समानता के परीक्षण में तिरछा अधिक महत्वपूर्ण था। आप पृष्ठ 297 पर उपयोगी होने के लिए उद्धरण देख सकते हैं: columbia.edu/~ld208/psymeth97.pdf
एंथनी

1
मैं प्रश्न को सबसे अधिक उत्पादक पाता हूँ अगर इसे एक कथन में हल किया जा सकता है जैसे "स्केवनेस कर्टोसिस की तुलना में बहुत अधिक महत्वपूर्ण है, जो कि ___ के स्तर पर तिरछा होना आम तौर पर परिणामों को बिगाड़ देगा जितना कि ___ के स्तर पर कुर्टोसिस होगा । " ऐसे कुछ मात्राकरण के बिना, केवल एक या दूसरे को अधिक महत्वपूर्ण कहना हमारे लिए बहुत मदद नहीं करता है।
rolando2

यह अनुकरण खान और रेनेर (2003) के खान और रेन्नर (2003) के Emis.de/journals/HOA/ADS/Volume7_4/206.pdf APPLIED MATHEMATICS और DECISICAL विज्ञान के जौनल में बताते हैं कि "ANOVA और Kruskal-Wallis परीक्षण कर्टोसिस से बहुत अधिक प्रभावित हैं। इसके तिरछेपन के बजाय त्रुटि वितरण में "(पृष्ठ 204)।
bsbk

दो-नमूना टी-टेस्ट से संबंधित एक अत्यंत करीबी प्रश्न - कारक में दो स्तरों के साथ प्रभावी रूप से एक-तरफ़ा एनोवा - सांख्यिकी.स्टैकएक्सचेंज . com / questions / 38967/ … ... वर्तमान में एक बाउंटी है जो अतिरिक्त उद्देश्य के लिए है। मौजूदा जवाबों में से किसी के भी संदर्भ में उद्धरण नहीं हैं, इसलिए इस प्रश्न के उत्तरदाता इस पर एक नज़र डालना चाहते हैं।
सिल्वर फिश

मैं @ rolando2 से सहमत हूं: "स्केवनेस कर्टोसिस से भी बदतर है" या इसके विपरीत, स्केवनेस / कुर्टोसिस की डिग्री का उल्लेख किए बिना एक खाली बयान है। लेकिन इस पर भी अधिक विचार करने की आवश्यकता है! उदाहरण के लिए, सामान्यता के इन प्रकारों के उल्लंघन की मजबूती आंशिक रूप से इस बात पर निर्भर करती है कि क्या समूह आकार समान हैं , और तिरछापन की मजबूती तिरछापन की दिशा पर निर्भर हो सकती है - यह बुरा है यदि एक समूह एक तरह से तिरछा हो, और दूसरा समूह तिरछा हो जाए। इसके विपरीत, अगर दोनों समूहों को एक ही दिशा में तिरछा किया गया था। (यह मेमोरी और री-टेस्ट से है लेकिन यह एक प्रकार का एनोवा है।)
सिल्वरफिश

जवाबों:


6

कठिनाई यह है कि तिरछापन और कुर्तोसिस निर्भर हैं; उनके प्रभावों को पूरी तरह से अलग नहीं किया जा सकता है।

समस्या यह है कि यदि आप एक अत्यधिक तिरछा वितरण के प्रभाव की जांच करना चाहते हैं, तो आपको उच्च कर्टोसिस के साथ वितरण भी करना होगा

2+1

* (साधारण तराशा हुआ चौथा क्षण कुर्तोसिस, अधिक कुर्तोसिस नहीं)

खान और रेनर (जो पहले उत्तर में उल्लेख किया गया है) एक परिवार के साथ काम करते हैं जो तिरछा और कुर्तोसिस के प्रभाव की कुछ खोज की अनुमति देता है, लेकिन वे इस मुद्दे से बच नहीं सकते हैं, इसलिए उन्हें अलग करने का उनका प्रयास गंभीर रूप से उस सीमा तक सीमित होता है जिसके प्रभाव तिरछेपन का पता लगाया जा सकता है।

β2β2-1

उदाहरण के लिए, यदि आप उच्च तिरछापन के प्रभाव को देखना चाहते हैं - तिरछा कहना> 5, तो आप 26 से कम कुर्तोसिस के साथ वितरण प्राप्त नहीं कर सकते हैं !

इसलिए यदि आप उच्च तिरछापन के प्रभाव की जांच करना चाहते हैं, तो आप उच्च कुर्तोसिस के प्रभाव की जांच से बचने में असमर्थ हैं। नतीजतन यदि आप उन्हें अलग करने की कोशिश करते हैं, तो आप उच्च स्तर पर बढ़ते तिरछापन के प्रभाव का आकलन करने में असमर्थ हैं।

कम से कम, वितरण परिवार के लिए उन्होंने माना, और सीमा के भीतर उनके बीच संबंध बन गया है, खान और रेनेर द्वारा की गई जांच से लगता है कि कुर्तोसिस मुख्य समस्या है।

>2


11

इस मुद्दे को खान और रेनर द्वारा "कई-नमूना स्थान समस्या के लिए सामान्य परीक्षणों की गैर-सामान्यता पर जोर" में संबोधित किया गया है।

उन्होंने पाया कि एनोवा परीक्षण तिरछेपन की तुलना में कर्टोसिस से बहुत अधिक प्रभावित होता है, और तिरछापन का प्रभाव इसकी दिशा से असंबंधित होता है।

यदि सामान्यता से विचलन का संदेह है, तो क्रुस्कल-वालिस परीक्षण एक बेहतर विकल्प हो सकता है। क्रुसकल-वालिस परीक्षण सामान्यता से विचलन के लिए अधिक मजबूत है क्योंकि यह परिकल्पना की जांच करता है कि उपचार के मध्यस्थ समान हैं। ANOVA परिकल्पना की जांच करता है कि उपचार के साधन समान हैं।


क्या यह तब भी इंगित करता है कि मुझे QQ- प्लॉट्स को रेखीय प्रतिगमन और ANOVA के लिए अलग-अलग व्याख्या करनी चाहिए? अधिकांश परिवर्तनों को मैंने कम तिरछा किया है, लेकिन थोड़ा भारी पूंछ (= कुर्टोसिस?) छोड़ दिया है। मैं इस धारणा के तहत था कि एफ-परीक्षण उत्तरार्द्ध से निपटने के लिए पर्याप्त मजबूत था, लेकिन पूर्व नहीं। या यह "भारी पूंछ ठीक है" मेरी ओर से गलतफहमी है? मैं कल्पना नहीं कर सकता कि दोनों के बीच इतना बुनियादी अंतर मौजूद है, क्योंकि एनोवा मॉडल को रैखिक प्रतिगमन मॉडल के रूप में भी फिर से लिखा जा सकता है।
जेनिट ५'१५
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.