मैं एक गैर-सामान्य रूप से वितरित DV के लिए एनोवा परिणामों पर भरोसा कर सकता हूं?


22

मैंने एक दोहराया उपायों एनोवा के साथ एक प्रयोग का विश्लेषण किया है। ANOVA एक 3x2x2x2x3 है, जिसमें 2 विषय-संबंधी कारक हैं और 3 भीतर (N = 189) है। त्रुटि दर निर्भर चर है। त्रुटि दर के वितरण में ३.६४ का तिरछा और १५. has५ का कर्षण होता है। तिरछा और कुर्तोसिस 90% त्रुटि दर का परिणाम है जिसका अर्थ है 0. सामान्यता परीक्षणों पर पिछले कुछ सूत्र पढ़ने से मुझे थोड़ी उलझन हुई है। मैंने सोचा था कि यदि आपके पास डेटा था जो सामान्य रूप से वितरित नहीं किया गया था, तो यदि संभव हो तो इसे बदलना आपके सर्वोत्तम हित में था, लेकिन ऐसा लगता है कि बहुत से लोग सोचते हैं कि एनोवा या टी-टेस्ट के साथ गैर-सामान्य डेटा का विश्लेषण स्वीकार्य है। क्या मैं एनोवा के परिणामों पर भरोसा कर सकता हूं?

(FYI करें, भविष्य में मैं एक द्विपद वितरण के साथ मिश्रित मॉडल वाले R में इस प्रकार के डेटा का विश्लेषण करने का इरादा रखता हूं)


1
क्या आप उनमें से कुछ धागों को जोड़ सकते हैं? मेरी आंत की वृत्ति "NOOO no no no" है, लेकिन मैं शायद ही एक विशेषज्ञ हूं और मुझे उन कुछ तर्कों को पढ़ने में दिलचस्पी होगी।
मैट पार्कर

4
आप निश्चित रूप से उन प्रकार के डेटा के साथ F वितरण से प्राप्त किसी भी पी-मान पर भरोसा नहीं कर सकते हैं!
whuber

3
गैर-सामान्य डेटा के साथ उपयोग करने के औचित्य के रूप में कई एनोवा की मजबूती का हवाला देते हैं। IMHO, मजबूती एक परीक्षण की सामान्य विशेषता नहीं है, लेकिन आपको ठीक से बताना है) a जिसके खिलाफ इसकी मान्यताओं का उल्लंघन एक परीक्षण मजबूत है (सामान्यता, गोलाकार, ...), ख) किस हद तक इन उल्लंघनों का कोई बड़ा कारण नहीं है। प्रभाव, ग) परीक्षण को मजबूती (बड़े और बराबर सेल आकार ...) दिखाने के लिए आवश्यक शर्तें क्या हैं। आपके विभाजन-कथानक के डिजाइन में, मुझे किसी को सहवास की परिपक्वता की गोलाकारता और समानता की सटीक मान्यताओं के बारे में बताना होगा। यह 2-गुट-मामले में पहले से ही मनमौजी है।
२२:१०

3
@ मैट ऐसा लगता है कि 90% अवशिष्ट शून्य हैं। यदि ऐसा है, तो कोई भी परिवर्तन दूरस्थ रूप से अवशेषों को सामान्य करने के लिए नहीं जा रहा है। सिमुलेशन अध्ययनों से पता चला है कि एफ-परीक्षणों से पी-मान सामान्यता से विचलन के प्रति अत्यधिक संवेदनशील हैं। (आपके मामले में यह काफी संभावना है कि एफ-परीक्षणों में कुछ भाजक शून्य होंगे: एक तेज संकेतक, कितनी दूर तक गलत हो सकता है।) आपको एक अलग दृष्टिकोण की आवश्यकता है। क्या करना है यह निर्भर करता है कि इतने सारे अवशेष शून्य क्यों हैं। माप में पर्याप्त परिशुद्धता की कमी?
whuber

2
@Matt वह अधिक उपयुक्त लग रहा है, मान लें कि आपका डेटा मायने रखता है। एक और आकर्षक विचार एक शून्य फुलाया हुआ नकारात्मक द्विपद प्रतिक्रिया ( ats.ucla.edu/stat/r/dae/zinbreg.htm ) है।
whuber

जवाबों:


20

अन्य पैरामीट्रिक परीक्षणों की तरह, विचरण का विश्लेषण मानता है कि डेटा सामान्य वितरण के लायक है। यदि आपके माप चर को सामान्य रूप से वितरित नहीं किया जाता है, तो यदि आप एनोवा या अन्य परीक्षण के साथ डेटा का विश्लेषण करते हैं जो सामान्यता को मानता है, तो आप एक झूठे सकारात्मक परिणाम की संभावना बढ़ा सकते हैं। सौभाग्य से, एक एनोवा सामान्यता से मध्यम विचलन के प्रति बहुत संवेदनशील नहीं है; सिमुलेशन अध्ययन, विभिन्न गैर-सामान्य वितरणों का उपयोग करते हुए, यह दिखाया गया है कि धारणा के इस उल्लंघन (ग्लास एट अल। 1972, हरवेल एट अल। 1992, लिक्स एट अल 1996) से झूठी सकारात्मक दर बहुत अधिक प्रभावित नहीं होती है। ऐसा इसलिए है क्योंकि जब आप किसी आबादी से बड़ी संख्या में यादृच्छिक नमूने लेते हैं, तो उन नमूनों के साधन लगभग सामान्य रूप से वितरित किए जाते हैं, जबकि जनसंख्या सामान्य नहीं होती है।

सामान्य वितरण के लिए सेट किए गए डेटा की अच्छाई का परीक्षण करना संभव है। मेरा सुझाव है कि आप ऐसा नहीं करते हैं, क्योंकि कई डेटा सेट जो काफी गैर-सामान्य हैं, एक एनोवा के लिए पूरी तरह से उपयुक्त होंगे।

इसके बजाय, यदि आपके पास एक बड़ा डेटा सेट है, तो मेरा सुझाव है कि आप फ़्रीक्वेंसी हिस्टोग्राम को देखें। यदि यह अधिक या कम-सामान्य दिखता है, तो आगे बढ़ें और एनोवा प्रदर्शन करें। यदि यह एक सामान्य वितरण की तरह दिखता है जिसे एक तरफ धकेल दिया गया है, तो ऊपर सल्फेट डेटा की तरह, आपको अलग-अलग डेटा परिवर्तनों की कोशिश करनी चाहिए और यह देखना चाहिए कि उनमें से कोई भी हिस्टोग्राम को अधिक सामान्य बनाता है या नहीं। यदि वह काम नहीं करता है, और डेटा अभी भी गंभीर रूप से गैर-सामान्य दिखता है, तो शायद एनोवा का उपयोग करके डेटा का विश्लेषण करना अभी भी ठीक है। हालाँकि, आप गैर-पैरामीट्रिक परीक्षण का उपयोग करके इसका विश्लेषण करना चाह सकते हैं। बस के बारे में हर पैरामीट्रिक सांख्यिकीय परीक्षण में एक गैर-पैरामीट्रिक विकल्प होता है, जैसे कि एक तरह से एनोवा के बजाय क्रुस्कल-वालिस टेस्ट, एक युग्मित टी-टेस्ट के बजाय विल्कोक्सॉन-हस्ताक्षरित टेस्ट, और रैखिक प्रतिगमन के बजाय स्पीयर रैंक के सहसंबंध। ये गैर-पैरामीट्रिक परीक्षण यह नहीं मानते हैं कि डेटा सामान्य वितरण के लायक है। वे मानते हैं कि विभिन्न समूहों में डेटा का एक-दूसरे के समान वितरण है, हालांकि; यदि अलग-अलग समूहों में अलग-अलग आकार के वितरण होते हैं (उदाहरण के लिए, एक को बाईं ओर तिरछा किया जाता है, दूसरे को दाईं ओर तिरछा किया जाता है), एक गैर-पैरामीट्रिक परीक्षण किसी पैरामीट्रिक से बेहतर नहीं हो सकता है।

संदर्भ

  1. ग्लास, जीवी, पीडी पेकहम और जेआर सैंडर्स। 1972. निश्चित प्रभाव के कारण मान्यताओं को पूरा करने में विफलता के परिणाम विचरण और सह-अस्तित्व का विश्लेषण करते हैं। रेव। एडुक। रेस। 42: 237-288।
  2. हरवेल, एमआर, एन रुबिनस्टीन, डब्लूएस हेस और सीसी ओड्स। 1992. मोंटे कार्लो के सारांश में पद्धतिगत शोध के परिणाम: एक- और दो-कारक निश्चित प्रभाव एनोवा मामले। जे एडुक। स्टेट। 17: 315-339।
  3. Lix, LM, JC Keselman, और HJ Keselman। 1996. अनुमान उल्लंघनों का परिणाम फिर से आना: विखंडन एफ परीक्षण के एक तरफ़ा विश्लेषण के लिए विकल्पों की एक मात्रात्मक समीक्षा। रेव। एडुक। रेस। 66: 579-619।

7
मैं यहाँ सिर्फ अपनी अज्ञानता दिखा रहा हूँ, लेकिन एनोवा के पीछे यह धारणा नहीं है कि अवशिष्ट सामान्य हैं? उस मामले में यह वास्तव में कोई फर्क नहीं पड़ता अगर चर ही गैर-सामान्य है, जब तक कि अवशिष्ट पैटर्न फिट नहीं होते।
रिचमीमोर्रिसो

5
शायद प्रश्न को संपादित किया गया है, लेकिन मुझे वास्तव में समझ में नहीं आता है कि इस उत्तर को क्यों स्वीकार किया गया है और स्वीकार किया गया है। यह सभ्य सामान्य सलाह है, लेकिन "तिरछा और कुर्तोसिस के 90% परिणाम दर 0% होने का मतलब है" के इस विशेष मामले से कोई लेना देना नहीं है। इस मामले में जवाब नहीं, नहीं और नहीं होना चाहिए।
एरिक

8

विशेष रूप से एक DV के रूप में त्रुटि दर के बारे में, डिक्सन (2008) बहुत ही स्पष्ट रूप से दर्शाता है कि एनोवा के माध्यम से अशक्त परिकल्पना परीक्षण दोनों गलत अलार्म दरों में वृद्धि कर सकते हैं (कॉलिंग प्रभाव "महत्वपूर्ण" जब वे नहीं होते हैं) और वृद्धि हुई मिस रेट्स (गायब प्रभाव)। उन्होंने यह भी दिखाया कि मिश्रित प्रभाव मॉडलिंग, द्विपदिक रूप से वितरित त्रुटि को निर्दिष्ट करते हुए, दर डेटा का विश्लेषण करने के लिए अधिक उपयुक्त दृष्टिकोण है।


4

आप उस बहुत तिरछी और बड़ी संख्या में 0 के साथ अपने एनोवा पर भरोसा नहीं कर सकते। एक अधिक उपयुक्त विधि आपके DV के रूप में त्रुटियों की संख्या का उपयोग करना होगा (इस प्रकार आपके DV को गिनती डेटा में बदलना) और एक पॉइसन विश्लेषण करना। इस दृष्टिकोण को मिश्रित प्रभाव विश्लेषण का उपयोग करने और पॉइसन के रूप में त्रुटि वितरण परिवार को निर्दिष्ट करने की आवश्यकता होगी। डिक्सन (2008) * लेख माइक लॉरेंस ने उल्लेख आर में लेकिन द्विपद परिणामों के साथ मिश्रित प्रभाव विश्लेषण का उपयोग करता। मैं अपने अधिकांश दोहराया उपायों के विश्लेषण के लिए आर करने के लिए पूरी तरह से स्थानांतरित हो गया हूं क्योंकि मेरे कई परिणाम चर द्विपद हैं। उचित आर पैकेज है lme4

*डिक्सन, पी। (2008)। बार-बार डिजाइन में सटीकता के मॉडल। जर्नल ऑफ़ मेमोरी एंड लैंग्वेज , 59 (4), 447-456।


2

जुआन ने बहुत कुछ पेश किया है, हालांकि मैं दूसरों को प्रतिध्वनित करूँगा और दोहराऊंगा कि सर्वोत्तम सटीकता के लिए चर स्वयं ही असामान्य हो सकते हैं जब तक कि उनके अवशेष न हों। इसके अलावा, एक सरलीकृत और थोड़ा अधिक संरचित उत्तर (एनोटेट फ्लो चार्ट के माध्यम से) yellowbrickstats.com पर उपलब्ध है ।


1
क्षमा करें, लेकिन -1 मुझसे। यह सामान्य रूप से सच है, लेकिन अवशिष्ट तब तक नहीं होंगे जब हमारे पास शून्य का मुद्रास्फीति होगा। मुझे लगता है कि उत्तर केवल सामान्यताओं को कवर नहीं करना चाहिए, लेकिन विशिष्ट मुद्दे को स्वीकार करना चाहिए।
एरिक

1

सीलिंग प्रभाव यहां की समस्या है। एक गैर पैरामीट्रिक परीक्षण आपका सबसे सुरक्षित दांव है, हालांकि एनओवीएएस सामान्यता के इस उल्लंघन के लिए मजबूत हैं यदि एन बड़ा है। आमतौर पर लोग इसका परीक्षण करने के लिए सिर्फ एक हिस्टोग्राम का उपयोग करते हैं, लेकिन अगर समस्या अवशिष्ट के साथ है तो यह उससे अधिक उन्नत हो सकता है। यह भी ध्यान रखें कि यह कैसे आपके परिणामों को प्रभावित करता है (न कि केवल यह करता है)। पल्लंट (2007) शायद यह कहेगा कि इससे आपकी टाइप वन त्रुटि की संभावना बढ़ जाती है, इसलिए यदि आप अपने महत्वपूर्ण अल्फा को कम करते हैं तो आप इसे कम कर सकते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.