मान्यताओं से कोई फर्क नहीं पड़ता क्योंकि वे उन परिकल्पना परीक्षणों (और अंतराल) के गुणों को प्रभावित करते हैं, जिनका आप उपयोग कर सकते हैं, जिनके शून्य के तहत वितरण गुण उन गणनाओं पर निर्भर हैं।
विशेष रूप से, परिकल्पना परीक्षणों के लिए, जिन चीजों के बारे में हम ध्यान रख सकते हैं, वे यह हैं कि जो हम चाहते हैं, उससे वास्तविक महत्व का स्तर कितना दूर हो सकता है, और क्या ब्याज के विकल्पों के खिलाफ शक्ति अच्छी है।
उन मान्यताओं के संबंध में जिनसे आप पूछते हैं:
1. विचरण की समानता
डिज़ाइन के प्रत्येक सेल में आपके आश्रित चर (अवशिष्ट) का विचरण बराबर होना चाहिए
यह निश्चित रूप से महत्व स्तर को प्रभावित कर सकता है, कम से कम जब नमूना आकार असमान हो।
(संपादित करें :) एक एनोवा एफ-स्टेटिस्टिक विचरण के दो अनुमानों का अनुपात है (विभेदों का विभाजन और तुलना इसलिए इसे विचरण का विश्लेषण कहा जाता है)। भाजक माना जाता है कि आम-से-सभी-कोशिकाओं त्रुटि विचरण (अवशिष्ट से गणना) का अनुमान है, जबकि अंश, समूह में भिन्नता के आधार पर, दो घटक होंगे, जनसंख्या में भिन्नता से एक और साधन त्रुटि विचरण के कारण। यदि शून्य सही है, तो जो दो संस्करण अनुमान लगाए जा रहे हैं, वे समान होंगे (सामान्य त्रुटि विचरण के दो अनुमान); यह सामान्य लेकिन अज्ञात मूल्य रद्द कर देता है (क्योंकि हमने एक अनुपात लिया था), एक एफ-स्टेटिस्टिक छोड़कर जो केवल त्रुटियों के वितरण पर निर्भर करता है (जो कि हम जो अनुमान दिखा सकते हैं उसके तहत एक एफ वितरण है। - इसी तरह की टिप्पणी टी पर लागू होती है) परीक्षण मैं चित्रण के लिए इस्तेमाल किया।)
[मेरे जवाब में उस जानकारी में से कुछ पर थोड़ा और विस्तार है ]
हालांकि, यहां दो जनसंख्या भिन्नताएं दो अलग-अलग आकार के नमूनों में भिन्न हैं। भाजक (एनोवा में एफ-स्टेटिस्टिक और टी-टेस्ट में टी-स्टेटिस्टिक) पर विचार करें - यह दो अलग-अलग भिन्न अनुमानों से बना है, एक नहीं, इसलिए इसमें "सही" वितरण (स्केल ची) नहीं होगा एफ के लिए -square और इसके वर्गमूल के मामले में - आकार और पैमाने दोनों ही मुद्दे हैं)।
नतीजतन, एफ-स्टेटिस्टिक या टी-स्टेटिस्टिक के पास अब एफ- या टी-वितरण नहीं होगा, लेकिन जिस तरह से यह प्रभावित होता है वह अलग-अलग होता है या नहीं, यह इस बात पर निर्भर करता है कि जनसंख्या से बड़ा या छोटा नमूना किसके साथ खींचा गया था। बड़ा विचरण। यह बदले में पी-मूल्यों के वितरण को प्रभावित करता है।
अशक्त (यानी जब जनसंख्या का मतलब समान हो) के तहत, पी-वैल्यू का वितरण समान रूप से वितरित किया जाना चाहिए। हालाँकि, यदि संस्करण और नमूना आकार असमान हैं, लेकिन साधन समान हैं (इसलिए हम शून्य को अस्वीकार नहीं करना चाहते हैं), पी-मान समान रूप से वितरित नहीं हैं। मैंने आपको यह दिखाने के लिए एक छोटा सा अनुकरण किया। इस मामले में, मैंने केवल 2 समूहों का उपयोग किया ताकि एनोवा दो समान नमूना टी परीक्षण के बराबर है, जो समान विचरण धारणा के साथ है। इसलिए मैंने दो सामान्य वितरणों से नमूनों का अनुकरण किया, जिनमें से एक मानक विचलन के साथ दस गुना बड़ा था, लेकिन समान साधन।
बाईं ओर के भूखंड के लिए, बड़ा ( जनसंख्या ) मानक विचलन n = 5 के लिए था और छोटा मानक विचलन n = 30 के लिए था। दाईं ओर के भूखंड के लिए बड़ा मानक विचलन n = 30 और छोटा n = 5 के साथ गया। मैंने प्रत्येक एक बार 10000 का अनुकरण किया और हर बार पी-वैल्यू पाया। प्रत्येक मामले में आप चाहते हैं कि हिस्टोग्राम पूरी तरह से सपाट (आयताकार) हो, क्योंकि इसका मतलब है कि कुछ महत्व स्तर पर किए गए सभी परीक्षण वास्तव में उस प्रकार की त्रुटि दर प्राप्त करते हैं। विशेष रूप से यह सबसे महत्वपूर्ण है कि हिस्टोग्राम के सबसे बाएं हिस्से ग्रे लाइन के करीब रहें:α
जैसा कि हम देखते हैं, बाईं ओर का भूखंड (छोटे नमूने में बड़ा विचरण) पी-मान बहुत छोटा है - हम अशक्त परिकल्पना को बहुत बार अस्वीकार करेंगे (इस उदाहरण में लगभग आधा समय) भले ही शून्य सही हो । अर्थात्, हमारे द्वारा पूछे जाने की तुलना में हमारे महत्व का स्तर बहुत बड़ा है। दाहिने हाथ की ओर की साजिश में हम देखते हैं कि पी-वैल्यू ज्यादातर बड़े हैं (और इसलिए हमारा महत्व स्तर हमारे द्वारा पूछे गए से बहुत छोटा है) - वास्तव में दस हजार सिमुलेशन में एक बार नहीं हमने 5% के स्तर पर अस्वीकार कर दिया (सबसे छोटा) यहाँ पी-वैल्यू 0.055 था)। [यह इतनी बुरी बात नहीं लग सकती है, जब तक हम याद नहीं करते कि हमारे पास बहुत महत्वपूर्ण महत्व के स्तर के साथ जाने के लिए बहुत कम शक्ति होगी।]
यह काफी एक परिणाम है। यही कारण है कि यह एक अच्छा विचार है कि जब हम वेरिंस समान रूप से इन स्थितियों में प्रभावित होते हैं, तो यह मानने के लिए हमारे पास एक अच्छा कारण नहीं है कि वेल-सेटरथाइट टाइप टी-टेस्ट या एनोवा का उपयोग करें। इस मामले को भी नकली बनाया; नकली पी-मानों के दो वितरण - जो मैंने यहां नहीं दिखाए हैं - फ्लैट के काफी करीब से बाहर आए)।
2. प्रतिक्रिया का सशर्त वितरण (DV)
आपके आश्रित चर (अवशिष्ट) को डिज़ाइन के प्रत्येक सेल के लिए सामान्य रूप से वितरित किया जाना चाहिए
यह कुछ हद तक कम महत्वपूर्ण है - सामान्य से मध्यम विचलन के लिए, महत्व का स्तर बड़े नमूनों में बहुत अधिक प्रभावित नहीं होता है (हालांकि शक्ति हो सकती है!)।
nn
हम देखते हैं कि n = 5 में बहुत कम पी-मान हैं (5% परीक्षण के लिए महत्व का स्तर लगभग आधा होगा जो इसे होना चाहिए), लेकिन n = 50 पर समस्या कम हो गई है - 5% के लिए इस मामले में परीक्षण का वास्तविक महत्व स्तर लगभग 4.5% है।
तो हमें यह कहने के लिए लुभाया जा सकता है कि "ठीक है, यह ठीक है, अगर n काफी बड़ा है ताकि महत्वपूर्ण स्तर बहुत करीब हो सके", लेकिन हम एक तरह से शक्ति का अच्छा सौदा भी फेंक सकते हैं। विशेष रूप से, यह ज्ञात है कि व्यापक रूप से उपयोग किए जाने वाले विकल्पों के सापेक्ष टी-टेस्ट की एसिम्प्टोटिक सापेक्ष दक्षता 0. जा सकती है। इसका मतलब है कि बेहतर परीक्षण विकल्प नमूना आकार के लुप्तप्राय छोटे अंश के साथ इसे प्राप्त करने के लिए आवश्यक शक्ति प्राप्त कर सकते हैं। टी-टेस्ट। आपको साधारण से हटकर कुछ भी करने की आवश्यकता नहीं है, यह कहने की आवश्यकता है कि डेटा के साथ दो बार अधिक से अधिक होने के लिए टी के साथ एक ही शक्ति है जैसा कि आपको वैकल्पिक परीक्षण के साथ की आवश्यकता होगी - जनसंख्या वितरण में सामान्य से अधिक भारी-सामान्य पूंछ और मध्यम बड़े नमूने इसे करने के लिए पर्याप्त हो सकते हैं।
(वितरण के अन्य विकल्प महत्त्वपूर्ण स्तर को इससे कहीं अधिक कर सकते हैं, या जितना हमने यहाँ देखा है उससे बहुत कम है।)