@ जुम्मन ने आपको एक अच्छा विकल्प दिया है। मुझे लगा कि मैं -est बनाम परीक्षण की उपयुक्तता के बारे में आपके स्पष्ट प्रश्नों के बारे में कुछ जानकारी प्रदान कर सकता हूं । χ 2zχ2
z :
-est का उपयोग करने की उपयुक्तता के बारे में दो चिंताएं हैं , दोनों के बारे में कि क्या अनुमानित नमूना वितरण सही है। सबसे पहले, टेस्ट के बजाय सामान्य वितरण का उपयोग करता है -distribution, मानक विचलन जिसका अर्थ त्रुटि नमूने के बिना जाना जाता है। दूसरा, नमूना वितरण निरंतर है, लेकिन डेटा असतत हैं; चूँकि डेटा के केवल कुछ संयोजन संभव हैं, केवल कुछ परिणामी अहसास परीक्षण आँकड़ा मूल्य संभव हैं, जो सैद्धांतिक नमूना वितरण से अच्छी तरह मेल नहीं खा सकते हैं। (मैं इस मुद्दे पर अन्य परीक्षणों के संदर्भ में यहां चर्चा करता हूं: तुलना और विषमता, पी-मान, महत्व स्तर और टाइप I त्रुटि ।) zzt
आइए पहली चिंता पर एक अलग संदर्भ में विचार करें। यदि आपके पास सामान्य रूप से वितरित डेटा वाले दो समूह हैं, और आप यह देखना चाहते हैं कि साधन समतुल्य हैं, तो आपको साधन और मानक विचलन दोनों की गणना करने की आवश्यकता है। अब हम जानते हैं कि साधन नमूनाकरण त्रुटि के अधीन हैं, इसीलिए हमें परीक्षण करने की आवश्यकता है बजाय यह कहने के कि ये दो नमूना साधन समान नहीं हैं। हालांकि, मानक विचलन के हमारे अनुमान भी नमूना त्रुटि के अधीन होने चाहिए और हमें उस तथ्य को किसी तरह ध्यान में रखना होगा। जब हम ऐसा करते हैं, तो यह पता चलता है कि परीक्षण सांख्यिकीय (एक प्रकार का छोटा अंतर अंतर) रूप में वितरित किया गया । यदि हम इसके बजाय सामान्य वितरण का उपयोग करते हैं (यानी,tz-उत्तम), इसका मतलब यह होगा कि हम मान रहे हैं कि मानक विचलन के हमारे अनुमान त्रुटि रहित हैं - एकदम सही। तो आपके मामले में -est का उपयोग क्यों किया जा सकता है ? कारण यह है कि आपका डेटा सामान्य होने के बजाय द्विपद (यानी, 'सफलताओं की संख्या' ज्ञात कुल परीक्षणों में से) हैं। में द्विपद बंटन , मानक विचलन मतलब के एक समारोह है, तो एक बार आप यह अनुमान लगाया है मतलब के बारे में चिंता करने के लिए कोई अतिरिक्त अनिश्चितता वहाँ जाता है। इस प्रकार, सामान्य वितरण का उपयोग परीक्षण सांख्यिकीय के नमूना वितरण के मॉडल के रूप में किया जा सकता है। z
यद्यपि परीक्षण वितरण के लंबे समय के व्यवहार को समझने के लिए सामान्य वितरण का उपयोग तकनीकी रूप से सही है, एक और मुद्दा उभरता है। समस्या यह है कि सामान्य वितरण निरंतर है, लेकिन क्योंकि आपका डेटा असतत है, इसलिए सैद्धांतिक वितरण के सभी मूल्य संभवतः आपके डेटासेट में नहीं मिल सकते हैं। (फिर, मैं ऊपर दिए गए उत्तर में इस मुद्दे पर और अधिक विस्तार से चर्चा करता हूं।) सौभाग्य से, आपके डेटा के संभावित परिणामों और सैद्धांतिक सामान्य नमूने वितरण के बीच का मिलान आपके को बेहतर बनाता है । आपके मामले में, कोई फर्क नहीं पड़ता कि सही अंतर्निहित संभावनाएं, आपके पास सभी सफलताओं के रूप में या प्रत्येक समूह में कुछ भी नहीं हो सकती हैं। इसका मतलब है कि संभावित संयोजनों की संख्याN91×91=1,729, जो बहुत सारी संभावनाएं हैं। एक छोटे डेटासेट के साथ, आप वास्तव में कुछ ऐसी समस्याओं में भाग सकते हैं, जिनके बारे में मैं अपने लिंक किए गए उत्तर में चर्चा करता हूं, लेकिन , आपको चिंता करने की बहुत अधिक आवश्यकता नहीं है। मेरा मानना है कि शोधकर्ताओं के लिए -est सबसे वैध विकल्प था। N=180z
χ2 - :
बेनाम: लेकिन -test के बारे में क्या ? मुझे लगता है कि यह भी एक वैध विकल्प है, लेकिन यह मेरी पहली पसंद नहीं होगा। (मुझे इस बात पर ध्यान देना चाहिए कि ऊपर चर्चा की गई दूसरी चिंता - असतत डेटा और एक सतत संदर्भ वितरण के बीच एक बेमेल - सिर्फ उतना ही लागू होता है जितना कि -के रूप में यह -est के लिए होता है, इसलिए वहाँ है यहां कोई फायदा नहीं।) साथ समस्याχ2χ2zχ2-तम यह है कि यह नहीं मानता कि पंक्ति योग के सापेक्ष स्तंभ योगों के बारे में कुछ विशेष है; दोनों के साथ ऐसा व्यवहार किया जाता है जैसे वे अन्य संभावित मूल्य हो सकते हैं। हालाँकि, यह प्रायोगिक सेटअप को सटीक रूप से प्रतिबिंबित नहीं करता है। 180 लोग थे, और 90 को प्रत्येक समूह को सौंपा गया था। केवल एक चीज जो वास्तव में दोहराया समान अध्ययनों में भिन्न होगी, उन लोगों की संख्या है जिन्होंने प्रत्येक समूह में एक ठंड को पकड़ा। टेस्ट गलत तरीके से व्यवहार करता है दोनों जुकाम की संख्या और प्रत्येक समूह के रूप में यद्यपि वे भिन्न हो सकता है में लोगों की संख्या है, लेकिन -Test सही धारणा बनाता है। इसीलिए -est में यहाँ अधिक शक्ति है। χ2zz
इसके लायक क्या है, @jbowman द्वारा सुझाए गए क्रमपरिवर्तन परीक्षण से आपके डिजाइन का यह पहलू भी सही हो जाता है और यह असतत-निरंतर बेमेल मुद्दे से ग्रस्त नहीं होता है। इस प्रकार, यह सबसे अच्छा विकल्प है। लेकिन मुझे लगा कि आप थोड़ा और अधिक जानना चाहते हैं कि आपकी स्थिति में - और -tests की तुलना कैसे होती है। zχ2