बनाम -Test 2 समूहों में एक ठंडा पकड़ने की संभावना की तुलना के लिए टेस्ट


12

मैं सिर्फ एक अच्छी तरह से सम्मानित (लोकप्रिय) विज्ञान पत्रिका (जर्मन PM, 02/2013, p.36) एक दिलचस्प प्रयोग (एक स्रोत के बिना, दुर्भाग्य से) के बारे में पढ़ता हूं। इसने मेरा ध्यान आकर्षित किया क्योंकि सहज रूप से मैंने परिणाम के महत्व पर संदेह किया, लेकिन प्रदान की गई जानकारी सांख्यिकीय परीक्षण को पुन: प्रस्तुत करने के लिए पर्याप्त थी।

शोधकर्ताओं ने सोचा कि क्या ठंड के मौसम में ठंड पड़ने से ठंड बढ़ने की संभावना बढ़ जाती है। इसलिए उन्होंने अनियमित रूप से 180 छात्रों के एक समूह को दो समूहों में विभाजित किया। एक समूह को 20 मिनट तक ठंडे पानी में अपने पैर रखने पड़े। दूसरे ने अपने जूते रखे। एक मजाकिया हेरफेर की तरह, मुझे लगता है, लेकिन दूसरी तरफ मैं एक डॉक्टर नहीं हूं और शायद डॉक्टर मजाकिया समझते हैं। नैतिक मुद्दे एक तरफ।

वैसे भी, 5 दिनों के बाद, उपचार समूह में 13 छात्रों को सर्दी थी, लेकिन समूह में केवल 5 ने अपने जूते रखे। इस प्रकार इस प्रयोग का अनुपात 2.87 है।

बल्कि छोटे नमूने के आकार को देखते हुए, मुझे आश्चर्य हुआ कि क्या यह अंतर महत्वपूर्ण हो सकता है। इसलिए मैंने दो परीक्षण किए।

सामान्य सन्निकटन का उपयोग करके अनुपात की समानता का पहला सरल परीक्षण। इस टेस्ट में साथ । मेरा अनुमान है कि यह वही है जो शोधकर्ताओं ने परीक्षण किया। यह वास्तव में महत्वपूर्ण है। हालाँकि यह z- परीक्षण केवल बड़े नमूनों में मान्य है, अगर मैं सामान्य सन्निकटन के कारण गलत नहीं हूँ। इसके अलावा, प्रचलन दरें बहुत छोटी हैं और मुझे आश्चर्य है कि क्या यह प्रभाव के विश्वास अंतराल की कवरेज दर को प्रभावित नहीं कर सकता है।p = 0.0468z=1.988p=0.0468

तो मेरा दूसरा प्रयास मोंटे-कार्लो सिमुलेशन और मानक पियर्सन ची-स्क्वायर दोनों के साथ स्वतंत्रता का ची-स्क्वायर परीक्षण था। यहाँ मुझे बारे में मान ।p=.082

अब यह सब परिणामों के बारे में आश्वस्त नहीं है। मुझे आश्चर्य है कि इस डेटा का परीक्षण करने के लिए और अधिक विकल्प हैं और दो परीक्षणों पर आपके विचार क्या हैं (विशेष रूप से पहले, महत्वपूर्ण, परीक्षण की धारणाएं)


मेरा मानना ​​है कि आपने पीयर्सन के ची-स्क्वेयर्ड स्टेटिस्टिक पर निरंतरता सुधार किया है, जो पी-वैल्यू में विसंगति के लिए जिम्मेदार है।
Scortchi - को पुनः स्थापित मोनिका

जवाबों:


13

मैं या तो सामान्य सन्निकटन या ची-वर्ग के बजाय एक क्रमपरिवर्तन परीक्षण का उपयोग करूँगा । क्रमपरिवर्तन परीक्षण डेटा पर सटीक और सबसे शक्तिशाली, सशर्त है।

इस मामले में, हम समूहों के सभी क्रमपरिवर्तन की गणना नहीं कर सकते हैं, लेकिन हम डेटा के बहुत सारे यादृच्छिक क्रमांकन उत्पन्न कर सकते हैं और एक बहुत ही सटीक मान प्राप्त कर सकते हैं:

group <- c(rep("A",90),rep("B",90))
n_a <- rep(0,100000)
for (i in 1:length(n_a)) {
   temp <- sample(group, size=18)
   n_a[i] <- sum(temp == "A")
}
> mean(n_a >= 13)
[1] 0.03904

जो 0.039 के पी-मूल्य को इंगित करेगा।

फिर भी, और यह एक बड़ी बात है, लेकिन मैं यह अनुमान लगा रहा हूं कि यह अनुमान लगाया जा रहा है कि जुकाम होने वाले विषय स्वतंत्र घटना हैं। ये व्यक्ति एक ही स्कूल के छात्र हैं। कल्पना कीजिए कि उनमें से दो एक वर्ग, या एक छात्रावास, या कुछ अन्य गतिविधि, या एक कैफेटेरिया (कई कैफेटेरिया वाले स्कूल में) साझा करते हैं; "# 1 को ठंड मिलती है" और "# 2 को ठंड लगती है" घटनाएँ स्वतंत्र नहीं हैं। मैं सोच सकता था कि एक छात्र कहेगा "चलो इस प्रयोग के लिए साइन अप करें!" उसके / उसके रूममेट या दोस्तों के लिए; मैं सोच सकता था कि छात्रों को कक्षाओं से भर्ती किया गया था जो प्रोफेसरों ने पढ़ाया था; मैं बहुत सारे तरीकों की कल्पना कर सकता था कि स्वतंत्रता की धारणा का उल्लंघन होता है। शायद कागज, जो मैंने पढ़ा नहीं है, उनमें से कुछ को संबोधित करता है, लेकिन यह देखना मुश्किल है कि यह उन सभी को कैसे संबोधित कर सकता है,


धन्यवाद @ जेजमैन - इसके अलावा आपने एक पक्षीय परीक्षण किया, मैं देखता हूं। मुझे लगता है कि यह अधिक समझ में आता है तब मैंने दो तरफा परीक्षण किया। यदि सामान्य सन्निकटन को एक पक्षीय किया जाता है, तो p मान .023 से ऊपर होता है। मुझे आज़ादी के बारे में कविता पसंद है। संभवतः छात्रों को भी अलग नहीं किया जाता था जब वे अपने पैरों को पानी में रखते थे, इसलिए यह एक ठंड को प्रसारित करने का एक तरीका भी है।
तोमका

(+1) लेकिन यह ध्यान देने योग्य है कि आपको अनुकरण करने की आवश्यकता नहीं है: आपके परीक्षण सांख्यिकीय का वितरण अशक्त परिकल्पना (सीमांत योगों पर कंडीशनिंग) के तहत एक हाइपरमेट्रिक वितरण का अनुसरण करता है। यह फिशर का सटीक परीक्षण है।
Scortchi - को पुनः स्थापित मोनिका

11

@ जुम्मन ने आपको एक अच्छा विकल्प दिया है। मुझे लगा कि मैं -est बनाम परीक्षण की उपयुक्तता के बारे में आपके स्पष्ट प्रश्नों के बारे में कुछ जानकारी प्रदान कर सकता हूं । χ 2zχ2

z :

-est का उपयोग करने की उपयुक्तता के बारे में दो चिंताएं हैं , दोनों के बारे में कि क्या अनुमानित नमूना वितरण सही है। सबसे पहले, टेस्ट के बजाय सामान्य वितरण का उपयोग करता है -distribution, मानक विचलन जिसका अर्थ त्रुटि नमूने के बिना जाना जाता है। दूसरा, नमूना वितरण निरंतर है, लेकिन डेटा असतत हैं; चूँकि डेटा के केवल कुछ संयोजन संभव हैं, केवल कुछ परिणामी अहसास परीक्षण आँकड़ा मूल्य संभव हैं, जो सैद्धांतिक नमूना वितरण से अच्छी तरह मेल नहीं खा सकते हैं। (मैं इस मुद्दे पर अन्य परीक्षणों के संदर्भ में यहां चर्चा करता हूं: तुलना और विषमता, पी-मान, महत्व स्तर और टाइप I त्रुटि ।) zzt

आइए पहली चिंता पर एक अलग संदर्भ में विचार करें। यदि आपके पास सामान्य रूप से वितरित डेटा वाले दो समूह हैं, और आप यह देखना चाहते हैं कि साधन समतुल्य हैं, तो आपको साधन और मानक विचलन दोनों की गणना करने की आवश्यकता है। अब हम जानते हैं कि साधन नमूनाकरण त्रुटि के अधीन हैं, इसीलिए हमें परीक्षण करने की आवश्यकता है बजाय यह कहने के कि ये दो नमूना साधन समान नहीं हैं। हालांकि, मानक विचलन के हमारे अनुमान भी नमूना त्रुटि के अधीन होने चाहिए और हमें उस तथ्य को किसी तरह ध्यान में रखना होगा। जब हम ऐसा करते हैं, तो यह पता चलता है कि परीक्षण सांख्यिकीय (एक प्रकार का छोटा अंतर अंतर) रूप में वितरित किया गया । यदि हम इसके बजाय सामान्य वितरण का उपयोग करते हैं (यानी,tz-उत्तम), इसका मतलब यह होगा कि हम मान रहे हैं कि मानक विचलन के हमारे अनुमान त्रुटि रहित हैं - एकदम सही। तो आपके मामले में -est का उपयोग क्यों किया जा सकता है ? कारण यह है कि आपका डेटा सामान्य होने के बजाय द्विपद (यानी, 'सफलताओं की संख्या' ज्ञात कुल परीक्षणों में से) हैं। में द्विपद बंटन , मानक विचलन मतलब के एक समारोह है, तो एक बार आप यह अनुमान लगाया है मतलब के बारे में चिंता करने के लिए कोई अतिरिक्त अनिश्चितता वहाँ जाता है। इस प्रकार, सामान्य वितरण का उपयोग परीक्षण सांख्यिकीय के नमूना वितरण के मॉडल के रूप में किया जा सकता है। z

यद्यपि परीक्षण वितरण के लंबे समय के व्यवहार को समझने के लिए सामान्य वितरण का उपयोग तकनीकी रूप से सही है, एक और मुद्दा उभरता है। समस्या यह है कि सामान्य वितरण निरंतर है, लेकिन क्योंकि आपका डेटा असतत है, इसलिए सैद्धांतिक वितरण के सभी मूल्य संभवतः आपके डेटासेट में नहीं मिल सकते हैं। (फिर, मैं ऊपर दिए गए उत्तर में इस मुद्दे पर और अधिक विस्तार से चर्चा करता हूं।) सौभाग्य से, आपके डेटा के संभावित परिणामों और सैद्धांतिक सामान्य नमूने वितरण के बीच का मिलान आपके को बेहतर बनाता है । आपके मामले में, कोई फर्क नहीं पड़ता कि सही अंतर्निहित संभावनाएं, आपके पास सभी सफलताओं के रूप में या प्रत्येक समूह में कुछ भी नहीं हो सकती हैं। इसका मतलब है कि संभावित संयोजनों की संख्याN91×91=1,729, जो बहुत सारी संभावनाएं हैं। एक छोटे डेटासेट के साथ, आप वास्तव में कुछ ऐसी समस्याओं में भाग सकते हैं, जिनके बारे में मैं अपने लिंक किए गए उत्तर में चर्चा करता हूं, लेकिन , आपको चिंता करने की बहुत अधिक आवश्यकता नहीं है। मेरा मानना ​​है कि शोधकर्ताओं के लिए -est सबसे वैध विकल्प था। N=180z

χ2 - :

बेनाम: लेकिन -test के बारे में क्या ? मुझे लगता है कि यह भी एक वैध विकल्प है, लेकिन यह मेरी पहली पसंद नहीं होगा। (मुझे इस बात पर ध्यान देना चाहिए कि ऊपर चर्चा की गई दूसरी चिंता - असतत डेटा और एक सतत संदर्भ वितरण के बीच एक बेमेल - सिर्फ उतना ही लागू होता है जितना कि -के रूप में यह -est के लिए होता है, इसलिए वहाँ है यहां कोई फायदा नहीं।) साथ समस्याχ2χ2zχ2-तम यह है कि यह नहीं मानता कि पंक्ति योग के सापेक्ष स्तंभ योगों के बारे में कुछ विशेष है; दोनों के साथ ऐसा व्यवहार किया जाता है जैसे वे अन्य संभावित मूल्य हो सकते हैं। हालाँकि, यह प्रायोगिक सेटअप को सटीक रूप से प्रतिबिंबित नहीं करता है। 180 लोग थे, और 90 को प्रत्येक समूह को सौंपा गया था। केवल एक चीज जो वास्तव में दोहराया समान अध्ययनों में भिन्न होगी, उन लोगों की संख्या है जिन्होंने प्रत्येक समूह में एक ठंड को पकड़ा। टेस्ट गलत तरीके से व्यवहार करता है दोनों जुकाम की संख्या और प्रत्येक समूह के रूप में यद्यपि वे भिन्न हो सकता है में लोगों की संख्या है, लेकिन -Test सही धारणा बनाता है। इसीलिए -est में यहाँ अधिक शक्ति है। χ2zz

इसके लायक क्या है, @jbowman द्वारा सुझाए गए क्रमपरिवर्तन परीक्षण से आपके डिजाइन का यह पहलू भी सही हो जाता है और यह असतत-निरंतर बेमेल मुद्दे से ग्रस्त नहीं होता है। इस प्रकार, यह सबसे अच्छा विकल्प है। लेकिन मुझे लगा कि आप थोड़ा और अधिक जानना चाहते हैं कि आपकी स्थिति में - और -tests की तुलना कैसे होती है। zχ2


धन्यवाद @ @, मैं वास्तव में आपके प्रयासों की सराहना करता हूं। यह चीजों को स्पष्ट करता है।
टॉमका

@ गुंग मैं भ्रमित हूँ - क्या चि वर्ग और समान अनुपात का z है या नहीं? आंकड़े.stackexchange.com/questions/173415/…
जेवियर

@XavierBourretSicotte, z- परीक्षण अक्सर हुड के तहत ची-स्क्वेर्ड परीक्षण के रूप में कार्यान्वित किया जाता है, आर उदाहरण के लिए ऐसा करता है। मैं अभी भी अक्सर z- परीक्षण का उपयोग करना पसंद करता हूं क्योंकि जानकारी इस तरह से समझ के साथ प्रस्तुत की जाती है कि 1 चर एक कोवरिएट है और दूसरा प्रतिक्रिया है।
गूँग - मोनिका

1
(+1) @XavierBourretSicotte: दो समानुपात के बीच के अंतर के लिए आमतौर पर दो प्रयोग किए जाने वाले z- परीक्षण हैं: एक स्कोर टेस्ट है, जो पियर्सन के ची-स्क्वेर्ड परीक्षण के बराबर है (जिसमें हर में वर्जन की गणना सर्वश्रेष्ठ-फिटिंग के तहत की जाती है। शून्य); अन्य एक वाल्ड परीक्षण है (जिसमें भाजक में विचरण की गणना दो अनुपातों में अंतर के अधिकतम-संभावित अनुमान पर की जाती है)।
Scortchi - को पुनः स्थापित मोनिका

@Sortchi यह स्पष्ट करने के लिए धन्यवाद! यह पहली बार है जब मुझे अंतर का इतना स्पष्ट विवरण मिला है - क्या आप उन स्थानों से जुड़ पाएंगे जहां दो दृष्टिकोणों के बारे में बताया गया है? प्रसरण के लिए इसी सूत्र के साथ?
जेवियर बोरेट सिसिलोट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.