एक अनपेक्षित टी-टेस्ट के लिए कौन सी सामान्य धारणाएं आवश्यक हैं? और वे कब मिले?


12

यदि हम एक युग्मित टी-टेस्ट आयोजित करना चाहते हैं, तो आवश्यकता है (यदि मैं सही ढंग से समझता हूं) कि माप की मिलान इकाइयों के बीच औसत अंतर सामान्य रूप से वितरित किया जाएगा।

युग्मित टी-टेस्ट में, यह मांग में व्यक्त किया गया है (AFAIK) कि माप की मिलान इकाइयों के बीच का अंतर सामान्य रूप से वितरित किया जाएगा (भले ही दो तुलना समूहों में से प्रत्येक का वितरण सामान्य नहीं हो)।

हालांकि, एक अनपेक्षित टी-टेस्ट में, हम मिलान की गई इकाइयों के बीच अंतर के बारे में बात नहीं कर सकते हैं, इसलिए हमें दो समूहों से टिप्पणियों को सामान्य होने की आवश्यकता है ताकि उनके मतलब का अंतर सामान्य हो जाए। जो मुझे मेरे प्रश्न की ओर ले जाता है:

क्या यह दो गैर-सामान्य वितरणों के लिए संभव है ताकि उनके साधनों का अंतर सामान्य रूप से वितरित हो? (और इस प्रकार, उन पर एक अप्रकाशित टी-परीक्षण करने के लिए हमारी आवश्यक आवश्यकता को पूरा करें - फिर से - जहां तक ​​मैं समझता हूं)।

अपडेट: (उत्तर के लिए आप सभी का धन्यवाद) मैं देखता हूं कि हम जिस सामान्य नियम की तलाश कर रहे हैं, वह वास्तव में यह है कि साधनों का अंतर सामान्य होगा, जो सीएलटी के कारण एक अच्छी धारणा (बड़े एन के तहत) प्रतीत होता है। यह मेरे लिए आश्चर्यजनक है (आश्चर्य की बात नहीं, सिर्फ आश्चर्यजनक है), जैसे कि यह अनपेक्षित टी-टेस्ट के लिए कैसे काम करता है, लेकिन एकल नमूना टी-टेस्ट के लिए भी काम नहीं करेगा। यहाँ कुछ आर कोड वर्णन करने के लिए है:

n1 <- 10
n2 <- 10
mean1 <- 50
mean2 <- 50
R <- 10000

# diffs <- replicate(R, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
# hist(diffs)

P <- numeric(R)
MEAN <- numeric(R)
for(i in seq_len(R))
{
    y1 <- rexp(n1, 1/mean1)
    y2 <- runif(n2, 0, 2*mean2)
    MEAN[i] <- mean(y1) - mean(y2)
    P[i] <- t.test(y1,y2)$p.value
}
# diffs <- replicate(R, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
par(mfrow = c(1,2))
hist(P)
qqplot(P, runif(R)); abline(0,1)
sum(P<.05) / R # for n1=n2=10 -> 0.0715 # wrong type I error, but only for small n1 and n2 (for larger ones, this effect disappears)



n1 <- 100
mean1 <- 50
R <- 10000
P_y1 <- numeric(R)

for(i in seq_len(R))
{
    y1 <- rexp(n1, 1/mean1)
    P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}

par(mfrow = c(1,2))
hist(P_y1)
qqplot(P_y1, runif(R)); abline(0,1)
sum(P_y1<.05) / R # for n1=n2=10 -> 0.057  # "wrong" type I error

धन्यवाद।


5
एक्स आई एफ(एक्समैं,Yमैं)एक्समैंएफYमैं=एक्समैं+जेडमैं{जेडमैं}एन(0,σ2)

जवाबों:


17

व्यवहार में, केंद्रीय सीमा प्रमेय हमें विश्वास दिलाता है कि, मान्यताओं की एक विस्तृत श्रृंखला के तहत, दो नमूने के वितरण का मतलब है कि परीक्षण किया जा रहा है, सामान्य आकार के रूप में सामान्य वितरण का दृष्टिकोण होगा, भले ही (यह वह जगह है जहां मान्यताओं में आते हैं) अंतर्निहित डेटा के वितरण। परिणामस्वरूप, जैसा कि नमूना आकार बड़ा हो जाता है, साधनों का अंतर सामान्य रूप से वितरित हो जाता है, और नाममात्र टी वितरण के लिए एक अप्रकाशित टी-परीक्षण के टी-स्टेटिस्टिक के लिए आवश्यक आवश्यकताएं पूरी हो जाती हैं। इस प्रकार, अधिक व्यावहारिक रूप से लागू होने वाला प्रश्न हो सकता है, इससे पहले कि मैं आकार का कितना बड़ा नमूना कर सकता हूं, क्योंकि मैं आंकड़ा और टी वितरण के वास्तविक वितरण के बीच अंतर को सुरक्षित रूप से अनदेखा कर सकता हूं?

कई मामलों में, उत्तर "बहुत बड़ा नहीं है", खासकर जब अंतर्निहित वितरण सममित के बहुत करीब होते हैं। उदाहरण के लिए, मैंने दो यूनिफ़ॉर्म (0,1) वितरण के साधनों की तुलना में 100,000 परीक्षणों का अनुकरण किया, प्रत्येक का नमूना आकार 10 और, जब 95% आत्मविश्वास के स्तर पर परीक्षण किया गया, तो वास्तव में शून्य 5.19% समय को अस्वीकार कर दिया - शायद ही अलग हो। नाममात्र 5% अस्वीकृति दर से हम उम्मीद कर रहे हैं (हालांकि यह 5% से ऊपर 2.7 मानक विचलन है।)

यही कारण है कि लोग सभी प्रकार की परिस्थितियों में टी-टेस्ट का उपयोग करते हैं जहां अंतर्निहित धारणाएं वास्तव में पूरी नहीं होती हैं, लेकिन निश्चित रूप से आपकी समस्या की बारीकियों के आधार पर, आपका लाभ भिन्न हो सकता है। हालाँकि, ऐसे अन्य परीक्षण हैं जिन्हें सामान्यता की आवश्यकता नहीं होती है, जैसे कि विल्कोक्सन परीक्षण, जो कि, जब डेटा सामान्य रूप से वितरित किया जाता है, तो, समान रूप से, लगभग 95% टी-परीक्षण के रूप में कुशल होता है (यानी, एक नमूना आकार की आवश्यकता होती है एन / 0.95 की एन के नमूने के आकार के साथ टी-टेस्ट के समान शक्ति है, जैसा कि एन अनंत तक जाता है)। जब डेटा को आम तौर पर वितरित नहीं किया जाता है, तो यह टी-टेस्ट की तुलना में बहुत बेहतर हो सकता है (जरूरी नहीं होगा)।


6
टीटी

धन्यवाद फ्रैंक - आपकी टिप्पणी ने मुझे एक प्रश्न को स्पष्ट करने में मदद की, जो मैं उसके बाद के करीब हूं: आंकड़े.stackexchange.com/questions/19681/…
ताल

1

बेशक। यदि यह मामला नहीं था, तो स्वतंत्र नमूने टी-परीक्षण का अधिक उपयोग नहीं होगा। हमें वास्तव में बड़े नमूना आकारों की आवश्यकता है, क्योंकि हमारे लिए दो गैर-सामान्य आबादी के बीच अंतर के लिए परीक्षण करने के लिए हमें CLT के लिए अपील करने की आवश्यकता है।

एक त्वरित उदाहरण के लिए मान लेते हैं कि हमारे पास जनसंख्या 1 है जिसका मतलब औसत 25 से है और जनसंख्या 2 का मतलब समान रूप से 30 के साथ वितरित किया जा रहा है। हम उन्हें अलग-अलग नमूना आकार भी देंगे। हम जांच कर सकते हैं कि नमूना साधनों में अंतरों का वितरण आर फ़ंक्शन का उपयोग करके अपेक्षाकृत आसानी से आर का उपयोग करता है।

n1 <- 30
n2 <- 25
mean1 <- 25
mean2 <- 30

diffs <- replicate(10000, mean(rexp(n1, 1/mean1)) - mean(runif(n2, 0, 2*mean2)))
hist(diffs)

नमूना आकारों के साथ खेलने से पता चलता है कि कम नमूना आकारों में हमारे पास वास्तव में सामान्यता नहीं है, लेकिन नमूना आकार में वृद्धि से हमें साधनों में अंतर के लिए अधिक सामान्य दिखने वाला नमूना वितरण मिलता है। बेशक आप इस उदाहरण में उपयोग किए गए वितरणों को आगे का पता लगाने के लिए बदल सकते हैं। hist (डिफ)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.