बिना टी-टेस्ट के बजाय विलकॉक्सन रैंक-सम टेस्ट का उपयोग कब करें?


26

फ्रैंक हारेल ने यहां जो लिखा है, यह एक अनुवर्ती प्रश्न है :

मेरे अनुभव में टी वितरण के लिए आवश्यक नमूना आकार अक्सर हाथ में नमूना आकार से बड़ा होता है। जैसा कि आपने कहा, विलकॉक्सन हस्ताक्षरित रैंक परीक्षण बेहद कुशल है, और यह मजबूत है, इसलिए मैं लगभग हमेशा इसे टी परीक्षण से अधिक पसंद करता हूं

अगर मैं इसे सही ढंग से समझता हूं - दो बेजोड़ नमूनों के स्थान की तुलना करते समय, हम अनपेक्षित टी-टेस्ट के ऊपर विलकॉक्सन रैंक-सम टेस्ट का उपयोग करना पसंद करेंगे, अगर हमारे नमूना आकार छोटे हैं।

क्या कोई सैद्धांतिक स्थिति है जहां हम अनपेक्षित टी-टेस्ट पर विलकॉक्सन रैंक-सम टेस्ट को प्राथमिकता देंगे, यहां तक ​​कि हमारे दो समूहों के नमूना आकार अपेक्षाकृत बड़े हैं?

इस प्रश्न के लिए मेरी प्रेरणा अवलोकन से उपजी है कि एक एकल नमूना टी-टेस्ट के लिए, तिरछा वितरण के एक छोटे-से-छोटे नमूने के लिए इसका उपयोग करने से एक गलत प्रकार की त्रुटि उत्पन्न होगी:

n1 <- 100
mean1 <- 50
R <- 100000
P_y1 <- numeric(R)
for(i in seq_len(R))
{
    y1 <- rexp(n1, 1/mean1)
    P_y1[i] <- t.test(y1 , mu = mean1)$p.value
}
sum(P_y1<.05) / R # for n1=n2=100 -> 0.0572  # "wrong" type I error

1
मेरे लिए, 0.0572 0.05 के करीब पर्याप्त लगता है।
mark999

हाय मार्क - जब शून्य परिकल्पना के 100000 पुनरावृत्ति के तहत आयोजित किया जाता है, तो हम 0.05 से अंतर के इस स्तर को प्राप्त करने की उम्मीद नहीं करते हैं। आम तौर पर हम 0.05 से sqrt (0.05 * 0.95 / 100000) के दो गुना जैसे प्लस माइनस के अंतर की उम्मीद करेंगे
Tal Galili

1
मैं मानता हूं कि यह गलत है। मेरा सिर्फ यह मतलब था कि यह व्यावहारिक उद्देश्यों के लिए पर्याप्त है।
18999

1
एक संबंधित प्रश्न: छोटे नमूनों में टी-टेस्ट या गैर-पैरामीट्रिक परीक्षण जैसे विलकॉक्सन के बीच चयन कैसे करें , जो युग्मित और अप्रकाशित दोनों परीक्षणों पर विचार करता है, साथ ही ब्रूनर-मुन्जेल जैसे विलकॉक्सन के विकल्प भी। फ्रैंक हरेल द्वारा एक उत्कृष्ट उत्तर भी दिया गया है जो बताता है कि क्यों वह ऊपर के अर्क की तुलना में अधिक विस्तार से अपने दृष्टिकोण में उचित लगता है (जैसे कि मोनोटोनिक परिवर्तन के तहत रैंकों के आक्रमण का महत्व)।
सिल्वरफिश

@ टालगिली: आप इस स्तर के अंतर की उम्मीद क्यों नहीं करेंगे, यह देखते हुए कि आप एक टी-टेस्ट कर रहे हैं और सामान्यता धारणा का उल्लंघन किया गया है (मैं देखता हूं कि आपका नमूना तेजी से वितरित किया गया है)? मैं एक नौसिखिया दृष्टिकोण से पूछ रहा हूँ, यहाँ। मैं बस यह समझने की कोशिश कर रहा हूं कि हम क्या उम्मीद कर रहे हैं, एक नमूना टी-टेस्ट करते समय जब सामान्यता का उल्लंघन होता है। औसत प्रकार I त्रुटि 5% से छोटी या 5% से बड़ी या कुछ भी क्यों होनी चाहिए? जिस तरह से मैं इसे देखता हूं, हम जो परीक्षण कर रहे हैं वह और वितरण सामान्य है। H0:μ=50
एरोसिनिन

जवाबों:


23

हाँ वहाँ है। उदाहरण के लिए, अनंत विचरण वाले वितरण से कोई भी नमूना टी-टेस्ट को मिटा देगा, लेकिन विलकॉक्सन नहीं। Nonparametric सांख्यिकीय विधियों (हॉलैंडर और वोल्फ) का उल्लेख करते हुए, मैं देखता हूं कि टी परीक्षण के सापेक्ष विलकॉक्सन की एसिम्प्टोटिक सापेक्ष दक्षता (हैं) यूनिफ़ॉर्म वितरण के लिए 1.0 है, 1.097 (यानी, Wiloxoxon बेहतर है) लॉजिस्टिक के लिए, 1.5 के लिए डबल घातीय (लाप्लास), और घातीय के लिए 3.0।

होजेस और लेहमन ने दिखाया कि किसी भी अन्य परीक्षण के सापेक्ष विलकॉक्सन की न्यूनतम संख्या 0.864 है, इसलिए आप किसी भी अन्य चीज़ के सापेक्ष इसका उपयोग करके लगभग 14% से अधिक दक्षता कभी नहीं खो सकते हैं। (निश्चित रूप से, यह एक विषम परिणाम है।) नतीजतन, फ्रैंक हरेल के विलकॉक्सन को एक डिफ़ॉल्ट के रूप में उपयोग करना संभवतः लगभग सभी को अपनाना चाहिए, जिसमें स्वयं भी शामिल है।

संपादित करें: टिप्पणियों में अनुवर्ती प्रश्न का जवाब देना, उन लोगों के लिए जो आत्मविश्वास अंतराल पसंद करते हैं, हॉजेस-लेहमन अनुमानक अनुमानक है जो विल्कोक्सन परीक्षण के लिए "मेल खाती है", और उसके चारों ओर आत्मविश्वास अंतराल का निर्माण किया जा सकता है।


1
क्या एक आसान तरीका है विश्वास अंतराल प्राप्त करने के लिए यदि विल्कोक्सन परीक्षण का उपयोग किया जाता है? यह लोगों को पी-वैल्यू पर बहुत अधिक जोर देने के लिए प्रोत्साहित करता है, यहां तक ​​कि इससे भी अधिक वे एक पैरामीट्रिक विधि के साथ करते हैं।
mark999

हां, होजेस-लेहमन अनुमानक प्रासंगिक अनुमानक है, और मैंने प्रतिक्रिया के शरीर को संपादित किया है ताकि भविष्य के पाठकों को टिप्पणियों के माध्यम से न जाना पड़े।
जम्मन

शुक्रिया जंबोमैन। मैं हॉजेस-लेहमन के अनुमानक से परिचित नहीं हूं, लेकिन यह देखूंगा कि मुझे इसके बारे में क्या पता चल सकता है।
18999

3
biostat.mc.vanderbilt.edu/WilcoxonSoftware Hodges-Lehmann अनुमान और उसके विश्वास अंतराल प्राप्त करने के लिए R का उपयोग करने का तरीका दिखाता है।
फ्रैंक हार्डेल

1
(+1) एक कट्टर विरोधी परंपरावादी से। हालांकि, रैंक परीक्षणों के लिए एक चुनौती यह है कि परिकल्पना अस्पष्ट है। यह आमतौर पर टी-टेस्ट के समान परिकल्पना नहीं है। टी-टेस्ट हमेशा माध्य अंतर का परीक्षण करता है, विलकॉक्सन एक भारित माध्य रैंक अंतर का परीक्षण करता है। निश्चित रूप से अगर रैंक-माध्य अंतर सांख्यिकीय रूप से महत्वपूर्ण है, तो हमें पता है कि वितरण में अंतर होना चाहिए, भले ही उनके साधन समान हों। सभी मामलों में वितरण संबंधी मतभेदों का पता लगाने के लिए न तो परीक्षण संचालित किया जाता है । मैं केवल उतना ही कहता हूं क्योंकि मैं व्याख्या के पक्ष में हूं। (१/२)
एडम १६'१

24

मुझे आपके इस सवाल पर टिप्पणियों में चर्चा के लिए वापस लाते हैं । विलकॉक्सन सम-रैंक परीक्षण मैन-व्हिटनी यू परीक्षण के बराबर है (और दो से अधिक नमूनों के लिए इसका प्रत्यक्ष विस्तार क्रुस्कल-वालिस परीक्षण कहा जाता है)। आप विकिपीडिया के साथ-साथ इस पाठ में देख सकते हैं कि मान-व्हिटनी (या क्रुस्कल-वालिस) की तुलना आम तौर पर साधनों या मध्यस्थों से नहीं की जाती है। यह मूल्यों की समग्र व्यापकता की तुलना करता है: नमूनों में से कौन सा "स्टोचैस्टिक रूप से अधिक है"। परीक्षण वितरण-रहित है। टी-टेस्ट की तुलना का मतलब है। यह सामान्य वितरण को मानता है। तो, परीक्षण विभिन्न परिकल्पनाओं में संलग्न हैं। ज्यादातर मामलों में, हम विशेष रूप से साधनों की तुलना करने की योजना नहीं बनाते हैं, बल्कि, हम यह जानना चाहते हैं कि कौन सा नमूना मूल्यों से अधिक है, और यह मान-व्हिटनी को हमारे लिए डिफ़ॉल्ट परीक्षा बनाता है। दूसरी ओर, जब दोनों वितरण सममितीय होते हैं तो परीक्षण के कार्य को कि क्या एक नमूना अन्य साधनों की तुलना में "अधिक" है, दोनों साधनों की तुलना करने के कार्य में, और फिर, यदि वितरण समान रूपांतरों के साथ सामान्य हैं, तो टी-टेस्ट कुछ हद तक हो जाता है। अधिक शक्तिशाली।


+1 आपके उत्तर को परिकल्पित किए जाने वाले परिकल्पना के अर्थ में बांधने के लिए।
जोश हेमन

"नमूनों में से कौन सा" स्टोचस्टिक रूप से अधिक है "", क्या आपका मतलब है "जो नमूनों में से एक आम तौर पर दूसरे की तुलना में अधिक मूल्य लेता है"? यदि नहीं, तो क्या मतलब है? क्या आप इस बारे में थोड़ा और विस्तार से बता सकते हैं?
एरडोगन CEVHER

1
@ एर्दोगन, हाँ, हम कह सकते हैं जैसे आपने कहा। सख्त शब्दांकन यह है: वस्तुओं के एक बेतरतीब ढंग से चुनी गई जोड़ी में, प्रत्येक नमूने में से एक, "स्टोचैस्टिक रूप से अधिक प्रभावी" नमूना से वस्तु संभावना के साथ दूसरे नमूने से वस्तु की तुलना में अधिक (मूल्य से) होगी।
tnnphns
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.