जब एक टी-टेस्ट आयोजित किया जाता है, तो कोई हमेशा df के वेल्च सन्निकटन का उपयोग करने के बजाय समान भिन्नताओं को क्यों मान सकता है (या परीक्षण करना)?


47

ऐसा लगता है कि जब विचरण की समरूपता की धारणा को पूरा किया गया है कि एक वेल्च समायोजित टी-परीक्षण और एक मानक टी-परीक्षण से परिणाम लगभग समान हैं। क्यों नहीं हमेशा वेल्च समायोजित टी का उपयोग करें?

जवाबों:


33

मैं कुबिंगर, रास्च और मोडर (2009) द्वारा एक कागज़ (जर्मन में) पर आधारित अन्य दो उत्तरों का विरोध करना चाहूंगा ।

वे तर्क देते हैं, वितरण से "व्यापक" सिमुलेशन के आधार पर या तो एक टी-टेस्ट, (वैरिएशन की सामान्यता और समरूपता) द्वारा लगाए गए अनुमानों को पूरा करने या न पूरा करने पर आधारित है कि मान्यताओं का परीक्षण समान रूप से अच्छी तरह से करता है जब मान्यताएं पूरी होती हैं (यानी, मूल रूप से समान अल्फा और बीटा त्रुटियों को करने की संभावना) लेकिन टी-परीक्षण को बेहतर बनाता है यदि धारणाएं पूरी नहीं होती हैं, खासकर शक्ति के संदर्भ में। इसलिए, वे हमेशा वेल्च-परीक्षण का उपयोग करने की सलाह देते हैं यदि नमूना का आकार 30 से अधिक हो।

एक मेटा-टिप्पणी के रूप में: आंकड़ों में रुचि रखने वाले लोगों (जैसे कि मेरे और शायद यहां अन्य सबसे) के आंकड़ों के आधार पर एक तर्क (जैसा कि मेरा) कम से कम सैद्धांतिक आधारों (यहां अन्य के रूप में) के आधार पर तर्क के रूप में समान रूप से गिना जाना चाहिए।


अद्यतन:
इस विषय पर फिर से विचार करने के बाद, मुझे दो और सिफारिशें मिलीं, जिनमें से नया मेरी बात को मानता है। इन सिफारिशों को आगे बढ़ाने वाले तर्कों के लिए मूल कागजात (जो दोनों, कम से कम मेरे लिए, स्वतंत्र रूप से उपलब्ध हैं) को देखें।

पहली सिफारिश 2006 में ग्रीम डी। रूक्सटन से आई है: " यदि आप असंबंधित डेटा के नमूनों के आधार पर 2 आबादी की केंद्रीय प्रवृत्ति की तुलना करना चाहते हैं, तो असमान विचरण टी-टेस्ट का उपयोग हमेशा छात्र के टी-टेस्ट के लिए किया जाना चाहिए। या मान-व्हिटनी यू परीक्षण। "
इन:
रुक्सटन, जीडी, 2006। असमान विचरण टी-परीक्षण छात्र के टी-परीक्षण और मान-व्हिटनी यू परीक्षण के लिए एक अप्रयुक्त विकल्प हैबिहेव। इकोल । 17, 688–690।

दूसरी (पुरानी) सिफारिश Coombs एट अल से है। (1996, पी। 148): " संक्षेप में, स्वतंत्र नमूने टी परीक्षण आमतौर पर टाइप I त्रुटि दरों को नियंत्रित करने के संदर्भ में स्वीकार्य है, बशर्ते कि समान जनसंख्या के समान आकार के नमूने पर्याप्त हों, तब भी जब समान जनसंख्या भिन्नता धारणा का उल्लंघन किया गया हो। असमान के लिए -संयोजित नमूने, हालांकि, एक विकल्प जो समान जनसंख्या भिन्नताओं को नहीं मानता है, वह बेहतर है। जब वितरण या तो शॉर्ट-टेल्ड सममित या सामान्य होते हैं, तो जेम्स सेकंड-ऑर्डर टेस्ट का उपयोग करें। बढ़ते विकल्पों में विलकॉक्स एच और यंग ट्रिम किए गए साधन शामिल हैं, जो परीक्षण प्रदान करते हैं। टाइप I त्रुटि दरों का व्यापक नियंत्रण वेल्च परीक्षण या जेम्स परीक्षण की तुलना में अधिक है और डेटा की लंबी-पूंछ होने पर अधिक शक्ति होती है। " (जोर दिया)
में:
Coombs WT, Algina J, Oltman D. 1996. Univariate और multivariate omnibus परिकल्पना परीक्षण प्रकार I त्रुटि दरों को नियंत्रित करने के लिए चयनित किया जाता है जब जनसंख्या भिन्नताएं आवश्यक नहीं के बराबर होती हैंRev Educ Res 66: 137–79।


3
मेटा-प्रतिक्रिया: अच्छी बात है। लेकिन आपका डेटा मेरा जैसा व्यवहार नहीं कर सकता है! :-)
whuber

हेनरिक, क्या आप बुरा मानेंगे यदि मैं इसका उत्तर संपादित करता हूं: (1) परीक्षणों को कॉल करके शब्दावली को बदल दें छात्र का टी-टेस्ट और वेल्च का टी-टेस्ट (जैसा कि मैंने सबसे अधिक साहित्य में पाया है); (2) एक और पेपर शामिल करें जो इसे चर्चा में सुझाता है: rips-irsp.com/article/10.5334/irsp.82 (यह पूर्वाग्रह पर जोर देता है कि जब आप लेवेने के समरूपता के परीक्षण के आधार पर परीक्षण लेते हैं तो यह होता है)।
ब्रूनो

13

बेशक, कोई भी दोनों परीक्षणों को खोद सकता है, और बायेसियन टी-टेस्ट (सेवेज-डिक्की अनुपात परीक्षण) का उपयोग करना शुरू कर सकता है, जो असमान और असमान रूपांतरों के लिए जिम्मेदार हो सकता है, और सबसे अच्छा, यह इसके पक्ष में साक्ष्य की मात्रा का ठहराव करने की अनुमति देता है अशक्त परिकल्पना (जिसका अर्थ है, पुरानी "असफलता को अस्वीकार करने" की बात नहीं)

यह परीक्षण लागू करने के लिए बहुत सरल (और तेज़) है, और एक पेपर है जो बेयसियन आंकड़ों से अपरिचित पाठकों को स्पष्ट रूप से समझाता है कि आर स्क्रिप्ट के साथ इसका उपयोग कैसे किया जाए। आप मूल रूप से अपने डेटा को R कंसोल में कमांड भेज सकते हैं:

वेटज़ेल्स, आर।, रायजमेकर्स, जेडजीडब्ल्यू, जैकब, ई।, और वेगेनमेकर्स, ई.जे. (2009)। नल की परिकल्पना के खिलाफ और उसके लिए समर्थन को कैसे निर्धारित किया जाए: एक डिफ़ॉल्ट बायेसियन टी-टेस्ट का एक लचीला WinBUGS कार्यान्वयन।

उदाहरण के डेटा के साथ इस सब के लिए एक ट्यूटोरियल भी है:

http://www.ruudwetzels.com/index.php?src=SDtest

मुझे पता है कि यह एक सीधी प्रतिक्रिया नहीं है जो पूछा गया था, लेकिन मैंने सोचा कि पाठकों को यह अच्छा विकल्प होने का आनंद मिल सकता है

चियर्स


8
हमेशा इन बायेसियन लोग ...
हेनरिक

3
टी-टेस्ट के लिए एक और बायेसियन विकल्प क्रुस्के का BEST (बायेसियन अनुमान टी टेस्ट को नियमित करता है) रूटीन है। अधिक यहाँ जानकारी: indiana.edu/~kruschke/BEST । यहाँ एक ऑनलाइन संस्करण: sumsar.net/best_online
रासमस बैस्ट

7

क्योंकि सटीक परिणाम सन्निकटन के लिए बेहतर होते हैं, और विषम धार वाले मामलों से बचते हैं जहाँ सन्निकटन सटीक विधि की तुलना में भिन्न परिणाम को जन्म दे सकता है।

वेल्च विधि किसी भी पुराने टी-टेस्ट को करने का एक तेज़ तरीका नहीं है, यह एक अन्यथा बहुत कठिन समस्या के लिए एक ट्रैक्टेबल सन्निकटन है: असमान भिन्नताओं के तहत टी-टेस्ट का निर्माण कैसे करें। समान-भिन्नता का मामला अच्छी तरह से समझा जाता है, सरल और सटीक है, और इसलिए जब भी संभव हो इसका हमेशा उपयोग किया जाना चाहिए।


6
मुझे लगता है कि मैं जॉन टुके के साथ अधिक सहमत हूं - " सही सवाल का लगभग बेहतर उत्तर, जो अक्सर अस्पष्ट होता है, गलत प्रश्न के सटीक उत्तर की तुलना में, जिसे हमेशा सटीक बनाया जा सकता है। "
ग्लेन_ब

4
समान-विचरण (स्टूडेंट) टी-टेस्ट अपने आप में (अ-समझ में आने वाला) सन्निकटन है जब जनसंख्या का नमूना संस्करण असमान है। इसलिए, जब तक यह ज्ञात नहीं है कि जनसंख्या संस्करण समान हैं, एक पूर्णतया सटीक वितरण का उपयोग करने के लिए सही नमूना वितरण (वेल्च-स्टरथाइट) के लिए एक सन्निकटन का उपयोग करना बेहतर होता है जो डेटा मॉडल पर लागू नहीं होता है।
whuber

4

दो कारण जो मैं सोच सकता हूं:

  1. अगर नमूना आकार समान हो तो नियमित छात्र का टी हेटेरोसिस्टैस्टिक होने के लिए बहुत मजबूत है।

  2. यदि आप दृढ़ता से एक प्राथमिकता मानते हैं कि डेटा होमोसिस्टैस्टिक है, तो आप कुछ भी नहीं खोते हैं और वेल्च के टी के बजाय Studen'ts T का उपयोग करके थोड़ी मात्रा में शक्ति प्राप्त कर सकते हैं।

एक कारण जो मैं नहीं दूंगा वह यह है कि स्टूडेंट का टी सटीक है और वेल्च का टी नहीं है। IMHO छात्र टी की शुद्धता है क्योंकि यह केवल सामान्य रूप से वितरित डेटा के लिए सटीक है, और कोई वास्तविक डेटा है शैक्षिक है वास्तव में सामान्य रूप से वितरित। मैं एक भी मात्रा के बारे में नहीं सोच सकता हूं जो लोग वास्तव में सांख्यिकीय रूप से मापते हैं और विश्लेषण करते हैं जहां वितरण में सभी वास्तविक संख्याओं का समर्थन हो सकता है। उदाहरण के लिए, ब्रह्मांड में केवल बहुत सारे परमाणु हैं, और कुछ मात्रा नकारात्मक नहीं हो सकती हैं। इसलिए, जब आप वास्तविक डेटा पर किसी भी प्रकार के टी-टेस्ट का उपयोग करते हैं, तो आप किसी भी तरह एक अनुमान लगा रहे हैं।


2
(1) गलत है जब अंतर्निहित जनसंख्या संस्करण बहुत भिन्न होते हैं। एक चरम मामले के रूप में - यह देखने के लिए कि ऐसा क्यों है - विचार करें कि क्या होता है जब एक आबादी का कोई विचरण नहीं होता है। स्टूडेंट टी वास्तव में अन्य जनसंख्या के डेटा की तुलना निरंतरता से कर रहा होगा, लेकिन उसे लगता है कि यह स्वतंत्रता के कई गुना अधिक होगा। यह जो त्रुटि करता है वह सिर्फ एक Z परीक्षण का उपयोग करने के लिए तुलनीय होगा।
व्हिबर

हालांकि यह सच है @ शुभंकर यह केवल बहुत ही चरम मामलों के लिए है। मैं सिर्फ 1e6: 1 विचरण अंतर और p looking .053 देख रहा था। तो यह हो सकता है, लेकिन मैं अभी भी तर्क करूंगा कि यह एन के बराबर मजबूत है।
जॉन

@ जॉन 1e6: 1 विचरण अनुपात बहुत बड़ा है , चाहे जो भी होnमैं

@ शुभंकर, मैं केवल सुझाव दे रहा हूं कि जब आपकी टिप्पणी तकनीकी रूप से सही है, तो वेल्च सुधार उस समस्या का समाधान नहीं है जिसे आप एक उदाहरण के रूप में लेते हैं और यह अल्फा दरों के संदर्भ में परीक्षण की मजबूती के लिए बहुत महत्वपूर्ण नहीं है। (जो है (1) आम तौर पर मतलब है)। जैसा कि आप सुझाव देते हैं, जब (चरम) असमान विचरण एक समस्या है जिसे आपको अन्य समस्याएं मिली हैं, लेकिन यह वास्तव में एक अलग विषय है।
जॉन

3

तथ्य यह है कि कुछ अधिक जटिल कुछ कम से कम जटिल हो जाता है जब कुछ धारणा की जाँच की जाती है तो सरल विधि को फेंकने के लिए पर्याप्त नहीं है।


4
खासकर जहां छात्रों का संबंध है।
मैट पार्कर

2

मैं यहाँ विपरीत दृश्य ले जाऊँगा। वेल्च परीक्षण से परेशान क्यों है जब मानक अप्रभावित छात्र टी परीक्षण आपको लगभग समान परिणाम देता है। मैंने थोड़ी देर पहले इस मुद्दे का अध्ययन किया और मैंने टी परीक्षण को तोड़ने और वेल्च परीक्षण के पक्ष में परिदृश्यों की एक श्रृंखला की खोज की। ऐसा करने के लिए मैंने एक समूह बनाम दूसरे के लिए 5 गुना तक नमूना आकार का उपयोग किया। और, मैंने एक समूह बनाम दूसरे के लिए 25 गुना अधिक तक भिन्नताओं की खोज की। और, वास्तव में इससे कोई फर्क नहीं पड़ा। अप्रकाशित टी परीक्षण ने अभी भी पी मानों की एक श्रृंखला उत्पन्न की जो वेल्च परीक्षण के लगभग समान थे।

आप नीचे दिए गए लिंक पर मेरा काम देख सकते हैं और विशेष रूप से स्लाइड 5 और 6 पर ध्यान केंद्रित कर सकते हैं।

http://www.slideshare.net/gaetanlion/unpaired-t-test-family


मुझे क्षमा करें, आप बड़े नमूना फॉर्मूला और छोटे नमूने फॉर्मूला के बीच क्या अंतर कर रहे हैं? क्या आप जनसंख्या के विचरण के नमूने के अनुमान का उपयोग करने के बजाय बड़े नमूनों में जनसंख्या सूत्र का उपयोग कर भिन्नताओं की गणना कर रहे हैं?
रसेलपीयरेसे

अप्रभावित छात्र टी परीक्षण के दो सूत्र हैं। 30 से अधिक अवलोकनों के साथ नमूनों के लिए बड़ा नमूना फार्मूला लागू किया जाता है। 30 से कम अवलोकनों वाले नमूनों पर लघु नमूना फार्मूला लागू किया जाता है। उन फ़ार्मुलों में मुख्य अंतर यह है कि वे पूल किए गए मानक त्रुटि की गणना कैसे करते हैं। छोटा नमूना फॉर्मूला बहुत अधिक जटिल और उल्टा है। और, वास्तव में यह वास्तव में बहुत कम अंतर रखता है। मैंने कई बार परीक्षण किया है। इसलिए मुझे लगता है कि ज्यादातर लोग इस भेद को भूल गए हैं। और, वे ज्यादातर समय बड़े नमूना फार्मूले का उपयोग करते हैं।
सायम्पा

0

यह सच है कि वेल्च सही परीक्षण के लगातार गुणधर्म साधारण विद्यार्थी के टी से बेहतर हैं, कम से कम त्रुटियों के लिए। मैं इस बात से सहमत हूं कि अकेले ही वेल्च टेस्ट के लिए बहुत अच्छा तर्क है। हालांकि, मैं आमतौर पर वेल्च सुधार की सिफारिश करने के लिए अनिच्छुक हूं क्योंकि इसका उपयोग अक्सर भ्रामक होता है। जो कि, वास्तव में स्वयं परीक्षण की आलोचना नहीं है।

वेल्च सुधार की सिफारिश नहीं करने का कारण यह है कि यह केवल स्वतंत्रता की डिग्री और उसके बाद के सैद्धांतिक वितरण से नहीं बदलता है, जिसमें से पी-वैल्यू तैयार किया गया है। यह परीक्षण को गैर-पैरामीट्रिक बनाता है। एक वेल्च सही किए गए टी-टेस्ट को करने के लिए एक अभी भी पूल वेरिएंट है जैसे कि समान विचरण को माना जा सकता है, लेकिन फिर अंतिम परीक्षण प्रक्रिया को बदलकर या तो यह माना जाता है कि समान विचरण को ग्रहण नहीं किया जा सकता है, या यह कि आप केवल सैंपल वेरिएंस की परवाह करते हैं। यह इसे एक गैर-पैरामीट्रिक परीक्षण बनाता है क्योंकि जमा किए गए विचरण को जनसंख्या का गैर-प्रतिनिधि माना जाता है और आपने स्वीकार किया कि आप अपने देखे हुए मूल्यों का परीक्षण कर रहे हैं।

में ही उस के साथ विशेष रूप से गलत कुछ भी नहीं है। हालाँकि, मुझे यह भ्रामक लगता है क्योंकि a) आमतौर पर यह पर्याप्त विशिष्टता के साथ रिपोर्ट नहीं किया गया है; और b) जो लोग इसका उपयोग करते हैं वे एक टी-टेस्ट के साथ इसके बारे में सोचने लगते हैं। एकमात्र तरीका जो मुझे कभी पता है कि यह प्रकाशित पत्रों में किया गया है, जब मुझे टी-वितरण के लिए एक विषम डीएफ दिखाई देता है। यह भी एकमात्र तरीका था रेक्सटन (हेनरिक जवाब में संदर्भित) समीक्षा में बता सकता है। दुर्भाग्य से, वेल्च सही परीक्षण के गैर-पैरामीट्रिक प्रकृति में होता है कि क्या स्वतंत्रता की डिग्री बदल गई है या नहीं (यानी भले ही नमूना संस्करण समान हों)। लेकिन यह रिपोर्टिंग मुद्दा इस तथ्य का लक्षण है कि अधिकांश लोग जो वेल्च सुधार का उपयोग करते हैं, वे इस बदलाव को पहचान नहीं पाते हैं कि यह परीक्षण हुआ है।

इसलिए, इस वजह से, मेरा मानना ​​है कि यदि आप एक गैर-पैरामीट्रिक परीक्षण की सिफारिश करने जा रहे हैं, तो एक का उपयोग न करें जो अक्सर पैरामीट्रिक दिखाई देता है या कम से कम आप जो कर रहे हैं उसके बारे में बहुत स्पष्ट हो। परीक्षण का आधिकारिक नाम गैर-पैरामीट्रिक वेल्ड सही टी-परीक्षण होना चाहिए। अगर लोगों ने इस तरह से सूचना दी कि मैं हेनरिक की सिफारिश से बहुत खुश हूँ।


मुझे आपके जवाब में कोई समर्थन नहीं मिला कि वेल्च परीक्षा "भ्रामक" क्यों हो सकती है। क्या आप इसके लिए आधार बता सकते हैं?
whuber

शायद मेरे संपादन ने चीजों को स्पष्ट किया है। मुझे स्पष्ट होना चाहिए था कि यह भ्रामक होने की गारंटी नहीं है, लेकिन अक्सर परीक्षण के परिणाम के परीक्षण के उपयोगकर्ता और पाठक दोनों के लिए है।
जॉन

1
धन्यवाद। रिपोर्टिंग मुद्दे के अलावा - जो कि परीक्षण की गलती के रूप में चिह्नित करना अनुचित होगा! - यह आपके हिस्से पर किसी प्रकार की आपत्ति के लिए नीचे आता है कि वेल्च परीक्षण गैर पैरामीट्रिक है। संभवतः इससे क्या बात हो सकती है? Ceteris paribus , जिसे एक लाभ माना जाता है, एक समस्या नहीं।
व्हिबर

1
यह एक ऐसा अंतर है जिसे आमतौर पर स्पष्ट नहीं किया जाता है। मैं इस उत्तर में स्वीकार करता हूं कि यह अपने आप में एक समस्या नहीं है, लेकिन अधिकांश लोग इसका व्यवहार करते हैं, जो एक त्रुटि है। मुझे नहीं लगता कि यहां गैर-पैरामीट्रिक परीक्षण के लाभों या लागतों के बारे में चर्चा करने की जगह है। इसके अलावा, यह धागे में उल्लेख नहीं किया गया था और यह कई लोगों के लिए एक मुद्दा हो सकता है। एक तरफ, हमारे इंट्रो स्टैटिस्टिक्स क्लास में से दो इसे स्टूडेंट टी-टेस्ट के साथ समानांतर में पढ़ाते हैं, और इसे बढ़ावा देते हैं, लेकिन गैर-पैरामीट्रिक परीक्षणों पर एक अलग अनुभाग है।
जॉन

क्या आप यह स्पष्ट कर सकते हैं कि "टेस्ट नॉनपेर्मेट्रिक बनाने" से आपका क्या मतलब है?
ग्लेन_ बी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.