ऐसा लगता है कि जब विचरण की समरूपता की धारणा को पूरा किया गया है कि एक वेल्च समायोजित टी-परीक्षण और एक मानक टी-परीक्षण से परिणाम लगभग समान हैं। क्यों नहीं हमेशा वेल्च समायोजित टी का उपयोग करें?
ऐसा लगता है कि जब विचरण की समरूपता की धारणा को पूरा किया गया है कि एक वेल्च समायोजित टी-परीक्षण और एक मानक टी-परीक्षण से परिणाम लगभग समान हैं। क्यों नहीं हमेशा वेल्च समायोजित टी का उपयोग करें?
जवाबों:
मैं कुबिंगर, रास्च और मोडर (2009) द्वारा एक कागज़ (जर्मन में) पर आधारित अन्य दो उत्तरों का विरोध करना चाहूंगा ।
वे तर्क देते हैं, वितरण से "व्यापक" सिमुलेशन के आधार पर या तो एक टी-टेस्ट, (वैरिएशन की सामान्यता और समरूपता) द्वारा लगाए गए अनुमानों को पूरा करने या न पूरा करने पर आधारित है कि मान्यताओं का परीक्षण समान रूप से अच्छी तरह से करता है जब मान्यताएं पूरी होती हैं (यानी, मूल रूप से समान अल्फा और बीटा त्रुटियों को करने की संभावना) लेकिन टी-परीक्षण को बेहतर बनाता है यदि धारणाएं पूरी नहीं होती हैं, खासकर शक्ति के संदर्भ में। इसलिए, वे हमेशा वेल्च-परीक्षण का उपयोग करने की सलाह देते हैं यदि नमूना का आकार 30 से अधिक हो।
एक मेटा-टिप्पणी के रूप में: आंकड़ों में रुचि रखने वाले लोगों (जैसे कि मेरे और शायद यहां अन्य सबसे) के आंकड़ों के आधार पर एक तर्क (जैसा कि मेरा) कम से कम सैद्धांतिक आधारों (यहां अन्य के रूप में) के आधार पर तर्क के रूप में समान रूप से गिना जाना चाहिए।
अद्यतन:
इस विषय पर फिर से विचार करने के बाद, मुझे दो और सिफारिशें मिलीं, जिनमें से नया मेरी बात को मानता है। इन सिफारिशों को आगे बढ़ाने वाले तर्कों के लिए मूल कागजात (जो दोनों, कम से कम मेरे लिए, स्वतंत्र रूप से उपलब्ध हैं) को देखें।
पहली सिफारिश 2006 में ग्रीम डी। रूक्सटन से आई है: " यदि आप असंबंधित डेटा के नमूनों के आधार पर 2 आबादी की केंद्रीय प्रवृत्ति की तुलना करना चाहते हैं, तो असमान विचरण टी-टेस्ट का उपयोग हमेशा छात्र के टी-टेस्ट के लिए किया जाना चाहिए। या मान-व्हिटनी यू परीक्षण। "
इन:
रुक्सटन, जीडी, 2006। असमान विचरण टी-परीक्षण छात्र के टी-परीक्षण और मान-व्हिटनी यू परीक्षण के लिए एक अप्रयुक्त विकल्प है ।
बिहेव। इकोल । 17, 688–690।
दूसरी (पुरानी) सिफारिश Coombs एट अल से है। (1996, पी। 148): " संक्षेप में, स्वतंत्र नमूने टी परीक्षण आमतौर पर टाइप I त्रुटि दरों को नियंत्रित करने के संदर्भ में स्वीकार्य है, बशर्ते कि समान जनसंख्या के समान आकार के नमूने पर्याप्त हों, तब भी जब समान जनसंख्या भिन्नता धारणा का उल्लंघन किया गया हो। असमान के लिए । -संयोजित नमूने, हालांकि, एक विकल्प जो समान जनसंख्या भिन्नताओं को नहीं मानता है, वह बेहतर है। जब वितरण या तो शॉर्ट-टेल्ड सममित या सामान्य होते हैं, तो जेम्स सेकंड-ऑर्डर टेस्ट का उपयोग करें। बढ़ते विकल्पों में विलकॉक्स एच और यंग ट्रिम किए गए साधन शामिल हैं, जो परीक्षण प्रदान करते हैं। टाइप I त्रुटि दरों का व्यापक नियंत्रण वेल्च परीक्षण या जेम्स परीक्षण की तुलना में अधिक है और डेटा की लंबी-पूंछ होने पर अधिक शक्ति होती है। " (जोर दिया)
में:
Coombs WT, Algina J, Oltman D. 1996. Univariate और multivariate omnibus परिकल्पना परीक्षण प्रकार I त्रुटि दरों को नियंत्रित करने के लिए चयनित किया जाता है जब जनसंख्या भिन्नताएं आवश्यक नहीं के बराबर होती हैं । Rev Educ Res 66: 137–79।
बेशक, कोई भी दोनों परीक्षणों को खोद सकता है, और बायेसियन टी-टेस्ट (सेवेज-डिक्की अनुपात परीक्षण) का उपयोग करना शुरू कर सकता है, जो असमान और असमान रूपांतरों के लिए जिम्मेदार हो सकता है, और सबसे अच्छा, यह इसके पक्ष में साक्ष्य की मात्रा का ठहराव करने की अनुमति देता है अशक्त परिकल्पना (जिसका अर्थ है, पुरानी "असफलता को अस्वीकार करने" की बात नहीं)
यह परीक्षण लागू करने के लिए बहुत सरल (और तेज़) है, और एक पेपर है जो बेयसियन आंकड़ों से अपरिचित पाठकों को स्पष्ट रूप से समझाता है कि आर स्क्रिप्ट के साथ इसका उपयोग कैसे किया जाए। आप मूल रूप से अपने डेटा को R कंसोल में कमांड भेज सकते हैं:
उदाहरण के डेटा के साथ इस सब के लिए एक ट्यूटोरियल भी है:
http://www.ruudwetzels.com/index.php?src=SDtest
मुझे पता है कि यह एक सीधी प्रतिक्रिया नहीं है जो पूछा गया था, लेकिन मैंने सोचा कि पाठकों को यह अच्छा विकल्प होने का आनंद मिल सकता है
चियर्स
क्योंकि सटीक परिणाम सन्निकटन के लिए बेहतर होते हैं, और विषम धार वाले मामलों से बचते हैं जहाँ सन्निकटन सटीक विधि की तुलना में भिन्न परिणाम को जन्म दे सकता है।
वेल्च विधि किसी भी पुराने टी-टेस्ट को करने का एक तेज़ तरीका नहीं है, यह एक अन्यथा बहुत कठिन समस्या के लिए एक ट्रैक्टेबल सन्निकटन है: असमान भिन्नताओं के तहत टी-टेस्ट का निर्माण कैसे करें। समान-भिन्नता का मामला अच्छी तरह से समझा जाता है, सरल और सटीक है, और इसलिए जब भी संभव हो इसका हमेशा उपयोग किया जाना चाहिए।
दो कारण जो मैं सोच सकता हूं:
अगर नमूना आकार समान हो तो नियमित छात्र का टी हेटेरोसिस्टैस्टिक होने के लिए बहुत मजबूत है।
यदि आप दृढ़ता से एक प्राथमिकता मानते हैं कि डेटा होमोसिस्टैस्टिक है, तो आप कुछ भी नहीं खोते हैं और वेल्च के टी के बजाय Studen'ts T का उपयोग करके थोड़ी मात्रा में शक्ति प्राप्त कर सकते हैं।
एक कारण जो मैं नहीं दूंगा वह यह है कि स्टूडेंट का टी सटीक है और वेल्च का टी नहीं है। IMHO छात्र टी की शुद्धता है क्योंकि यह केवल सामान्य रूप से वितरित डेटा के लिए सटीक है, और कोई वास्तविक डेटा है शैक्षिक है वास्तव में सामान्य रूप से वितरित। मैं एक भी मात्रा के बारे में नहीं सोच सकता हूं जो लोग वास्तव में सांख्यिकीय रूप से मापते हैं और विश्लेषण करते हैं जहां वितरण में सभी वास्तविक संख्याओं का समर्थन हो सकता है। उदाहरण के लिए, ब्रह्मांड में केवल बहुत सारे परमाणु हैं, और कुछ मात्रा नकारात्मक नहीं हो सकती हैं। इसलिए, जब आप वास्तविक डेटा पर किसी भी प्रकार के टी-टेस्ट का उपयोग करते हैं, तो आप किसी भी तरह एक अनुमान लगा रहे हैं।
तथ्य यह है कि कुछ अधिक जटिल कुछ कम से कम जटिल हो जाता है जब कुछ धारणा की जाँच की जाती है तो सरल विधि को फेंकने के लिए पर्याप्त नहीं है।
मैं यहाँ विपरीत दृश्य ले जाऊँगा। वेल्च परीक्षण से परेशान क्यों है जब मानक अप्रभावित छात्र टी परीक्षण आपको लगभग समान परिणाम देता है। मैंने थोड़ी देर पहले इस मुद्दे का अध्ययन किया और मैंने टी परीक्षण को तोड़ने और वेल्च परीक्षण के पक्ष में परिदृश्यों की एक श्रृंखला की खोज की। ऐसा करने के लिए मैंने एक समूह बनाम दूसरे के लिए 5 गुना तक नमूना आकार का उपयोग किया। और, मैंने एक समूह बनाम दूसरे के लिए 25 गुना अधिक तक भिन्नताओं की खोज की। और, वास्तव में इससे कोई फर्क नहीं पड़ा। अप्रकाशित टी परीक्षण ने अभी भी पी मानों की एक श्रृंखला उत्पन्न की जो वेल्च परीक्षण के लगभग समान थे।
आप नीचे दिए गए लिंक पर मेरा काम देख सकते हैं और विशेष रूप से स्लाइड 5 और 6 पर ध्यान केंद्रित कर सकते हैं।
यह सच है कि वेल्च सही परीक्षण के लगातार गुणधर्म साधारण विद्यार्थी के टी से बेहतर हैं, कम से कम त्रुटियों के लिए। मैं इस बात से सहमत हूं कि अकेले ही वेल्च टेस्ट के लिए बहुत अच्छा तर्क है। हालांकि, मैं आमतौर पर वेल्च सुधार की सिफारिश करने के लिए अनिच्छुक हूं क्योंकि इसका उपयोग अक्सर भ्रामक होता है। जो कि, वास्तव में स्वयं परीक्षण की आलोचना नहीं है।
वेल्च सुधार की सिफारिश नहीं करने का कारण यह है कि यह केवल स्वतंत्रता की डिग्री और उसके बाद के सैद्धांतिक वितरण से नहीं बदलता है, जिसमें से पी-वैल्यू तैयार किया गया है। यह परीक्षण को गैर-पैरामीट्रिक बनाता है। एक वेल्च सही किए गए टी-टेस्ट को करने के लिए एक अभी भी पूल वेरिएंट है जैसे कि समान विचरण को माना जा सकता है, लेकिन फिर अंतिम परीक्षण प्रक्रिया को बदलकर या तो यह माना जाता है कि समान विचरण को ग्रहण नहीं किया जा सकता है, या यह कि आप केवल सैंपल वेरिएंस की परवाह करते हैं। यह इसे एक गैर-पैरामीट्रिक परीक्षण बनाता है क्योंकि जमा किए गए विचरण को जनसंख्या का गैर-प्रतिनिधि माना जाता है और आपने स्वीकार किया कि आप अपने देखे हुए मूल्यों का परीक्षण कर रहे हैं।
में ही उस के साथ विशेष रूप से गलत कुछ भी नहीं है। हालाँकि, मुझे यह भ्रामक लगता है क्योंकि a) आमतौर पर यह पर्याप्त विशिष्टता के साथ रिपोर्ट नहीं किया गया है; और b) जो लोग इसका उपयोग करते हैं वे एक टी-टेस्ट के साथ इसके बारे में सोचने लगते हैं। एकमात्र तरीका जो मुझे कभी पता है कि यह प्रकाशित पत्रों में किया गया है, जब मुझे टी-वितरण के लिए एक विषम डीएफ दिखाई देता है। यह भी एकमात्र तरीका था रेक्सटन (हेनरिक जवाब में संदर्भित) समीक्षा में बता सकता है। दुर्भाग्य से, वेल्च सही परीक्षण के गैर-पैरामीट्रिक प्रकृति में होता है कि क्या स्वतंत्रता की डिग्री बदल गई है या नहीं (यानी भले ही नमूना संस्करण समान हों)। लेकिन यह रिपोर्टिंग मुद्दा इस तथ्य का लक्षण है कि अधिकांश लोग जो वेल्च सुधार का उपयोग करते हैं, वे इस बदलाव को पहचान नहीं पाते हैं कि यह परीक्षण हुआ है।
इसलिए, इस वजह से, मेरा मानना है कि यदि आप एक गैर-पैरामीट्रिक परीक्षण की सिफारिश करने जा रहे हैं, तो एक का उपयोग न करें जो अक्सर पैरामीट्रिक दिखाई देता है या कम से कम आप जो कर रहे हैं उसके बारे में बहुत स्पष्ट हो। परीक्षण का आधिकारिक नाम गैर-पैरामीट्रिक वेल्ड सही टी-परीक्षण होना चाहिए। अगर लोगों ने इस तरह से सूचना दी कि मैं हेनरिक की सिफारिश से बहुत खुश हूँ।