असमान परिवर्तन के साथ टी परीक्षण में स्वतंत्रता के गैर-पूर्णांक डिग्री के लिए स्पष्टीकरण


15

एसपीएसएस टी-टेस्ट प्रक्रिया 2 स्वतंत्र साधनों की तुलना करते समय 2 विश्लेषणों की रिपोर्ट करती है, एक समान रूपांतरों के साथ एक विश्लेषण मान लिया गया है और एक समान रूपांतरों के साथ विश्लेषण नहीं किया गया है। स्वतंत्रता की डिग्री (df) जब समान भिन्नताओं को मान लिया जाता है तो हमेशा पूर्णांक मान (और बराबर n-2) होते हैं। Df जब समान रूपांतरों को ग्रहण नहीं किया जाता है तो गैर-पूर्णांक (जैसे, 11.467) और कहीं-कहीं n-2 नहीं होते हैं। मैं इन गैर-पूर्णांक डीएफ की गणना करने के लिए उपयोग किए जाने वाले तर्क और विधि का स्पष्टीकरण मांग रहा हूं।


3
यूनिवर्सिटी ऑफ़ फ्लोरिडा पॉवरपॉइंट प्रेजेंटेशन में इस बात का अच्छा खासा विवरण है कि स्टूडेंट टी स्टेटिस्टिक के सैंपलिंग डिस्ट्रीब्यूशन के लिए यह अनुमान कैसे असमान परिवर्तन के मामले के लिए लिया गया है।
whuber

क्या वेल्च का टी-टेस्ट हमेशा अधिक सटीक होता है? क्या वेल्च दृष्टिकोण का उपयोग करने के लिए एक नकारात्मक पहलू है?
जोएल डब्ल्यू।

यदि वेल्च और मूल टी-टेस्ट उपज नाटकीय रूप से अलग-अलग पी है, जिसे मुझे जाना चाहिए? क्या होगा यदि विभेदों में अंतर के लिए p मान केवल .06 है, लेकिन दो परीक्षणों के p वाल्वों में अंतर 1000 और .121 हैं। (यह तब हुआ जब 2 के एक समूह में कोई विचरण नहीं था और 25 के दूसरे समूह में 70,000 का विचरण था।)
जोएल डब्ल्यू।

2
मान के आधार पर उनके बीच चयन न करें । जब तक आपके पास समान कारण मानने के लिए आपके पास (डेटा देखने से पहले भी) अच्छा कारण नहीं है, बस उस धारणा को मत बनाइए। p
Glen_b -Reinstate Monica

1
सभी प्रश्न वेल्च टेस्ट का उपयोग कब करना है से संबंधित हैं। इस सवाल को आँकड़े.स्टैकएक्सचेंज
.

जवाबों:


11

वेल्च- Satterthwaite df को तराजू के मानक विचलन के अनुपात में वजन के साथ स्वतंत्रता के दो डिग्री के एक कम वजन वाले हार्मोनिक मतलब के रूप में दिखाया जा सकता है।

मूल अभिव्यक्ति पढ़ता है:

νW=(s12n1+s22n2)2s14n12ν1+s24n22ν2

ध्यान दें कि , i वें नमूना माध्य का अनुमानित रूपांतर या माध्य के i -th मानक त्रुटि का वर्ग है । चलो आर = आर 1 / आर 2 (नमूना साधन की अनुमानित प्रसरण के अनुपात), इसलिएri=si2/niithir=r1/r2

νW=(r1+r2)2r12ν1+r22ν2=(r1+r2)2r12+r22r12+r22r12ν1+r22ν2=(r+1)2r2+1r12+r22r12ν1+r22ν2

पहला कारक , जो 1 से r = 0 से 2 तक r = 1 से बढ़ता है और फिर r = पर 1 तक घट जाता है ; यह लॉग आर में सममित है ।1+sech(log(r))1r=02r=11r=logr

दूसरा कारक एक भारित हार्मोनिक माध्य है :

H(x_)=i=1nwii=1nwixi.

wi=ri2

r1/r2ν1r1/r20ν2r1=r2s12=s22νW

-

एक समान-विचरण टी-परीक्षण के साथ, यदि धारणाएं धारण करती हैं, तो हर का वर्ग एक ची-वर्ग यादृच्छिक यादृच्छिक है।

वेल्च टी-टेस्ट के हर के वर्ग (एक निरंतर समय) एक ची-वर्ग नहीं है; हालाँकि, यह अक्सर बहुत खराब नहीं होता है। एक प्रासंगिक चर्चा यहां पाई जा सकती है

एक और पाठ्यपुस्तक-शैली व्युत्पत्ति यहाँ मिल सकती है


1
हार्मोनिक माध्य के बारे में महान अंतर्दृष्टि, जो औसत अनुपात के लिए अंकगणितीय माध्य से अधिक उपयुक्त है।
फेलिप जी। निवेन्स्की

10

आप जिस बात का जिक्र कर रहे हैं वह है स्वतंत्रता की डिग्री के लिए वेल्च-स्टरथवेट करेक्शनटीजब WS सुधार लागू किया जाता है, तो इसे अक्सर वेल्च कहा जाता हैटीटेस्ट । (संयोग से, इसका SPSS से कोई लेना-देना नहीं है, सभी सांख्यिकीय सॉफ़्टवेयर वेल्च का संचालन करने में सक्षम होंगेटी-सबसे पहले, वे आम तौर पर दोनों पक्षों को डिफ़ॉल्ट रूप से रिपोर्ट नहीं करते हैं, इसलिए आपको आवश्यक रूप से इस मुद्दे के बारे में सोचने के लिए प्रेरित नहीं किया जाएगा।) सुधार के लिए समीकरण बहुत बदसूरत है, लेकिन विकिपीडिया पृष्ठ पर देखा जा सकता है; जब तक आप बहुत गणित के जानकार या सज़ा के लिए ग्लूटन नहीं होते, मैं इस विचार को समझने के लिए इसके माध्यम से काम करने की कोशिश नहीं करता। हालांकि, एक ढीले वैचारिक दृष्टिकोण से, विचार अपेक्षाकृत सीधा है: नियमितटी-Test मानता है कि दो समूहों में भिन्नताएं समान हैं। यदि वे नहीं हैं, तो परीक्षण को उस धारणा से लाभ नहीं होना चाहिए। की शक्ति के बाद सेटी-टेस्ट को स्वतंत्रता के अवशिष्ट डिग्री के एक समारोह के रूप में देखा जा सकता है, इसके लिए समायोजित करने का एक तरीका यह है कि डीएफ को कुछ हद तक 'सिकोड़ें'। उपयुक्त df पूरे df और छोटे समूह के df के बीच कहीं होना चाहिए। (नीचे @Glen_b नोट्स के रूप में, यह के सापेक्ष आकार पर निर्भर करता हैरों12/n1 बनाम रों22/n2; यदि बड़ा n पर्याप्त रूप से छोटे विचरण के साथ जुड़ा हुआ है, तो संयुक्त df दो df के बड़े से कम हो सकता है।) WS सुधार df को समायोजित करने के लिए पूर्व से उत्तरार्द्ध तक रास्ते का सही अनुपात पाता है। तब परीक्षण आँकड़ा एक के खिलाफ मूल्यांकन किया जाता हैटीउस df के साथ -distribution


For one t-test, SPSS reports the df as 26.608 but the n's for the two groups are 22 and 104. Are you sure about " The appropriate df must be somewhere between the full df and the df of the larger group"? (The standard deviations are 10.5 and 8.1 for the smaller and larger groups, respectively.)
Joel W.

2
It depends on the relative sizes of s12/n1 vs s22/n2. If the larger n is associated with a sufficiently larger variance, the combined d.f. can be lower than the larger of the two d.f. Note that the Welch t-test is only approximate, since the squared denominator is not actually a (scaled) chi-square random variate. However in practice it does quite well.
Glen_b -Reinstate Monica

I think I'll expand on the relationship between the relative sizes of the (si2/ni) and the Welch d.f. in an answer (since it won't fit in a comment).
Glen_b -Reinstate Monica

1
@Glen_b, I'm sure that will be of great value here.
gung - Reinstate Monica
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.