बिना टी-टेस्ट वाली जोड़ी


20

मान लीजिए मेरे पास 20 चूहे हैं। मैं चूहों को किसी तरह से जोड़ देता हूं, ताकि मुझे 10 जोड़े मिलें। इस प्रश्न के उद्देश्य के लिए, यह एक यादृच्छिक जोड़ी हो सकती है, या यह एक समझदार जोड़ी हो सकती है, जैसे एक ही कूड़े से एक ही लिंग से चूहों को जोड़ने की कोशिश करना, समान वजन के साथ, या यह एक जानबूझकर बेवकूफ जोड़ी की तरह हो सकता है के रूप में वे संभवतः हो सकता है के रूप में असमान के साथ चूहों जोड़ी की कोशिश कर रहा। मैं तब नियंत्रण समूह के लिए प्रत्येक जोड़े में एक माउस को असाइन करने के लिए और दूसरे माउस को उपचारित समूह के लिए यादृच्छिक संख्याओं का उपयोग करता हूं। मैं अब प्रयोग करता हूं, केवल इलाज करने वाले चूहों का इलाज करता हूं, लेकिन अन्यथा जो भी व्यवस्था की जाती है उस पर कोई ध्यान नहीं देता है।

जब कोई परिणामों का विश्लेषण करने के लिए आता है, तो कोई भी अनपेक्षित टी-परीक्षण या युग्मित टी-परीक्षण का उपयोग कर सकता है। किस तरह से, यदि कोई हो, तो उत्तर अलग-अलग होंगे? (मैं मूल रूप से किसी भी सांख्यिकीय पैरामीटर के व्यवस्थित अंतरों में दिलचस्पी रखता हूं जिन्हें अनुमान लगाने की आवश्यकता है।)

इसका कारण यह है कि मैं हाल ही में एक पेपर से जुड़ा हुआ था जिसकी आलोचना एक जीवविज्ञानी ने एक अनियंत्रित टी-टेस्ट के बजाय एक युग्मित टी-टेस्ट का उपयोग करने के लिए की थी। बेशक, वास्तविक प्रयोग में, स्थिति उतनी चरम नहीं थी जितनी स्थिति मैंने छोड़ी है, और मेरी राय में, जोड़ी बनाने के अच्छे कारण थे। लेकिन जीवविज्ञानी सहमत नहीं थे।

यह मुझे लगता है कि यह गलत तरीके से सांख्यिकीय महत्व (पी-मूल्य में कमी) को सुधारने के लिए संभव नहीं है, जिन परिस्थितियों में मैंने स्केच किया था, एक अनपेक्षित परीक्षण के बजाय एक युग्मित टी-टेस्ट का उपयोग करके, भले ही यह जोड़ी के लिए अनुचित हो। हालांकि यह सांख्यिकीय महत्व को खराब कर सकता है यदि चूहों को बुरी तरह से जोड़ा गया था। क्या यह सही है?

जवाबों:


23

मैं उन बिंदुओं से सहमत हूं जो फ्रैंक और पीटर दोनों बनाते हैं लेकिन मुझे लगता है कि एक सरल सूत्र है जो मुद्दे के दिल तक पहुंचता है और ओपी के लिए विचार करने के लिए सार्थक हो सकता है।

बता दें कि और दो यादृच्छिक चर हैं जिनका सहसंबंध अज्ञात है।वाईएक्सY

चलोजेड=एक्स-Y

का प्रसरण क्या है ?जेड

यहाँ सरल सूत्र है: क्या होगा अगर (यानी, और सकारात्मक रूप से सहसंबद्ध हैं)?कोव ( एक्स , वाई ) > 0 एक्स वाई

वार(जेड)=वार(एक्स)+वार(Y)-2cov(एक्स,Y)
cov(एक्स,Y)>0एक्सY

तबt X i A Y i A Aवार(जेड)<वार(एक्स)+वार(Y)। इस मामले में अगर जोड़-तोड़ सकारात्मक सहसंबंध के कारण किया जाता है जैसे कि जब आप हस्तक्षेप से पहले और बाद में एक ही विषय के साथ काम कर रहे होते हैं तो युग्मित करने में मदद मिलती है क्योंकि स्वतंत्र युग्मित अंतर में असमान मामले के लिए आपको प्राप्त होने वाले विचरण की तुलना में कम विचरण होता है। विधि ने विचरण को कम कर दिया। परीक्षण अधिक शक्तिशाली है। यह नाटकीय रूप से चक्रीय डेटा के साथ दिखाया जा सकता है। मैंने एक पुस्तक में एक उदाहरण देखा, जहां वे यह देखना चाहते थे कि वाशिंगटन डीसी में तापमान न्यूयॉर्क शहर की तुलना में अधिक है या नहीं। इसलिए उन्होंने 2 साल के लिए दोनों शहरों में औसत मासिक तापमान लिया। चार सत्रों के कारण निश्चित रूप से वर्ष के दौरान एक बड़ा अंतर है। एक अंतर का पता लगाने के लिए एक अनपेक्षित टी परीक्षण के लिए यह भिन्नता बहुत बड़ी है। हालांकि एक ही वर्ष में एक ही महीने के आधार पर युग्मन इस मौसमी प्रभाव और जोड़े को समाप्त करता हैटी -est ने स्पष्ट रूप से दिखाया कि DC का औसत तापमान न्यूयॉर्क की तुलना में अधिक है। (महीने में NY पर तापमान ) और (DC में महीने में तापमान ) सकारात्मक रूप से सहसंबद्ध हैं क्योंकि NY और DC में मौसम समान हैं और शहर पर्याप्त करीब हैं कि वे अक्सर एक ही मौसम प्रणाली का अनुभव करेंगे जो कि तापमान । डीसी थोड़ा गर्म हो सकता है क्योंकि यह आगे दक्षिण में है।एक्समैंYमैं

ध्यान दें कि बड़े सहसंयोजक या सहसंबंध अधिक से अधिक विचरण में कमी है।

अब मान लें कि ऋणात्मक है।cov(एक्स,Y)

तब । अब युग्मन जोड़ी न बनने से भी बदतर होगा क्योंकि विचरण वास्तव में बढ़ जाता है!वार(जेड)>वार(एक्स)+वार(Y)

जब और असंबंधित होते हैं तो यह संभवत: कोई मायने नहीं रखता कि आप किस विधि का उपयोग करते हैं। पीटर की यादृच्छिक जोड़ी का मामला इस स्थिति की तरह है।वाईXY


3
माइकल, क्योंकि "<" और ">" का वेब पृष्ठों पर विशेष अर्थ है, आपके पाठ के बड़े स्वैथ को देखने से बचने के लिए, बस यह देखने से कि यह आवश्यक है कि आप समीकरणों में उनके लिए मार्कअप का उपयोग करें (कोड्स \ "लेफ्टिनेंट हैं] "और" \ gt "क्रमशः)। मैंने उन दो समीकरणों को चिन्हित किया जो आपके लिए इस समस्या का कारण थे। भविष्य में, कृपया पोस्ट करने के तुरंत बाद आप क्या पढ़ते हैं, यह सुनिश्चित करने के लिए कि लोग यह देख रहे हैं कि आपने क्या सोचा था कि वे देखेंगे, और फिर मार्कअप ध्यान के लिए अपनी पोस्ट को ध्वजांकित करने के लिए स्वतंत्र महसूस करें यदि मार्कअप के साथ कुछ समस्या है। TEX
whuber

@whuber धन्यवाद। मैं आम तौर पर पोस्टिंग के दौरान और बाद में जांच करता हूं क्योंकि मुझे लगता है कि मैं समीकरण को गड़बड़ कर देता हूं, खासकर जब सबस्क्रिप्ट करते हैं। यह याद करना असामान्य है और शायद इसलिए हुआ क्योंकि यह एक लंबी पोस्ट थी और मैं बस लापरवाही से कुछ और करने के लिए चला गया जिसे मैं चाहता था या करने की आवश्यकता थी। कभी-कभी एक फोन कॉल मुझे विचलित करता है और मैं जांचना भूल जाता हूं। विशेष प्रतीकों के बारे में जो पाठ को एक पोस्ट में गायब हो जाते हैं, मैंने देखा है। मुझे लगता है कि एक सरल उपाय यह सुनिश्चित करना है कि आप प्रतीक के बाद एक स्थान छोड़ दें। मुझे लगता है कि अतीत में मेरे लिए काम किया है।
माइकल आर। चेर्निक

+1, वास्तव में ऑन-पॉइंट। ध्यान दें कि यदि और Y आपके नमूने में पूरी तरह से असंबंधित हैं , Var ( Z ) = Var ( X ) + Var ( Y )एक्सYवार(जेड)=वार(एक्स)+वार(Y)
गंग - मोनिका

@MichaelChernick उस मामले के लिए जब Cov (X, Y) <0, मेरा एक प्रश्न है: यदि मेरा लक्ष्य अपने प्रयोग से E [X] -E [Y] का अनुमान लगाना है, तो EVEN THOUGH मैंने एक युग्मित अध्ययन किया, जब मैंने अपने डेटा का विश्लेषण करें, मैं अभी भी यह साबित कर सकता हूं कि मेरा प्रयोग परिणाम UNPAIRED यादृच्छिक प्रयोग का एहसास है। क्या मैं यह कर सकता हूं? क्योंकि अगर आपने वास्तव में एक अनपेक्षित यादृच्छिक प्रयोग किया है, तो आप शाब्दिक रूप से एक ही परिणाम प्राप्त कर सकते हैं। फिर मैं बस प्रत्येक समूह का औसत ले सकता हूं (युग्मन सामान को अनदेखा कर सकता हूं) और दो समूह के माध्य का अंतर ले सकता हूं। यह E [Z] का एक निष्पक्ष अनुमानक है। मेरे अनुमानक के विचरण के लिए, मैं अभी उपयोग करता हूँ ...
केविनकिम


7

जोड़ी बनाने के बजाय अंतर्निहित डेटा मॉडल को समझना शायद बेहतर है। यदि युग्मन को अनियंत्रित विषमता से निपटने के लिए किया जाता है, तो यह आमतौर पर मामला (जुड़वां अध्ययनों को छोड़कर) है कि युग्मन केवल आंशिक रूप से परिवर्तनशीलता के इस स्रोत को नियंत्रित करता है और कई प्रतिगमन बेहतर करेगा। ऐसा इसलिए है क्योंकि इस तरह के चर पर सटीक मिलान करने में सक्षम नहीं होने के कारण लगातार चर पर मिलान करने से अक्सर अवशिष्ट परिवर्तनशीलता होती है।


2
अगर हम सभी को प्रतिगमन करना चाहिए, तो डेविड कॉक्स की पुस्तक की तरह प्रायोगिक डिजाइन की किताबें क्यों जैविक प्रयोगों में बाँधने या समूह बनाने के महत्व पर जोर देती हैं? पेयरिंग डिप्रेशन में छिपी रैखिक निर्भरता की छिपी हुई धारणा से बचती है। लेकिन शायद अन्य कारण हैं: कोई भी ??
डेविड एपस्टीन

6

दो परीक्षण (युग्मित और अप्रकाशित) अलग-अलग प्रश्न पूछते हैं ताकि उन्हें अलग-अलग उत्तर मिल सकें। लगभग हमेशा बाँधना सही होता है, जो अप्रभावित की तुलना में अधिक शक्तिशाली होता है - यह वास्तव में बाँधने की बात है। इसलिए, चूंकि आप कहते हैं कि युग्मन सही है, इसलिए यह संभावना है कि आपके युग्मित परीक्षण के लिए पी-मान एक ही डेटा के बिना अप्राप्य से कम है। आप निश्चित रूप से, दोनों कर सकते हैं और अपने लिए देख सकते हैं।

इसलिए, आपकी दुविधा का जवाब सांख्यिकीय है, न कि सांख्यिकीय। क्या आपकी जोड़ी सही है?

क्या आप एक अनपेक्षित परीक्षण की तुलना में यादृच्छिक युग्मन से अधिक महत्वपूर्ण परिणाम प्राप्त कर सकते हैं? चलो देखते हैं:

set.seed(2910110192)
x <- rnorm(100, 10, 2)
y <- rnorm(100, 10, 2)
t.test(x, y)
t.test(x, y, paired = T)

हां, आप कर सकते हैं, हालांकि यहां अंतर बहुत छोटा है, जोड़ा कम पी था। मैंने उस कोड को कई बार चलाया। आश्चर्य की बात नहीं, कभी-कभी एक पी कम होता है, कभी-कभी अन्य, लेकिन सभी मामलों में अंतर छोटा था। हालाँकि, मुझे यकीन है कि कुछ स्थितियों में p मानों में अंतर बड़ा हो सकता है।


उत्तर के लिए धन्यवाद, लेकिन मेरे प्रश्न ने व्यवस्थित अंतर के लिए कहा । जाहिर है, एक्स और वाई के एक लंबे समय में, एक्स और वाई कभी-कभार दिखते हैं जैसे कि वे बहुत अच्छी तरह से जोड़े हैं, और कभी-कभी जैसे कि उन्हें जानबूझकर बुरी तरह से जोड़ा गया है। निश्चित रूप से यह एक सांख्यिकीय सवाल है कि क्या x और y को यादृच्छिक रूप से चुनने पर, दो परीक्षणों पर पी-वैल्यू का वितरण समान है। मुझे लगता है कि यह उन लोगों के लिए बहुत मुश्किल नहीं होना चाहिए जो अधिक सैद्धांतिक आंकड़े जानते हैं कि मैं वास्तव में पी-मूल्यों के दो सैद्धांतिक वितरण की गणना करता हूं। मेरा अनुमान है कि वे समान हैं।
डेविड एपस्टीन

वास्तविक मामले में मैं इसमें शामिल था, अनपेयर्ड के लिए पी-वैल्यू लगभग .04 था और युग्मित के लिए था ।001। महत्वपूर्ण जीवविज्ञानी के अनुसार, हमें उद्धृत करना चाहिए .04। मेरे अनुसार, पी-वैल्यू में सुधार दृढ़ता से इंगित करता है कि हमारी जोड़ी वैध थी। मैं दावा करता हूं कि यहां आंकड़ों में एक वस्तुनिष्ठ प्रश्न है, एक वस्तुनिष्ठ उत्तर के साथ, और यह केवल विशेष जैविक निर्णय की वैधता के रूप में अच्छे जैविक निर्णय का सवाल नहीं है --- उत्तरार्द्ध पीटर फ्लॉम और के विचार से लगता है महत्वपूर्ण जीवविज्ञानी।
डेविड एपस्टीन

1
मुझे लगता है कि आंकड़े कहानी कहते हैं। दोनों परिणामों का खुलासा किया जाना चाहिए लेकिन जब तक डेटा सही है और सहसंबंध को समझाया जा सकता है युग्मित परीक्षण अधिक सटीक है क्योंकि यह सहसंबंध को ध्यान में रखता है।
माइकल आर। चेरिक ऑक्ट

5

मैं अब ज्यादा बेहतर समझती हूं कि मुझे जोड़ीदार बनाम टी-टेस्ट और संबद्ध पी-वैल्यू के बारे में क्या चिंता थी। पता लगाना एक दिलचस्प यात्रा रही है, और रास्ते में कई आश्चर्य हुए हैं। एक आश्चर्य माइकल के योगदान की जांच के परिणामस्वरूप हुआ है। यह व्यावहारिक सलाह के मामले में अपूरणीय है। इसके अलावा, वह कहते हैं कि मुझे लगता है कि लगभग सभी सांख्यिकीविदों का मानना ​​है, और इसे वापस करने के लिए उनके पास कई upvotes हैं। हालांकि, सिद्धांत के एक टुकड़े के रूप में, यह शाब्दिक रूप से सही नहीं है। मैंने पी-वैल्यूज़ के लिए फॉर्मूला तैयार करके इसकी खोज की, और फिर सोच-विचार करके कि कैसे काउंटर-उदाहरणों का नेतृत्व करने के लिए फ़ार्मुलों का उपयोग किया जाए। मैं प्रशिक्षण से एक गणितज्ञ हूँ, और प्रति-उदाहरण एक "गणितज्ञ का प्रति-उदाहरण" है। यह कुछ ऐसा नहीं है जिसे आप व्यावहारिक आंकड़ों में देखेंगे, जिस तरह की बात मैं अपने मूल प्रश्न से पूछ रहा था, उसके बारे में जानने की कोशिश कर रहा था।

यहाँ आर-कोड है जो काउंटर-उदाहरण देता है:

vLength <- 10; meanDiff <-10^9; numSamples <- 3;
pv <- function(vLength,meanDiff) {
    X <- rnorm(vLength)
    Y <- X - meanDiff + rnorm(vLength,sd=0.0001)
    Paired <- t.test(X,Y,var.equal=T,paired=T)
    NotPaired <- t.test(X,Y,var.equal=T,paired=F)
    c(Paired$p.value,NotPaired$p.value,cov(X,Y))
}
ans <- replicate(numSamples,pv(vLength,meanDiff))

निम्नलिखित विशेषताओं पर ध्यान दें: X और Y दो 10-ट्यूपल हैं जिनका अंतर बहुत बड़ा है और लगभग स्थिर है। कई महत्वपूर्ण आंकड़ों के लिए, सहसंबंध 1.000 है। .... बिना परीक्षण के पी-मान युग्मित परीक्षण के लिए पी-मूल्य से लगभग 10 ^ 40 गुना छोटा है। तो यह माइकल के खाते का विरोधाभास देता है, बशर्ते कि उसका खाता शाब्दिक रूप से, गणितज्ञ-शैली पढ़ता हो। यहाँ माइकल के उत्तर से संबंधित मेरे उत्तर का भाग समाप्त होता है।


यहाँ पीटर के जवाब से प्रेरित विचार हैं। अपने मूल प्रश्न की चर्चा के दौरान, मैंने एक टिप्पणी में अनुमान लगाया कि पी-मूल्यों के दो विशेष वितरण जो अलग-अलग ध्वनि करते हैं, वास्तव में एक ही हैं। मैं अब यह साबित कर सकता हूं। अधिक महत्वपूर्ण यह है कि प्रमाण एक पी-मूल्य की मौलिक प्रकृति को प्रकट करता है, इतना मौलिक कि कोई भी पाठ (जिसमें मैं आया हूं) व्याख्या करने के लिए परेशान करता है। हो सकता है कि सभी पेशेवर सांख्यिकीविदों को रहस्य पता हो, लेकिन मेरे लिए, पी-वैल्यू की परिभाषा हमेशा अजीब और कृत्रिम लगती थी। सांख्यिकीविद के रहस्य को दूर करने से पहले, मुझे प्रश्न निर्दिष्ट करने दें।

n>1n2(n-1)n-1स्वतंत्रता का दर्जा। ये दो वितरण अलग-अलग हैं, इसलिए पृथ्वी पर पी-वैल्यू के जुड़े वितरण समान कैसे हो सकते हैं? बहुत आगे के विचार के बाद ही मुझे महसूस हुआ कि मेरे अनुमान की यह स्पष्टता बहुत स्पष्ट थी।

:(0,)(0,)[0,1]

पी=टी(रों)रों
(-,)[0,)

[0,1]

n-1[0,1]2(n-1)[0,1][0,1]


मुझे नहीं लगता कि पी-वैल्यू के पास कोई रहस्यमय रहस्य है। कुछ लोगों के पास इसके साथ एक मुश्किल समय होता है। यह वास्तव में क्या देखा गया था जब शून्य परिकल्पना TRUE है की तुलना में एक चरम या अधिक चरम के रूप में एक मूल्य के अवलोकन की संभावना है। मुझे लगता है कि आप अपने एक सूत्र में सही थे। मुझे लगता है कि आपने कहा था कि पी-वैल्यू समान रूप से वितरित किए जाते हैं। हां मैं इससे सहमत हूं कि जब शून्य परिकल्पना सच होती है। ध्यान रखें कि आपके टी टेस्ट से अशक्त परिकल्पना सच नहीं हो सकती है। फिर पी-वैल्यू एक समान नहीं है। इसे
माइकल आर। चेरिक ऑक्ट

दूसरे हम दो अलग-अलग परीक्षण आँकड़ों के बारे में बात कर रहे हैं। एक युग्मन पर आधारित है और एक आपके उदाहरण में नहीं है। चाहे मैंने अपने उत्तर में इसका उल्लेख किया हो या नहीं, लेकिन अनपेक्षित टी परीक्षण में स्वतंत्रता के 2n-2 डिग्री के साथ एक केंद्रीय टी वितरण है, जबकि युग्मित टी परीक्षण के लिए इसी टी वितरण में स्वतंत्रता की n-1 डिग्री है। तो स्वतंत्रता की डिग्री की बड़ी संख्या के साथ एक दूसरे की तुलना में मानक सामान्य वितरण के करीब है। क्या यह मायने रखता है जब आप इन परीक्षणों को वास्तविक डेटा पर लागू करते हैं? नहीं! नहीं जब n यथोचित रूप से बड़ा है।
बजे माइकल आर। चेरिक ऑक्ट

एक तरफ ध्यान दें कि युग्मित परीक्षण की एक सीमा के लिए समान नमूना आकार की आवश्यकता होती है जो आपके पास होना चाहिए अगर सभी डेटा को जोड़ा जा सकता है। लेकिन अप्रकाशित परीक्षण असमान नमूना आकारों के साथ मान्य है। तो सामान्य तौर पर अप्रकाशित परीक्षण में स्वतंत्रता की n + m-2 डिग्री है।
माइकल आर। चेरिक ऑक्ट

आपका उत्तर लंबा और सारगर्भित है और मैंने इसके माध्यम से उकसाने की कोशिश की लेकिन मैं प्रतिसाद नहीं समझ पाया। मैं सिर्फ यह नहीं देखता कि आप अशक्त परिकल्पना और वास्तविक आंकड़ों को कहां खाते हैं। प्रेक्षित पी-मान डेटा को दिए गए परीक्षण सांख्यिकीय के लिए उपयुक्त टी वितरण का अभिन्न अंग है। आप दो टी वितरण और समान सामान्य डेटा सेट के लिए उन संख्याओं की तुलना करते हैं। यदि आप देखे गए डेटा पर शर्त लगाते हैं तो ये समान वितरण कोई भूमिका नहीं निभाते हैं। मुझे खेद है, लेकिन मुझे नहीं लगता कि आपका उत्तर वास्तव में आपके प्रश्न का उत्तर देता है।
माइकल आर। चेरिक ऑक्ट

माइकल: मैंने जो आर-कोड दिया है, उस पर ध्यान केंद्रित करूंगा। इसे चलाने में केवल एक सेकंड लगता है। अशक्त परिकल्पना यह है कि X और Y समान सामान्य वितरण से आते हैं, जो निश्चित रूप से, मेरे मामले में बेतहाशा झूठ है। मेरे उदाहरण में कोव (एक्स, वाई)> 0 और फिर भी अप्रकाशित परीक्षण युग्मित परीक्षण से अधिक महत्व देता है।
डेविड एपस्टीन

1

मैं एक और दृष्टिकोण प्रस्तुत करूंगा। अक्सर, युग्मन किया जाता है पूर्वाग्रह को कम करते हैं। मान लीजिए कि आप रुचि रखते हैं कि क्या एक्सपोजर ई लगातार परिणाम के लिए एक जोखिम कारक है। प्रत्येक ई + विषय के लिए, आपको एक आयु और लिंग मिलान वाला विषय मिलता है जो ई- है। अब, हम या तो एक युग्मित टी-टेस्ट कर सकते हैं या एक अनपेक्षित टी-टेस्ट। मुझे लगता है कि हमें स्पष्ट रूप से मेल खाते हुए और एक युग्मित टी-टेस्ट आयोजित करना चाहिए। यह अधिक राजसी है कि यह डिजाइन को ध्यान में रखता है। विश्लेषण में खाते में मिलान लेना है या नहीं, यह पूर्वाग्रह-परिवर्तन व्यापार का मुद्दा है। विश्लेषण में मिलान के लिए लेखांकन पूर्वाग्रह के खिलाफ अधिक सुरक्षा प्रदान करता है, लेकिन विचरण बढ़ा सकता है। एक अनपेक्षित टी-टेस्ट करना अधिक कुशल हो सकता है, लेकिन यह पूर्वाग्रह के खिलाफ कोई सुरक्षा प्रदान नहीं करेगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.