स्टॉफ़र की जेड-स्कोर विधि: क्या होगा अगर हम को बजाय ?


22

मैं एक ही शून्य परिकल्पना के साथ स्वतंत्र सांख्यिकीय परीक्षण कर रहा हूं , और परिणामों को एक -value में संयोजित करना चाहूंगा । ऐसा लगता है कि दो "स्वीकृत" तरीके हैं: फिशर की विधि और स्टॉफ़र की विधिपीNp

मेरा प्रश्न स्टॉफ़र की विधि के बारे में है। प्रत्येक अलग परीक्षण के लिए मुझे एक z- स्कोर प्राप्त । एक शून्य परिकल्पना के तहत, उनमें से प्रत्येक को एक मानक सामान्य वितरण के साथ वितरित किया जाता है, इसलिए योग विचरण साथ एक सामान्य वितरण का अनुसरण करता है । इसलिए स्टॉफ़र की विधि गणना करने का सुझाव देती है , जिसे आम तौर पर इकाई विचरण के साथ वितरित किया जाना चाहिए, और फिर इसे संयुक्त z- स्कोर के रूप में उपयोग करना चाहिए। Σ z मैं एन Σ z मैं / ziΣziNΣzi/N

यह उचित है, लेकिन यहां एक और दृष्टिकोण है जो मैं साथ आया था और वह भी मुझे उचित लगता है। जैसा कि प्रत्येक एक मानक सामान्य वितरण से आता है, वर्गों का योग को स्वतंत्रता की डिग्री के साथ ची- वितरण से आना चाहिए । एक गणना कर सकता है तो और यह एक में बदलने के के साथ संचयी ची-वर्ग बंटन फ़ंक्शन का उपयोग कर -value स्वतंत्रता की डिग्री ( है, जहां CDF है)। एस = Σ जेड 2 मैं एन एस पी एन पी = 1 - एक्स एन ( एस ) एक्स एनziS=Σzi2NSpNपी=1-एक्सएन(एस)एक्सएन

हालाँकि, कहीं भी मैं इस दृष्टिकोण का उल्लेख नहीं कर सकता। क्या यह कभी इस्तेमाल किया जाता है? इसका कोई नाम है? स्टॉफ़र की विधि की तुलना में क्या फायदे / नुकसान होंगे? या मेरे तर्क में कोई दोष है?


एक मुख्य दोष जो बाहर कूदता है, स्टॉफ़र की विधि में व्यवस्थित बदलावों का पता लगा , जो कि आमतौर पर किसी एक विकल्प के लगातार सही होने पर होने की उम्मीद करता है, जबकि ची-स्क्वेर पद्धति में ऐसा करने की कम शक्ति दिखाई देगी। एक त्वरित सिमुलेशन ( , पुनरावृत्तियों) यह मामला दिखाता है; एक-तरफा विकल्प का पता लगाने के लिए ची-स्क्वायड पद्धति गंभीर रूप से कम शक्तिशाली है। N = 100 10 4zमैंएन=100104
whuber

2
धन्यवाद, व्हीबर! क्या आप अपने सिमुलेशन का अधिक विस्तार से वर्णन कर सकते हैं, मैं उत्सुक हूं। दूसरी ओर, अगर अलग-अलग संकेत हैं, लेकिन बड़े निरपेक्ष मान हैं, तो स्टॉफ़र की विधि समग्र साथ समाप्त हो सकती है , जबकि मेरी विधि बहुत महत्वपूर्ण रिपोर्ट करेगी । मुझे लगता है कि कुछ मामलों में यह बहुत अधिक समझ में आता है (और मुझे लगता है कि यह मेरे मामले में संदिग्ध है, लेकिन मुझे यकीन नहीं है)। जेड 0 पीzमैंz0पी
अमीबा का कहना है कि मोनिका

1
आप सही हैं, यही वजह है कि मैंने अपनी टिप्पणी को उत्तर के रूप में पोस्ट नहीं किया। लेकिन ऐसी कौन सी स्थितियाँ हैं जहाँ विकल्प केवल दिशा के कारण, दोनों दिशाओं में अशक्त रूप से भिन्न होते हैं?
whuber

मेरे मन में जो स्थिति थी वह पियर्सन के ची-स्क्वेर्ड टेस्ट में एक की तरह है, जहां एक को इस बात में दिलचस्पी है कि क्या अनुभवजन्य वितरण शून्य से अलग है; तब दोनों दिशाओं में विचलन होता है। लेकिन यह एक दूसरा विचार देने के बाद, मुझे लगता है कि आपका अंतर्ज्ञान सही है और मेरे मामले में संदिग्ध विचलन सभी एक दिशा में हैं। यदि आप अपनी टिप्पणी को एक उत्तर के रूप में पोस्ट करते हैं और अपने त्वरित सिमुलेशन पर कुछ विवरण प्रदान करते हैं (मैं बहुत उत्सुक हूं कि ची-स्क्वेर्ड विधि कम शक्तिशाली क्यों हो जाती है!), मुझे इसे स्वीकार करने में खुशी होगी।
अमीबा का कहना है कि

N Z स्कोर के योग में n के विचरण के साथ वितरण है? माध्य के मानक त्रुटि का वर्ग भिन्न क्यों नहीं है? शीर्षक में निहित योग में N का भिन्नता है। शायद मुझे कुछ स्पष्ट याद आ रहा है? Z2
russellpierce

जवाबों:


17

एक कमी थी जिसके कारण बाहर कूदता है Stouffer की विधि में व्यवस्थित बदलाव का पता लगा सकते है , जो कि एक आम तौर पर होने के लिए जब एक विकल्प लगातार सच है, जबकि ची-वर्ग विधि ऐसा करने के लिए कम शक्ति है प्रकट होता उम्मीद करेंगे क्या। एक त्वरित सिमुलेशन यह मामला दिखाता है; एक-तरफा विकल्प का पता लगाने के लिए chi-squared विधि कम शक्तिशाली है। यहाँ के लिए दोनों तरीकों से पी मूल्यों का हिस्टोग्राम (लाल = Stouffer, नीले = ची-वर्ग) कर रहे हैं 10 5 के साथ स्वतंत्र पुनरावृत्तियों एन = 10 और विभिन्न एकतरफा मानकीकृत प्रभाव μ कोई भी से लेकर ( μ = 0 ) के माध्यम से 0.6 एसडी ( μ =)zमैं105एन=10μμ=00.6 )।μ=0.6

आकृति

μ


आर कोड

इसमें तुलना के लिए फिशर विधि (टिप्पणी की गई) शामिल है।

n <- 10
n.iter <- 10^5
z <- matrix(rnorm(n*n.iter), ncol=n)

sim <- function(mu) {
  stouffer.sim <- apply(z + mu, 1, 
                    function(y) {q <- pnorm(sum(y)/sqrt(length(y))); 2*min(q, 1-q)})
  chisq.sim <- apply(z + mu, 1, 
                    function(y) 1 - pchisq(sum(y^2), length(y)))
  #fisher.sim <- apply(z + mu, 1,
  #                  function(y) {q <- pnorm(y); 
  #                     1 - pchisq(-2 * sum(log(2*pmin(q, 1-q))), 2*length(y))})
  return(list(stouffer=stouffer.sim, chisq=chisq.sim, fisher=fisher.sim))
}

par(mfrow=c(2, 3))
breaks=seq(0, 1, .05)
tmp <- sapply(c(0, .1, .2, .3, .4, .6), 
              function(mu) {
                x <- sim(mu); 
                hist(x[[1]], breaks=breaks, xlab="p", col="#ff606060",
                     main=paste("Mu =", mu)); 
                hist(x[[2]], breaks=breaks, xlab="p", col="#6060ff60", add=TRUE)
                #hist(x[[3]], breaks=breaks, xlab="p", col="#60ff6060", add=TRUE)
                })

धन्यवाद फिर से, यह बहुत अच्छा है। और क्या होता है यदि आप फिशर की विधि को असहज करते हैं? मुझे संदेह है कि आप पहले ही इसका प्रयास कर चुके हैं। क्या स्टॉफ़र लगातार जीतता है? (खुद इसे आज़माने के लिए खेद है, लेकिन मुझे आर के साथ कोई अनुभव नहीं है और इसे हाथ में नहीं है।)
अमीबा का कहना है कि मोनिका

μएनएन

1
आप आसानी से Rइस परीक्षण के लिए सिमुलेशन को संशोधित कर सकते हैं । यह अपने आप को इस सांख्यिकीय कंप्यूटिंग प्लेटफॉर्म से परिचित कराने का एक अच्छा तरीका होगा। :-)
whuber

2
zमैंzमैं

महान चर्चा और क्यूए! एक त्वरित प्रश्न: क्या एक के रूप में इस समस्या रूपों अगर एक बाहरी / विसंगति महालनोबिस दूरी और की तरह कुछ का पालन की गणना के द्वारा पता लगाने के लिए इस ?
NULL

10

परीक्षण के आँकड़ों में अंतर्दृष्टि प्राप्त करने का एक सामान्य तरीका है (आमतौर पर निहित) अंतर्निहित मान्यताओं को प्राप्त करना, जो कि परीक्षण सांख्यिकीय को सबसे शक्तिशाली बनाने का नेतृत्व करेंगे। इस विशेष मामले के लिए एक छात्र और मैंने हाल ही में यह किया है: http://arxiv.org/abs/1111.12.1210v2 (संशोधित संस्करण एनल्स ऑफ एप्लाइड स्टैटिस्टिक्स में प्रदर्शित होने के लिए है)।

बहुत संक्षेप में संक्षेप में (और एक अन्य उत्तर में सिमुलेशन परिणामों के अनुरूप) स्टॉफ़र की विधि सबसे शक्तिशाली होगी जब "सही" अंतर्निहित प्रभाव सभी समान हों; Z ^ 2 का योग तब सबसे अधिक शक्तिशाली होगा जब अंतर्निहित प्रभाव सामान्य रूप से लगभग 0. वितरित किए जाते हैं। यह एक मामूली सरलीकरण है जो विवरणों को छोड़ देता है: अधिक विवरण के लिए ऊपर दिए गए लिंक में arxiv prprint में अनुभाग 2.5 देखें।


2
(+1) किसी तरह मैंने सोचा कि मैंने इसे बहुत पहले लिखा था, लेकिन ऐसा लगता है कि मैंने ऐसा नहीं किया: मेरे सवाल का जवाब देने के लिए विशेष रूप से यहां पंजीकरण करने के लिए बहुत बहुत धन्यवाद! मैं इसकी सराहना करता हूं। आपके पेपर में धारा 2.5 वास्तव में बहुत प्रासंगिक है।
अमीबा का कहना है कि

3

थोड़ा ओ / टी: इन दोनों दृष्टिकोणों में से एक मुद्दा स्वतंत्रता की डिग्री (एन फॉर स्टॉफ़र (फिशर के लिए 2 एन)) के कारण बिजली का नुकसान है। इसके लिए बेहतर मेटा-विश्लेषणात्मक दृष्टिकोण विकसित किए गए हैं, जिन पर आप विचार कर सकते हैं (उदाहरण के लिए उलटा-वेटेड मेटा-विश्लेषण,)।

यदि आप एक समूह के भीतर कुछ वैकल्पिक परीक्षणों के सबूत की तलाश कर रहे हैं, तो आप डोनो और जिन की उच्च आलोचना को देखना चाहते हैं: https://projecteuclid.org/euclid.aos/1085408492


1

प्रश्न का उत्तर देने के लिए और आगे के पाठकों के लिए: क्या इसका कभी उपयोग किया जाता है?, चचेरे भाई (2008) द्वारा एएक्सएक्सवी पर एक विस्तृत पेपर है , जो वैकल्पिक दृष्टिकोणों के एक जोड़े को सूचीबद्ध और समीक्षा करता है। प्रस्तावित एक प्रतीत नहीं होता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.