मान-व्हिटनी अशक्त परिकल्पना के तहत शून्य परिकल्पना


9

मैं एक मान-व्हिटनी यू परीक्षण की अशक्त परिकल्पना के बारे में उत्सुक हूं। मैं अक्सर यह देखता हूं कि यह कहा गया है कि शून्य परिकल्पना यह है कि दो आबादी में समान वितरण हैं। लेकिन मैं सोच रहा हूं - अगर मेरे पास एक ही औसत लेकिन बेहद असमान बदलाव के साथ दो सामान्य आबादी थी, तो मान-व्हिटनी परीक्षण इस अंतर का पता नहीं लगाएगा।

मैंने यह भी कहा है कि मान-व्हिटनी परीक्षण की अशक्त परिकल्पना है Pr(X>Y)=0.5या एक जनसंख्या ( ) से अवलोकन की संभावना दूसरी आबादी ( ) (संबंधों के बहिष्कार के बाद ) से एक अवलोकन से अधिक 0.5 के बराबर है। यह थोड़ा अधिक समझ में आता है, लेकिन मेरे द्वारा कहे गए पहले अशक्त परिकल्पना के बराबर नहीं है।XY

मैं इसे असंगत करने में थोड़ी मदद पाने की उम्मीद कर रहा हूं। धन्यवाद!

जवाबों:


5

मान-व्हिटनी परीक्षण एक क्रमपरिवर्तन परीक्षण का एक विशेष मामला है (नल के तहत वितरण डेटा के सभी संभावित क्रमपरिवर्तन को देखकर प्राप्त होता है) और क्रमपरिवर्तन परीक्षणों में समान वितरण के रूप में नल होता है, ताकि तकनीकी रूप से सही हो।

मान-व्हिटनी परीक्षण सांख्यिकीय का सोचने का एक तरीका यह है कि एक समूह से यादृच्छिक रूप से चुने गए मूल्य की संख्या का एक माप दूसरे समूह से यादृच्छिक रूप से चुने गए मूल्य से अधिक है। तो पी (एक्स> वाई) = 0.5 भी समझ में आता है और यह तकनीकी रूप से समान वितरण शून्य की संपत्ति है (निरंतर वितरण को मानते हुए जहां एक टाई की संभावना 0 है)। यदि 2 वितरण समान हैं, तो X की संभावना Y से अधिक है क्योंकि वे दोनों समान वितरण से तैयार किए गए हैं।

एक समान माध्य लेकिन व्यापक रूप से भिन्न भिन्न होने वाले 2 वितरणों का कथित मामला 2 अशक्त परिकल्पना के साथ मेल खाता है, लेकिन समान वितरण का 1 नहीं है। हम इस मामले में पी-मूल्यों के साथ क्या होता है यह देखने के लिए कुछ सिमुलेशन कर सकते हैं (सिद्धांत में उन्हें समान रूप से वितरित किया जाना चाहिए):

> out <- replicate( 100000, wilcox.test( rnorm(25, 0, 2), rnorm(25,0,10) )$p.value )
> hist(out)
> mean(out < 0.05)
[1] 0.07991
> prop.test( sum(out<0.05), length(out), p=0.05 )

        1-sample proportions test with continuity correction

data:  sum(out < 0.05) out of length(out), null probability 0.05
X-squared = 1882.756, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.05
95 percent confidence interval:
 0.07824054 0.08161183
sample estimates:
      p 
0.07991 

तो स्पष्ट रूप से यह अधिक बार इसे अस्वीकार करना चाहिए और अशक्त परिकल्पना झूठी है (यह वितरण की समानता से मेल खाता है, लेकिन प्रोब = 0.5 नहीं)।

X> Y की संभावना के संदर्भ में सोचना भी कुछ दिलचस्प समस्याओं में चलता है यदि आप कभी भी उन आबादी की तुलना करते हैं जो एफ्रॉन के पासा पर आधारित हैं ।


हाय ग्रेग, जवाब के लिए धन्यवाद। ऐसा लगता है कि आप जो कह रहे हैं, मैं कुछ विशेष मामले में पाया जाता है जहां समान वितरण नल के तहत परीक्षण ठीक से काम नहीं करता है। और इसके अलावा, मैंने कहा कि अशक्त परिकल्पनाएं समान नहीं हैं। क्या वो सही है?
जिमज

4

मान-व्हिटनी समान अर्थ वाले विचरण में परिवर्तन के प्रति संवेदनशील नहीं है, लेकिन यह - जैसा कि आप देख सकते हैं P(X>Y)=0.5 फार्म, अंतर है कि नेतृत्व का पता लगाने P(X>Y) से भटकना 0.5(जैसे जहाँ माध्य और विचरण दोनों एक साथ बढ़ते हैं)। काफी स्पष्ट रूप से अगर आपके पास दो मानक समान साधन हैं, तो उनके मतभेद शून्य के बारे में सममित हैं। इसलियेP(X>Y)=P(XY>0)=12, जो अशक्त स्थिति है।

उदाहरण के लिए, यदि आपके पास वितरण है Y मतलब के साथ घातांक है 1 जबकि X मतलब के साथ एक घातीय वितरण है k (एक पैमाने पर परिवर्तन), मान-व्हिटनी उस के प्रति संवेदनशील है (वास्तव में, दोनों पक्षों के लॉग, इसकी सिर्फ एक स्थान-शिफ्ट, और मान-व्हिटनी मोनोटोनिक परिवर्तन से अप्रभावित है)।

-

यदि आप उन परीक्षणों में रुचि रखते हैं जो वैचारिक रूप से मान-व्हिटनी के समान हैं जो कि मध्यस्थों की समानता के तहत अंतर के प्रति संवेदनशील हैं, तो ऐसे कई परीक्षण हैं।

नहीं है सीगल-Tukey , उदाहरण के लिए, परीक्षण और अंसारी-ब्राडली परीक्षण दोनों बारीकी से मान-व्हिटनी-Wilcoxon दो नमूना परीक्षण से संबंधित।

वे दोनों छोर से रैंकिंग के मूल विचार पर आधारित हैं।

यदि आप R का उपयोग करते हैं, तो अंसारी-ब्रैडली परीक्षण में बनाया गया है ... ?ansari.test

प्रभाव में सिगेल-टकी सिर्फ नमूने से अलग रैंक पर मान-व्हिटनी-विल्कोक्सन परीक्षण करता है; यदि आप डेटा को स्वयं रैंक करते हैं, तो आपको वास्तव में पी-वैल्यू के लिए एक अलग फ़ंक्शन की आवश्यकता नहीं है। फिर भी, आप कुछ यहाँ पा सकते हैं:

http://www.r-statistics.com/2010/02/siegel-tukey-a-non-parametric-test-for-equality-in-variability-r-code/

-

(मेरे मूल उत्तर के तहत ttnphns की टिप्पणी के संबंध में)

आप किसी भी विशेष अर्थ में @GregSnow से असहमत होने के रूप में इसे पढ़ने के लिए मेरी प्रतिक्रिया की अधिक व्याख्या करेंगे। निश्चित रूप से जोर में अंतर है और कुछ हद तक हम किस बारे में बात कर रहे हैं, लेकिन मुझे बहुत आश्चर्य होगा अगर इसके पीछे बहुत वास्तविक असहमति थी।

मान और व्हिटनी को उद्धृत करते हैं: "एक आंकड़ा यू के सापेक्ष रैंक के आधार पर एक्स'रेत yपरिकल्पना के परीक्षण के लिए प्रस्तावित है=जी"यह असमान है, यह पूरी तरह से @ ग्रेगस्नो की स्थिति का समर्थन करता है।

अब, आइए देखें कि आँकड़ा का निर्माण कैसे किया जाता है: “ आइएयू समय की संख्या की गणना करें y पूर्ववर्ती एक्स"अब यदि उनका अशक्त सत्य है, तो उस घटना की संभावना है12... लेकिन 0.5 की संभावना प्राप्त करने के अन्य तरीके हैं, और इस अर्थ में कि कोई भी ऐसा कर सकता है कि परीक्षण अन्य परिस्थितियों में काम कर सकता है। इस हद तक कि वे एक (पुन: बढ़ाया) संभावना का अनुमान लगा रहे हैंY>X, यह मेरे द्वारा कही गई बातों का समर्थन करता है।

हालाँकि, महत्त्वपूर्ण स्तरों के सही होने की गारंटी के लिए, आपको वितरण की आवश्यकता होगी Uशून्य वितरण का मिलान करने के लिए। यह इस धारणा पर आधारित है कि सभी क्रमपरिवर्तनX तथा Yनल के तहत संयुक्त टिप्पणियों के लिए समूह-लेबल लेबल समान रूप से संभावना थे। यह निश्चित रूप से के तहत मामला हैf=g। जैसा कि @GregSnow ने कहा है।

सवाल यह है कि यह मामला किस हद तक है (यानी कि परीक्षण सांख्यिकीय के वितरण इस धारणा के तहत प्राप्त मैच से मेल खाते हैं) f=g, या लगभग इतना), अधिक सामान्यतः व्यक्त अशक्त के लिए।

मेरा मानना ​​है कि कई स्थितियों में जो यह करता है; विशेष रूप से स्थितियों सहित, लेकिन आपके द्वारा वर्णित एक से अधिक सामान्य (एक ही मतलब के साथ दो सामान्य आबादी लेकिन बेहद असमान विचरण को रैंक के आधार पर परिणामी वितरण में बदलाव किए बिना काफी सामान्यीकृत किया जा सकता है), मेरा मानना ​​है कि परीक्षण का वितरण उसी वितरण के लिए निकला जिसके तहत यह प्राप्त किया गया था और इसलिए वहां मान्य होना चाहिए। मैंने कुछ सिमुलेशन किए जो इसका समर्थन करते हैं। हालांकि, यह हमेशा एक बहुत ही उपयोगी परीक्षा नहीं होगी (इसमें खराब शक्ति हो सकती है)।

मैं कोई सबूत नहीं देता कि यह मामला है। मैंने कुछ अंतर्ज्ञान / हाथ से लहराए जाने वाले तर्क को लागू किया है और कुछ बुनियादी सिमुलेशन भी किए हैं जो यह सच है कि मान - व्हिटनी काम करता है (इसमें यह शून्य के तहत 'सही' वितरण है) जब से अधिक व्यापक रूप सेf=g

आप क्या करेंगे, यह सुनिश्चित करें, लेकिन मैं इसे @GregSnow के साथ असहमति के रूप में विवश नहीं करता

संदर्भ - मान और व्हिटनी का मूल पेपर


क्या मैंने आपको सही समझा कि आप विकिपीडिया के मैन-व्हिटनी टॉक पेज से इस शब्द को समझेंगे the null hypothesis of Mann-Whitney U-test is not about the equality of distributions. Is is about the symmetry between two populations with respect to the probability of obtaining a larger observation। और इसलिए आप @ ग्रेग के उत्तर से सहमत नहीं हैं, है ना?
ttnphns

मैंने संपादन में कुछ चर्चा जोड़ी है।
Glen_b -Reinstate Monica

बहुत अच्छा जोड़। मैं इसका अध्ययन करूँगा (मुझे हमेशा ऐसा लगा जैसे MW टेस्ट में बारीकियाँ हैं जो मुझे निरन्तर जारी रखती हैं)। इस बीच, यदि आप कहेंगे कि क्या मैं सहमत हूँ: "क्योंकि MW टेस्ट स्टेटिस्टिक माध्य रैंकों की समानता (सिर्फ) को दर्शाता है , ऐसे हालात हो सकते हैं जब f ~ = g [मुझे समझ में f, g को मूल वितरण, पूर्व रैंकिंग] लेकिन परीक्षण पूरी तरह से प्रासंगिक है क्योंकि यह f = g के तहत समान H0 से निपटना जारी रखता है। ऐसी स्थिति का एक उदाहरण सममित वितरण है जो फैल पैरामीटर (भिन्नता) को छोड़कर पूरी तरह समान है ।
ttnphns

संकेतन में (मान और व्हिटनी द्वारा), f तथा g की घनत्व हैं X तथा Y। मैं इस बात से सहमत हूं कि मैंने परिस्थितियों को सत्यापित / समझ लिया है, आपका कथन ऐसा प्रतीत होता है। मुझे संदेह है कि मैन-व्हिटनी के बारे में अभी भी बहुत कुछ है जो मुझे भी हटा देता है।
Glen_b -Reinstate Monica
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.