एनोवा और क्रुस्कल-वालिस परीक्षण के बीच अंतर


20

मैं आर सीख रहा हूं और विचरण के विश्लेषण के साथ प्रयोग कर रहा हूं। मैं दोनों चला रहा हूँ

kruskal.test(depVar ~ indepVar, data=df)

तथा

anova(lm(depVar ~ indepVar, data=dF))

क्या इन दोनों परीक्षणों में व्यावहारिक अंतर है? मेरी समझ यह है कि वे दोनों शून्य परिकल्पना का मूल्यांकन करते हैं कि आबादी का एक ही मतलब है।

जवाबों:


28

मान्यताओं और परिकल्पनाओं में अंतर हैं जिन्हें जांचा जाता है।

एनोवा (और टी-टेस्ट) स्पष्ट रूप से मूल्यों के साधनों की समानता की परीक्षा है। क्रुक्ल-वालिस (और मान-व्हिटनी) को तकनीकी रूप से माध्य रैंकों की तुलना के रूप में देखा जा सकता है ।

इसलिए, मूल मूल्यों के संदर्भ में, क्रुस्कल-वालिस साधनों की तुलना में अधिक सामान्य है: यह परीक्षण करता है कि क्या प्रत्येक समूह से एक यादृच्छिक अवलोकन समान रूप से किसी अन्य समूह से यादृच्छिक अवलोकन के ऊपर या नीचे होने की संभावना है। वास्तविक डेटा की मात्रा जो इस बात को रेखांकित करती है कि तुलना का मतलब न तो अंतर है और न ही मंझले में अंतर है, (दो नमूना मामले में) यह वास्तव में सभी जोड़ीदार अंतरों का मध्य है - बीच-बीच में हॉजेस-लेहमन अंतर।

हालाँकि, यदि आप कुछ प्रतिबंधात्मक धारणाएँ बनाना चुनते हैं, तो क्रुस्कल-वालिस को जनसंख्या के साधनों की समानता, साथ ही साथ मात्राओं (जैसे मंझले) की परीक्षा के रूप में देखा जा सकता है, और वास्तव में अन्य उपायों की एक विस्तृत विविधता। यही है, यदि आप मानते हैं कि अशक्त परिकल्पना के तहत समूह-वितरण समान हैं, और विकल्प के तहत, केवल परिवर्तन एक वितरणीय शिफ्ट है (तथाकथित " स्थान-शिफ्ट वैकल्पिक "), तो यह भी एक परीक्षण है जनसंख्या की समानता का अर्थ है (और, एक साथ, मध्यस्थों, निम्न चतुर्थक आदि)।

[यदि आप उस धारणा को बनाते हैं, तो आप सापेक्ष बदलावों के लिए अनुमान और अंतराल प्राप्त कर सकते हैं, जैसा कि आप एनोवा के साथ कर सकते हैं। वैसे, उस धारणा के बिना अंतराल प्राप्त करना भी संभव है, लेकिन उनकी व्याख्या करना अधिक कठिन है।]

यदि आप यहां उत्तर को देखते हैं , विशेष रूप से अंत की ओर, यह टी-टेस्ट और विलकॉक्सन-मैन-व्हिटनी के बीच तुलना की चर्चा करता है, जो (जब कम से कम दो-पूंछ वाले परीक्षण कर रहे हैं) एनोवा और क्रिंकल-वालिस के बराबर हैं केवल दो नमूनों की तुलना में लागू; यह थोड़ा और विस्तार देता है, और उस चर्चा का अधिकांश भाग कृषाल-वालिस बनाम एनोवा तक पहुंचता है।

यह पूरी तरह से स्पष्ट नहीं है कि आपको व्यावहारिक अंतर से क्या मतलब है। आप उन्हें आम तौर पर समान रूप से उपयोग करते हैं। जब मान्यताओं के दोनों सेट लागू होते हैं, तो वे आम तौर पर काफी समान प्रकार के परिणाम देते हैं, लेकिन वे निश्चित रूप से कुछ स्थितियों में काफी भिन्न पी-मान दे सकते हैं।

संपादित करें: यहाँ छोटे नमूनों पर भी आक्षेप की समानता का एक उदाहरण है - यहाँ तीन समूहों के बीच स्थान-पारियों के लिए संयुक्त स्वीकृति क्षेत्र है (दूसरे और पहले की तुलना में तीसरा) सामान्य वितरण से नमूना (छोटे नमूना आकार के साथ) किसी विशेष डेटा सेट के लिए, 5% के स्तर पर:

क्रुस्कल-वालिस और अनोवा में स्थान-अंतर के लिए स्वीकृति क्षेत्र

कई दिलचस्प विशेषताएं देखी जा सकती हैं - इस मामले में केडब्ल्यू के लिए थोड़ा बड़ा स्वीकृति क्षेत्र, इसकी सीमा ऊर्ध्वाधर, क्षैतिज और विकर्ण सीधी रेखा खंडों से मिलकर (यह पता लगाना मुश्किल नहीं है कि क्यों)। दोनों क्षेत्र हमें यहां ब्याज के मापदंडों के बारे में बहुत समान बातें बताते हैं।


2
+1। मैंने इसे केवल जोर देने के लिए संपादित करने का साहस किया, जहां मैंने इसे आवश्यक समझा। कृपया देखें कि अब आप सहमत हैं या नहीं।
ttnphns 8

@ttnphns संपादन के लिए धन्यवाद। कुछ विशेष कारण हैं कि आपके द्वारा परिवर्तित की गई कुछ चीजें वहां थीं, इसलिए मैं कुछ मूल वापस संपादित कर सकता हूं। हालांकि, शायद मुझे यह स्पष्ट करना चाहिए कि मैंने इसे क्यों लिखा था जैसा कि मैंने पहले भी लिखा था। लेकिन पहले मैं इस बारे में ध्यान से सोचना चाहता हूं कि अपने परिवर्तनों को जितना हो सके उतना बेहतर रखा जाए।
Glen_b -Reinstate मोनिका

4

हाँ वहाँ है। anovaजबकि एक पैरामीट्रिक दृष्टिकोण है kruskal.testएक गैर पैरामीट्रिक दृष्टिकोण है। तो kruskal.testकिसी भी वितरण की धारणा की आवश्यकता नहीं है।
व्यावहारिक दृष्टिकोण से, जब आपका डेटा तिरछा होता है, तो anovaउपयोग करने के लिए अच्छा दृष्टिकोण नहीं होगा। उदाहरण के लिए इस प्रश्न पर एक नज़र डालें ।


4
मैं कहूंगा कि क्रुस्क्ल-वालिस एनोवा पैरामीट्रिक एनोवा की तुलना में वितरण के बारे में आराम से धारणा बनाता है: प्रत्येक समूह में अवलोकन समान आकार के साथ आबादी से आते हैं । हेटेरोसेडासिटी या अत्यधिक तिरछा वितरण पारंपरिक परीक्षणों के साथ समस्याग्रस्त है।
१०:२२

2
ऐसा कैसे, @chl? रैंक को तिरछा करके नहीं बदला जाता है, और KW रैंक आधारित है। मुझे किसकी याद आ रही है?
पीटर Flom - को पुनः स्थापित मोनिका

6
3/π

एच0

1
@ StéphaneLaurent यदि आकृतियाँ समान नहीं हैं, तो इससे बुरा प्रभाव हो सकता है। यहां मेरा उदाहरण देखें
फ्लास्क

3

Δयहां छवि विवरण दर्ज करें

(*)एच0:{Δ=0}एच1:{Δ0}(*)एच0एच0)(*)एच0:{वितरण समान हैं}

(*)Δ>0Δ

एक्सyn=1000एच0

set.seed(666)
n <- 1000
x <- rnorm(n)
y <- (2*rbinom(n,1,1/2)-1)*rnorm(n,3)
plot(density(x, from=min(y), to=max(y)))
lines(density(y), col="blue")

यहां छवि विवरण दर्ज करें

> kruskal.test(list(x,y))

    Kruskal-Wallis rank sum test

data:  list(x, y)
Kruskal-Wallis chi-squared = 2.482, df = 1, p-value = 0.1152

जैसा कि मैंने शुरुआत में दावा किया था, मैं किलोवाट के सटीक निर्माण के बारे में निश्चित नहीं हूं। हो सकता है कि मेरा जवाब एक और नॉनपैरेमेट्रिक टेस्ट (मैन-व्हिटनी ..?) के लिए अधिक सही है, लेकिन दृष्टिकोण समान होना चाहिए।


1
Kruskal-Wallis test is constructed in order to detect a difference between two distributions having the same shape and the same dispersionजैसा कि ग्लेन के उत्तर, टिप्पणियों और इस साइट पर कई अन्य स्थानों पर उल्लेख किया गया है, यह सच है लेकिन परीक्षण क्या करता है इसकी संकुचित रीडिंग है। same shape/dispersionवास्तव में एक आंतरिक नहीं है, लेकिन एक अतिरिक्त धारणा है जिसका उपयोग कुछ में किया जाता है और अन्य स्थितियों में उपयोग नहीं किया जाता है।
ttnphns

PS आपका दूसरा उदाहरण KW परीक्षण का खंडन या खंडन नहीं करता है। परीक्षण का H0 नहीं है distributions are equal , ऐसा सोचना एक गलती है। H0 केवल यह है कि, लाक्षणिक रूप से, "गुरुत्वाकर्षण के संघनन" के दो बिंदु एक दूसरे से विचलित नहीं होते हैं।
tnnphns

एच0

1
krusal.test()एच0

1
हाँ। the equality of the location parameters of the distributionसही फॉर्म्युलेशन है (यद्यपि "स्थान" को सामान्य स्थिति में केवल माध्य या माध्यिका के रूप में नहीं सोचा जाना चाहिए)। यदि आप समान आकार ग्रहण करते हैं, तो स्वाभाविक रूप से, यह वही H0 "समान वितरण" बन जाता है।
ttnphns

0

क्रूसकल-वालिस रैंक-आधारित है, बजाय मूल्य-आधारित। यह एक बड़ा अंतर बना सकता है अगर तिरछा वितरण हो या अगर चरम मामले हों

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.