जब नमूनों का वितरण गैर-सामान्य हो तो स्वतंत्र नमूने टी-टेस्ट कितना मजबूत होता है?


24

मैंने पढ़ा है कि जब नमूनों का वितरण सामान्यता से हटता है तो t -est "काफी मजबूत" होता है। बेशक, यह उन अंतरों का नमूना वितरण है जो महत्वपूर्ण हैं। मेरे पास दो समूहों के लिए डेटा है। समूहों में से एक आश्रित चर पर अत्यधिक तिरछा है। दोनों समूहों के लिए नमूना आकार काफी छोटा है (एक में एन = 33 और दूसरे में 45)। क्या मुझे यह मान लेना चाहिए कि इन शर्तों के तहत, मेरा t -est सामान्यता धारणा के उल्लंघन के लिए मजबूत होगा?


3
"बेशक, यह महत्वपूर्ण है कि अंतर का नमूना वितरण है" - क्या में अंतर? मुझे इस प्रश्न को संपादित करने के लिए लुभाया गया क्योंकि मुझे डर है कि यह भविष्य के पाठकों को भ्रामक है (और मुख्य बिंदु पर स्पर्शरेखा)। मेरा पहला विचार यह एक युग्मित t -est के लिए एक गलत संदर्भ है , जहां हम मानते हैं कि जोड़े के बीच का अंतर सामान्य है, लेकिन यह एक स्वतंत्र नमूने परीक्षण में लागू नहीं होता है। हम भी अंतर करने के लिए जोड़े नहीं है! शायद "साधनों में अंतर" का इरादा है? बाकी क्यू दो नमूनों की सामान्यता मानता है, कोई अंतर नहीं।
सिल्वरफिश

कैसे मजबूत के सवाल टी -Test इस तरह के उल्लंघन करने के लिए है एक महत्वपूर्ण और वैध है। लेकिन एक संबंधित मुद्दा यह है कि पहले आपके डेटा में उल्लंघनों की जाँच हो रही है, और उसके बाद ही निर्णय लेना है कि टी -टेस्ट या किसी वैकल्पिक परीक्षा को लागू करने की सिफारिश नहीं की गई है। इस तरह की बहु-चरण प्रक्रिया में अनिश्चित परिचालन विशेषताएं होती हैं। इस धागे को देखें: टी टेस्ट या गैर पैरामीट्रिक जैसे छोटे नमूनों में विल्कोक्सन के लिए चुनने के लिए एक राजसी विधि
सिल्वरफिश

एक विश्वसनीय स्रोत क्या है? (मुझे लगता है कि हम दोनों सहमत होंगे कि आधिकारिक स्रोत के रूप में ऐसी कोई बात नहीं है)। क्या हम स्तर-मजबूती या शक्ति को भी देख रहे हैं? और अगर 'शक्ति भी' ... हम किस तरह के विकल्प की बात कर रहे हैं ?
Glen_b -Reinstate Monica

@Glen_b क्षमा करें, "आधिकारिक स्रोत" इनाम संदेश स्पष्ट रूप से StackOverflow के लिए अधिक है! मुझे लगता है कि यह थ्रेड व्यावहारिक रूप से महत्वपूर्ण है (साथ ही विकिपीडिया पर काफी उच्च-यातायात और खराब है) कुछ उद्धरणों को प्राप्त करने के लिए। "कैनोनिकल उत्तर" बाउंटी टेम्पलेट अनुचित होगा क्योंकि पीटर फ्लॉम का उत्तर स्पष्ट रूप से दिखाई देता है। मुझे लगता है कि इस विषय पर "ज्ञान का एक सामान्य निकाय" है - अगर मुझे यह क्यू ऑफ-हैंड पूछा जाता है, तो मेरी सूची डैलल्स की तरह दिखेगी (मैंने कुर्तोसिस को जोड़ा होगा, लेकिन समान नमूना आकार का उद्यम नहीं किया है। बनाम सामान्य गैर सामान्य रक्षा करता है)
silverfish

@Glen_b आपके उत्तर में एक समान नस होती है, इसलिए ऐसा लगता है कि कुछ बुनियादी बिंदु व्यापक रूप से ज्ञात / स्वीकृत हैं। मेरी डिग्री ने मान्यताओं को कवर किया, लेकिन उल्लंघन का परिणाम नहीं: मेरा ज्ञान विविध स्रोतों, बिट्स और बोब्स से बिखरा हुआ है ("मनोवैज्ञानिकों के लिए आंकड़े" प्रकार की किताबें कई आँकड़े सिद्धांत ग्रंथों की तुलना में परिणामों पर अधिक ध्यान दे सकती हैं) - अन्यथा मैंने पोस्ट किया होता एक जवाब नहीं एक इनाम! अगर किसी को एक अच्छी पाठ्यपुस्तक में एक सभ्य एक-पृष्ठ सारांश पता है, तो वह मुझे ठीक करेगा। यदि यह सिमुलेशन परिणामों के साथ कुछ कागज़ात है, तो यह ठीक है। कुछ भी भविष्य के पाठकों को संदर्भित कर सकते हैं और उद्धृत कर सकते हैं।
सिल्वर फिश

जवाबों:


16

मजबूती के बारे में सवालों का जवाब देना बहुत कठिन है - क्योंकि मान्यताओं का उल्लंघन कई तरीकों से किया जा सकता है, और प्रत्येक तरीके से अलग-अलग डिग्री तक। सिमुलेशन कार्य केवल संभव उल्लंघन के बहुत छोटे हिस्से का नमूना कर सकते हैं।

कंप्यूटिंग की स्थिति को देखते हुए, मुझे लगता है कि यह दोनों पैरामीट्रिक और एक गैर-पैरामीट्रिक परीक्षण चलाने के लिए समय के लायक है , यदि दोनों उपलब्ध हैं। फिर आप परिणामों की तुलना कर सकते हैं।

यदि आप वास्तव में महत्वाकांक्षी हैं, तो आप क्रमपरिवर्तन परीक्षण भी कर सकते हैं।

क्या होगा अगर रोनाल्ड फिशर ने एलन ट्यूरिंग को अपना काम करने से पहले किया था? :-)।


1
पीटर, आपने मुझे उस प्रश्न का उत्तर देने के लिए ऐतिहासिक कथा लेखन के लिए प्रेरित किया है!
साइकोरैक्स का कहना है कि मोनिका

12

@PeterFlom ने अपने पहले वाक्य के साथ नाखून पर मारा।

मैं उन अध्ययनों का एक संक्षिप्त सारांश देने की कोशिश करूँगा जो मैंने देखे हैं (यदि आप लिंक चाहते हैं तो यह थोड़ी देर हो सकती है):

कुल मिलाकर, दो नमूना टी-परीक्षण सममित गैर-सामान्यता के लिए यथोचित शक्ति-शक्ति है (सही प्रकार-आई-त्रुटि-दर कर्टोसिस से कुछ हद तक प्रभावित होती है, शक्ति ज्यादातर उसी से प्रभावित होती है)।

जब दो नमूने हल्के से एक ही दिशा में तिरछा हो जाते हैं, तो एक-पूंछ वाला टी-परीक्षण निष्पक्ष नहीं रह जाता है। टी-स्टेटिस्टिक को वितरण के विपरीत तिरछा किया जाता है, और इसमें बहुत अधिक शक्ति होती है यदि परीक्षण एक दिशा में होता है, तो दूसरे में। यदि वे विपरीत दिशाओं में तिरछे होते हैं, तो टाइप I त्रुटि दर भारी रूप से प्रभावित हो सकती है।

भारी तिरछापन का बड़ा प्रभाव हो सकता है, लेकिन आम तौर पर, दो-पूंछ वाले परीक्षण के साथ मध्यम तिरछापन बहुत बुरा नहीं है यदि आप सार में अपने परीक्षण को अपनी शक्ति को एक दिशा में आवंटित करने से ज्यादा बुरा नहीं मानते हैं।

संक्षेप में - टू-टेल्ड, टू-सैंपल टी-टेस्ट उन प्रकार की चीजों के लिए यथोचित रूप से मजबूत है यदि आप महत्व स्तर और कुछ हल्के पूर्वाग्रह पर कुछ प्रभाव को सहन कर सकते हैं।

वितरण के लिए कई, कई, तरीके गैर-सामान्य हैं, हालांकि, जो उन टिप्पणियों द्वारा कवर नहीं किए गए हैं।


मुझे यकीन नहीं है कि यह कहना सही है कि यह उचित रूप से शक्ति-मजबूत है! यह उचित स्तर-मजबूत है, महत्व का स्तर लगभग सही होगा, लेकिन उदाहरण के लिए विल्कोक्सॉन परीक्षणों में विकल्प के लिए बहुत अधिक शक्ति हो सकती है जो सामान्य रूप से पता लगाने में मुश्किल हो सकती है। यह भी कारकों पर निर्भर करता है जैसे कि प्रत्येक समूह में समान संख्या में अवलोकन हैं: असमानता-एन मामले में मजबूती बहुत अधिक नाजुक है!
kjetil b halvorsen

1
@kjetilbhalvorsen जिन अध्ययनों को मैंने देखा है - जिनमें कुछ सिमुलेशन मैंने खुद किए हैं (और मैंने किसी अच्छे समय पर नहीं देखा है; आपने अच्छी तरह से कुछ देखा होगा जो मैंने नहीं किया है), शक्ति पर प्रभाव का बहुमत लग रहा था ज्यादातर ऊपर और नीचे के स्तर को धक्का देना (जो विल्कोक्सन को प्रभावित नहीं करता था)। इन परिस्थितियों में (विशेषकर हैवी-टेल्स के साथ) विल्कोक्सन की आम तौर पर अच्छी शक्ति गुणों को देखते हुए, विल्कोक्सन को सत्ता पर जीत हासिल करने के लिए पर्याप्त है - यदि आप स्तरों को समायोजित करते हैं तो वे समान हैं, यह मुझे आश्चर्यचकित करता है कि टी कितनी बार - अक्सर किया।
Glen_b -Reinstate मोनिका

7

@PeterFlom ने पहले ही उल्लेख किया है कि सिमुलेशन अध्ययन सभी परिदृश्यों और संभावनाओं को कभी भी कवर नहीं कर सकता है और इसलिए निश्चित उत्तर नहीं दे सकता है। हालांकि, मैं अभी भी कुछ सिमुलेशन का संचालन करके वास्तव में इस तरह की समस्या का पता लगाने के लिए उपयोगी है (यह भी ठीक उसी प्रकार का व्यायाम है जो मैं छात्रों को मोंटे कार्लो सिमुलेशन अध्ययन के विचार को पेश करते समय उपयोग करना पसंद करता हूं)। तो, चलो वास्तव में यह कोशिश करते हैं। मैं इसके लिए R का उपयोग करूँगा।

कोड

n1 <- 33
n2 <- 45
mu1 <- 0
mu2 <- 0
sd1 <- 1
sd2 <- 1

iters <- 100000
p1 <- p2 <- p3 <- p4 <- p5 <- rep(NA, iters)

for (i in 1:iters) {

   ### normal distributions
   x1 <- rnorm(n1, mu1, sd1)
   x2 <- rnorm(n2, mu2, sd2)
   p1[i] <- t.test(x1, x2)$p.value

   ### both variables skewed to the right
   x1 <- (rchisq(n1, df=1) - 1)/sqrt(2) * sd1 + mu1
   x2 <- (rchisq(n2, df=1) - 1)/sqrt(2) * sd2 + mu2
   p2[i] <- t.test(x1, x2)$p.value

   ### both variables skewed to the left
   x1 <- -1 * (rchisq(n1, df=1) - 1)/sqrt(2) * sd1 + mu1
   x2 <- -1 * (rchisq(n2, df=1) - 1)/sqrt(2) * sd2 + mu2
   p3[i] <- t.test(x1, x2)$p.value

   ### first skewed to the left, second skewed to the right
   x1 <- -1 * (rchisq(n1, df=1) - 1)/sqrt(2) * sd1 + mu1
   x2 <- (rchisq(n2, df=1) - 1)/sqrt(2)      * sd2 + mu2
   p4[i] <- t.test(x1, x2)$p.value

   ### first skewed to the right, second skewed to the left
   x1 <- (rchisq(n1, df=1) - 1)/sqrt(2)      * sd1 + mu1
   x2 <- -1 * (rchisq(n2, df=1) - 1)/sqrt(2) * sd2 + mu2
   p5[i] <- t.test(x1, x2)$p.value

}

print(round((apply(cbind(p1, p2, p3, p4, p5), 2, function(p) mean(p <= .05))), 3))

व्याख्या

  1. पहले हम समूह का आकार ( n1और n2), सच्चे समूह का अर्थ ( mu1और mu2), और सच्चे मानक विचलन ( sd1और sd2) सेट करते हैं।

  2. फिर हम पी-वैल्यू को स्टोर करने के लिए वैक्टर को चलाने और सेट करने के लिए पुनरावृत्तियों की संख्या को परिभाषित करते हैं।

  3. फिर मैं 5 परिदृश्यों के तहत डेटा का अनुकरण करता हूं:

    1. दोनों वितरण सामान्य हैं।
    2. दोनों वितरण दाईं ओर तिरछे हैं।
    3. दोनों वितरण बाईं ओर तिरछे हैं।
    4. पहला वितरण बाईं ओर तिरछा है, दूसरा दाईं ओर।
    5. पहला वितरण दाईं ओर तिरछा होता है, दूसरा बाईं ओर।

    ध्यान दें कि मैं तिरछा वितरण उत्पन्न करने के लिए ची-वर्गीय वितरण का उपयोग कर रहा हूं। स्वतंत्रता की एक डिग्री के साथ, वे भारी तिरछे वितरण हैं। चूँकि एक डिग्री स्वतंत्रता के साथ ची-स्क्वायर्ड वितरण का सही मतलब और विचरण क्रमशः 1 और 2 के बराबर है, ( विकिपीडिया देखें ), मैं उन वितरणों को पहले 0 और मानक विचलन 1 के बराबर करता हूं और फिर उन्हें फिर से व्यवस्थित करने के लिए बचाता हूं वांछित वास्तविक माध्य और मानक विचलन (यह एक चरण में किया जा सकता है, लेकिन इसे इस तरह से करना स्पष्ट हो सकता है)।

  4. प्रत्येक मामले में, मैं टी-टेस्ट (वेल्च का संस्करण लागू करता हूं - एक छात्र के संस्करण पर भी विचार कर सकता है जो दो समूहों में बराबर भिन्नताएं ग्रहण करता है) और पहले स्थापित किए गए वैक्टरों के लिए पी-मान को बचा सकता है।

  5. अंत में, एक बार सभी पुनरावृत्तियों के पूरा होने के बाद, मैं प्रत्येक वेक्टर के लिए गणना करता हूं कि पी-मान कितनी बार या .05 के बराबर है (यानी, परीक्षण "महत्वपूर्ण" है)। यह अनुभवजन्य अस्वीकृति दर है।

कुछ परिणाम

  1. पैदावार के ऊपर बताए अनुसार अनुकरण करना:

       p1    p2    p3    p4    p5 
    0.049 0.048 0.047 0.070 0.070
    

    α=.05

  2. यदि हम कोड को बदल देते हैं mu1 <- .5, तो हम प्राप्त करते हैं:

       p1    p2    p3    p4    p5 
    0.574 0.610 0.606 0.592 0.602
    

    इसलिए, उस मामले की तुलना में जहां दोनों वितरण सामान्य हैं (जैसा कि परीक्षण द्वारा माना गया है), वास्तव में शक्ति थोड़ी अधिक दिखाई देती है जब तिरछा एक ही दिशा में होता है! यदि आप इससे आश्चर्यचकित हैं, तो आप इसे कुछ समय (निश्चित रूप से, हर बार थोड़ा अलग परिणाम प्राप्त करना) पुन: प्राप्त करना चाह सकते हैं, लेकिन पैटर्न बना रहेगा।

    ध्यान दें कि हमें दो परिदृश्यों के तहत अनुभवजन्य शक्ति मूल्यों की व्याख्या करने में सावधानी बरतनी है, जहां तिरछा विपरीत दिशाओं में है, चूंकि टाइप I त्रुटि दर काफी नाममात्र नहीं है (एक चरम मामले के रूप में, मुझे लगता है कि मैं हमेशा खारिज करता हूं कि डेटा क्या है दिखाओ, तो मेरे पास हमेशा अधिकतम शक्ति के साथ एक परीक्षण होगा, लेकिन निश्चित रूप से परीक्षण में एक फुलाया हुआ टाइप I त्रुटि दर भी है)।

एक mu1(और mu2- लेकिन वास्तव में दोनों के बीच अंतर क्या है) के लिए मूल्यों की एक सीमा की खोज शुरू कर सकता है और, इससे भी महत्वपूर्ण बात यह है कि दो समूहों (यानी, sd1और sd2) के वास्तविक मानक विचलन को बदलना शुरू करें और विशेष रूप से उन्हें असमान बना दें। मैं ओपी द्वारा बताए गए नमूने के आकारों में भी फंस गया, लेकिन निश्चित रूप से इसे भी समायोजित किया जा सकता है। और तिरछी निगाह से कई अन्य रूप ले सकते हैं, जो हमें चि-स्क्वेरड वितरण में एक डिग्री की स्वतंत्रता के साथ दिखाई देते हैं। मुझे अभी भी लगता है कि इस तरह से चीजों को प्राप्त करना उपयोगी है, इस तथ्य के बावजूद कि यह निश्चित उत्तर नहीं दे सकता है।


2
चूंकि आजकल हमारे पास मजबूत अर्ध-पैरामीट्रिक तरीकों की एक सरणी है, इसलिए यह चर्चा इतनी सार्थक क्यों है?
फ्रैंक हरेल

(+1) मुझे लगता है कि यह उस मामले के लायक हो सकता है जहां एक नमूना तिरछी आबादी से खींचा गया था और दूसरा नहीं था, जैसा कि ओपी ने सोचा था कि यह उनके डेटा के लिए हो सकता है। लेकिन स्पष्ट कोड वाला उत्तर देखना अच्छा है। (एक मामूली सामान्यीकरण वास्तव में एक पाठक को यह जांचने की अनुमति देगा कि पारंपरिक टी-टेस्ट की तुलना में कितनी अच्छी विधियां हैं, जो एक उपयोगी शैक्षणिक अभ्यास है यदि आप किसी को परीक्षण लागू करने के खतरों को सिखाने की कोशिश कर रहे हैं, जिसकी मान्यताओं का उल्लंघन किया गया है .. ।)
सिल्वरफ़िश

2

आपकी स्थिति में, टाइप-आई त्रुटि दर के संदर्भ में टी-टेस्ट मजबूत होगा, लेकिन टाइप II त्रुटि दर नहीं। आप शायद या तो) a के माध्यम से अधिक शक्ति प्राप्त करेंगे) एक Kr -kal-Wallis परीक्षण, या b) टी-परीक्षण से पहले एक सामान्य परिवर्तन।

मैं इस निष्कर्ष को दो मोंटे कार्लो अध्ययनों पर आधारित कर रहा हूं। पहले ( खान और रेनेर, 2003 ) में, तिरछा और कुर्तोसिस को अप्रत्यक्ष रूप से जी-एंड-के वितरण परिवार के मापदंडों के माध्यम से हेरफेर किया गया था, और परिणामी शक्ति की जांच की गई थी। महत्वपूर्ण रूप से, Kruskal- वालिस परीक्षण की शक्ति गैर-सामान्यता से कम क्षतिग्रस्त थी, विशेष रूप से n> = 15 के लिए।

इस अध्ययन के बारे में कुछ गुहिकायन / योग्यताएं: पावर अक्सर उच्च कर्टोसिस द्वारा चोट लगी थी, लेकिन यह तिरछा से कम प्रभावित था। पहली नज़र में, यह पैटर्न आपकी स्थिति के लिए कम प्रासंगिक लग सकता है, यह देखते हुए कि आपको तिरछी समस्या पर ध्यान देना चाहिए, न कि कर्टोसिस। हालाँकि, मैं शर्त लगा रहा हूं कि आपके मामले में अतिरिक्त कुर्तोसिस भी चरम पर है। ध्यान रखें कि अतिरिक्त कर्टोसिस कम से कम तिरछा ^ 2 - 2 के बराबर होगा। (अतिरिक्त कुर्तोसिस को 4 वाँ मानकीकृत क्षण शून्य से 3 के बराबर करें, ताकि सामान्य वितरण के लिए अतिरिक्त कुर्तोसिस = 0 हो।) ध्यान दें कि खान और रेनेर भी। 2003) ने 3 समूहों के साथ ANOVAs की जांच की, लेकिन उनके परिणाम दो-नमूना टी-परीक्षण के सामान्य होने की संभावना है।

एक दूसरा प्रासंगिक अध्ययन ( ब्यासली, एरिकसन, और एलीसन, 2009) विभिन्न गैर-सामान्य वितरणों के साथ टाइप I और टाइप II त्रुटियों की जांच की, जैसे कि ची-स्क्वेर (1) और वेइबुल (1, .5)। कम से कम 25 के नमूने के आकार के लिए, टी-टेस्ट ने नाममात्र अल्फा स्तर पर या उससे नीचे टाइप I त्रुटि दर को पर्याप्त रूप से नियंत्रित किया। हालाँकि, शक्ति एक क्रुस्ल-वालिस परीक्षण के साथ या रैंक-आधारित उलटा सामान्य परिवर्तन (ब्लूम स्कोर) के साथ सबसे अधिक था, जो टी-टेस्ट से पहले लागू किया गया था। बेज़ले और सहकर्मियों ने आम तौर पर सामान्यीकरण दृष्टिकोण के खिलाफ तर्क दिया, लेकिन यह ध्यान दिया जाना चाहिए कि सामान्यीकरण दृष्टिकोण ने n> = 25 के लिए टाइप I त्रुटि दर को नियंत्रित किया, और इसकी शक्ति कभी-कभी क्रुस्ल-वालिस परीक्षण से थोड़ा अधिक हो गई। यही है, सामान्यीकरण दृष्टिकोण आपकी स्थिति के लिए आशाजनक लगता है। विवरण के लिए उनके लेख में तालिका 1 और 4 देखें।

संदर्भ:

खान, ए।, और रेनेर, जीडी (2003) । कई-नमूना स्थान समस्या के लिए सामान्य परीक्षणों की गैर-सामान्यता के लिए तीव्रता। एप्लाइड गणित और निर्णय विज्ञान के जर्नल, 7 , 187-206।

बेज़ले, टीएम, एरिकसन, एस।, और एलीसन, डीबी (2009) । रैंक-आधारित उलटा सामान्य परिवर्तनों का तेजी से उपयोग किया जाता है, लेकिन क्या वे मेरिटेड हैं? व्यवहार जेनेटिक्स, 39 , 580-595।


(अधिकता) कर्टोसिसतिरछा2-2

ऐसा लगता है कि यह एक प्रश्न के योग्य है जो स्वयं का धागा है। शायद आपकी चिंता यह है कि अतिरिक्त कर्टोसिस नीचे छोटे नमूनों में पक्षपाती होगा? बेशक, यह भी ऊपर सिमुलेशन अध्ययन में मामला था, और कुर्तोसिस अभी भी उन स्थितियों में टी-टेस्ट में कम शक्ति का कारण बना। आपका प्रश्न अधिकांश मोंटे कार्लो अध्ययनों के एक अधिक सामान्य सीमा की ओर इशारा करता है: निष्कर्ष अक्सर जनसंख्या विशेषताओं, विशेषताओं पर आधारित होते हैं जो लागू शोधकर्ता निरीक्षण नहीं कर सकते। नमूना तिरछा, कुर्तोसिस, आदि के आधार पर सापेक्ष शक्ति की भविष्यवाणी करने में सक्षम होने के लिए यह अधिक उपयोगी होगा
एंथनी

मैंने इस मुद्दे के बारे में एक अलग प्रश्न पोस्ट किया है: आंकड़े.stackexchange.com/questions/133247/…
एंथनी

0

सबसे पहले, यदि आप मानते हैं कि दो नमूनों का वितरण अलग-अलग है, तो सुनिश्चित करें कि आप टी-टेस्ट के वेल्च संस्करण का उपयोग कर रहे हैं जो समूहों के बीच असमान भिन्नताओं को मानता है। यह कम से कम वितरण के कारण होने वाले कुछ अंतरों को ध्यान में रखने का प्रयास होगा।

यदि हम वेल्च के परीक्षण के सूत्र को देखें:

टी=एक्स¯1-एक्स¯2रोंएक्स¯1-एक्स¯2

रोंएक्स¯1-एक्स¯2

रोंएक्स¯1-एक्स¯2=रों12n1+रों22n2

हम देख सकते हैं कि हर बार एक एस है जिसे हम जानते हैं कि विचरण को ध्यान में रखा जा रहा है। आइए कल्पना करें कि दो संस्करण वास्तव में एक ही हैं, लेकिन एक तिरछा है, जिसके कारण भिन्न भिन्नता अनुमान है। यदि तिरछेपन के कारण विचरण का यह अनुमान वास्तव में आपके डेटा का प्रतिनिधि नहीं है, तो वास्तव में पूर्वाग्रह प्रभाव वास्तव में गणना करने के लिए उपयोग किए जाने वाले डेटा बिंदुओं की संख्या से विभाजित उस पूर्वाग्रह का वर्ग-मूल होगा। इस प्रकार विचरण के बुरे अनुमानकों के प्रभाव को वर्ग-मूल और उच्च n द्वारा थोड़ा सा फेरबदल किया जाता है, और शायद इसीलिए सर्वसम्मति है कि यह एक मजबूत परीक्षा है।

तिरछे वितरण का अन्य मुद्दा यह है कि माध्य गणना भी प्रभावित होगी, और संभवतः यही वह जगह है जहां परीक्षण धारणा के उल्लंघन की वास्तविक समस्याएं हैं क्योंकि साधन तिरछे होने के लिए अपेक्षाकृत संवेदनशील हैं। और परीक्षण की मजबूती को मोटे तौर पर अंतर की गणना के माध्यम से निर्धारित किया जा सकता है, जो कि मध्यस्थों (एक विचार के रूप में) की तुलना में है। शायद आप एक अधिक मजबूत माप के रूप में टी-टेस्ट में मध्यस्थों के अंतर से साधनों में अंतर को बदलने का प्रयास भी कर सकते हैं (मुझे यकीन है कि किसी ने इस पर चर्चा की है, लेकिन मुझे Google पर जल्दी से लिंक करने के लिए पर्याप्त रूप से कुछ नहीं मिला)।

मैं यह भी सुझाव दूंगा कि यदि आप कर रहे हैं तो एक क्रमपरिवर्तन परीक्षा चल रही है। क्रमपरिवर्तन परीक्षण एक सटीक परीक्षण है, जो वितरण मान्यताओं से स्वतंत्र है। सबसे महत्वपूर्ण बात, क्रमपरिवर्तन परीक्षण और टी-टेस्ट से समान परिणाम प्राप्त होंगे यदि पैरामीट्रिक परीक्षण की धारणाएं पूरी होती हैं । इसलिए, आपके द्वारा मांग की जाने वाली मजबूती की माप 1 हो सकती है - क्रमपरिवर्तन और टी-टेस्ट पी-मानों के बीच का अंतर, जहां 1 का स्कोर सही मजबूती का अर्थ है और 0 का तात्पर्य मजबूत नहीं है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.