विलकॉक्सन की नियुक्ति रैंक टेस्ट पर हस्ताक्षर किए


11

मैंने क्रॉस वेलिडेट अभिलेखागार में थोड़ा सा चारों ओर पसरा है और मुझे अपने प्रश्न का उत्तर नहीं मिला है। मेरा प्रश्न निम्नलिखित है: विकिपीडिया तीन मान्यताएँ देता है जिनके लिए विलकॉक्सन हस्ताक्षरित रैंक परीक्षण की आवश्यकता है (मेरे प्रश्नों के लिए थोड़ा संशोधित):

आई = 1, ..., n के लिए Zi = Xi-Yi दें।

  1. मतभेद Zi को स्वतंत्र माना जाता है।

  2. (a।) प्रत्येक Zi एक ही निरंतर जनसंख्या से आता है, और (b) प्रत्येक Zi एक सामान्य माध्यिका के बारे में सममित है;

  3. जिन मूल्यों पर शी और यी प्रतिनिधित्व करते हैं, उन्हें आदेश दिया जाता है ... इसलिए तुलना 'से अधिक', 'से कम' और 'के बराबर' उपयोगी होती है।

आर में wilcox.test के लिए प्रलेखन, हालांकि, संकेत मिलता है कि (2. बी) वास्तव में कुछ ऐसा है जिसे प्रक्रिया में परीक्षण किया गया है:

"... यदि x और y दोनों दिए गए हैं और युग्मित है TRUE, एक विलकॉक्सन ने नल के रैंक परीक्षण पर हस्ताक्षर किए हैं कि वितरण ... x - y (युग्मित दो नमूना मामले में) म्यू के बारे में सममित है।"

यह मेरे लिए ऐसा लगता है जैसे परीक्षण शून्य परिकल्पना के लिए किया जाता है कि "Z, मध्यमा म्यू = SomeMu के आसपास सहानुभूतिपूर्वक वितरित किया गया है - जैसे कि नल के लिए अस्वीकृति समरूपता या अस्वीकृति की अस्वीकृति हो सकती है या म्यू जिसके आसपास Z सममिति है SomeMu है।

क्या यह wilcox.test के लिए R प्रलेखन की सही समझ है? यह महत्वपूर्ण कारण है, निश्चित रूप से, यह है कि मैं कुछ पहले और बाद के डेटा ("एक्स" और "वाई" उपरोक्त) पर कई युग्मित-अंतर परीक्षण कर रहा हूं। "पहले" और "बाद में" डेटा व्यक्तिगत रूप से अत्यधिक तिरछा होता है, लेकिन मतभेदों को लगभग उतना ही तिरछा नहीं किया जाता है (हालांकि अभी भी कुछ हद तक तिरछा है)। इसके द्वारा मेरा मतलब है कि "पहले" या "के बाद" डेटा अकेले माना जाता है तिरछा है ~ 7 से 21 (नमूना मैं देख रहा हूँ पर निर्भर करता है), जबकि "मतभेद" डेटा में तिरछा ~ = 0.5 से 5. अभी भी तिरछा है, लेकिन लगभग उतना नहीं।

यदि मेरे "मतभेद" डेटा में तिरछापन होने से मुझे गलत / पक्षपाती परिणाम देने के लिए विलकॉक्सन परीक्षण का कारण होगा (जैसा कि विकिपीडिया लेख इंगित करता है), तो तिरछापन एक बड़ी चिंता का विषय हो सकता है। यदि, हालांकि, विलकॉक्सन परीक्षण वास्तव में परीक्षण कर रहे हैं कि क्या अंतर वितरण "म्यू = सममैटिक के आसपास सममित" है (जैसा? Wilcox.test इंगित करता है) तो यह एक चिंता का विषय है।

इस प्रकार मेरे प्रश्न हैं:

  1. ऊपर कौन सी व्याख्या सही है? क्या मेरे "मतभेद" वितरण में तिरछापन मेरे विलकॉक्सन परीक्षण के पूर्वाग्रह के लिए जा रहा है?

  2. अगर तिरछा होना एक चिंता है: "एक तिरछापन कितना चिंता का विषय है?"

  3. अगर विलकॉक्सन के रैंक टेस्ट पर हस्ताक्षर किए गए हैं, तो यहां मुझे बहुत अनुचित लगता है, मुझे क्या उपयोग करना चाहिए, इसके लिए कोई सुझाव?

बहुत बहुत धन्यवाद। यदि आपके पास इस बारे में कोई और सुझाव है कि मैं इस विश्लेषण को कैसे कर सकता हूं तो मैं उन्हें सुनने से ज्यादा खुश हूं (हालांकि मैं इस उद्देश्य के लिए एक और धागा भी खोल सकता हूं)। इसके अलावा, यह मेरा पहला सवाल है क्रॉस वैलिडेट पर; यदि आपके पास इस सवाल का सुझाव / टिप्पणी है, तो मैं इसके लिए भी खुला हूं!


एक छोटी पृष्ठभूमि: मैं एक डेटासेट का विश्लेषण कर रहा हूं, जिसमें इस बात का अवलोकन है कि मैं "फर्म उत्पादन में त्रुटियों" को क्या कहूंगा। मैं औचक निरीक्षण से पहले और बाद में उत्पादन प्रक्रिया में होने वाली त्रुटियों पर अवलोकन करता हूं, और विश्लेषण के लक्ष्यों में से एक सवाल का जवाब देना है, "क्या निरीक्षण त्रुटियों की संख्या में अंतर करता है?"

डेटा सेट कुछ इस तरह दिखता है:

ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0 
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0

लगभग 4000 अवलोकन हैं। अन्य चर प्रलयकारी अवलोकन हैं जो फर्मों की विशेषताओं का वर्णन करते हैं। आकार छोटा, मध्यम या बड़ा हो सकता है, और प्रत्येक फर्म एक और उनमें से केवल एक है। फर्म किसी भी या सभी प्रकार के हो सकते हैं।

मुझे यह देखने के लिए कुछ सरल परीक्षणों को चलाने के लिए कहा गया था कि क्या सभी फर्मों और विभिन्न उप-समूहों (आकार और प्रकार के आधार पर) के निरीक्षण के पहले और बाद में सांख्यिकीय रूप से महत्वपूर्ण अंतर थे। T- परीक्षण बाहर थे क्योंकि डेटा को पहले और बाद में दोनों तरह से तिरछा किया गया था, उदाहरण के लिए, R में पहले डेटा कुछ इस तरह दिखता था:

summary(errorsBefore)
# Min.  1st Qu.  Median   Mean  3rd Qu.    Max
# 0.000  0.000    4.000  12.00    13.00  470.0

(ये बनाए गए हैं - मुझे डर है कि मैं मालिकाना / गोपनीयता मुद्दों (मेरी भावनाओं) के कारण वास्तविक डेटा या इसके किसी भी वास्तविक जोड़तोड़ को पोस्ट नहीं कर सकता हूं!)

युग्मित अंतर अधिक केंद्रीकृत थे लेकिन फिर भी एक सामान्य वितरण द्वारा बहुत अच्छी तरह से फिट नहीं थे - अब तक भी चरम पर। अंतर डेटा कुछ इस तरह से देखा गया:

summary(errorsBefore-errorsAfter)
# Min.   1st Qu.  Median   Mean  3rd Qu.    Max
# -110.0  -2.000   0.000  0.005   2.000   140.0

यह सुझाव दिया गया था कि मैं एक विल्कोक्सन हस्ताक्षरित रैंक परीक्षण का उपयोग करता हूं, और wilcox.test और विकिपीडिया के संक्षिप्त विवरण के बाद, और यहां, यह उपयोग करने के लिए परीक्षण जैसा लगता है। उपरोक्त मान्यताओं को ध्यान में रखते हुए, मेरा मानना ​​है कि (1) डेटा जनरेट करने की प्रक्रिया को ठीक करता है। अनुमान (2.a) मेरे डेटा के लिए कड़ाई से सही नहीं है, लेकिन यहां चर्चा: वितरण के निरंतर होने पर विलकॉक्सन टेस्ट के लिए वैकल्पिक? ऐसा लगता है कि यह बहुत चिंता का विषय नहीं था। मान्यता (3) ठीक है। मेरी एकमात्र चिंता (मेरा मानना ​​है) मान लिया गया है (2. बी)।

एक अतिरिक्त ध्यान दें , कुछ साल बाद: मैंने अंततः एक उत्कृष्ट गैर-पैरामीट्रिक सांख्यिकी पाठ्यक्रम लिया और रैंक-योग परीक्षणों पर बहुत समय बिताया। धारणा (२. अ) में एंबेडेड, "प्रत्येक ज़ी एक ही निरंतर जनसंख्या से आता है", यह विचार है कि दोनों नमूने समान जनसंख्या के साथ आबादी से आते हैं - यह अत्यंत महत्वपूर्ण है, व्यावहारिक रूप से बोल रहा है। यदि आपको अपनी आबादी में भिन्नता के बारे में चिंता है (जिसमें आप नमूने खींचते हैं), तो आपको WMW का उपयोग करने के बारे में चिंतित होना चाहिए।


दो उत्तर के लिए धन्यवाद! वे दोनों काफी समान रूप से मेरी मदद करते थे। अगर मैं कर सकता था तो मैंने "दोनों को चुना"। माइक ने मुझे कुछ सैद्धांतिक समझ की ओर इशारा किया, जो वैचारिक रूप से बहुत मददगार था, भले ही एनिको मेरे मूल प्रश्न का उत्तर देने में थोड़ा अधिक था। तुम दोनों का धन्यवाद!
CompEcon

जवाबों:


8

विकिपीडिया ने आपको बताते हुए कहा कि "... यदि x और y दोनों दिए गए हैं और युग्मित है TRUE, तो एक विलकॉक्सन ने नल के रैंक परीक्षण पर हस्ताक्षर किए हैं कि वितरण ... x - y (युग्मित दो नमूना मामले में) सममित है। म्यू के बारे में किया जाता है। "

परीक्षण निर्धारित करता है कि क्या का RANK-TRANSFORMED मान आपके नल की परिकल्पना में निर्दिष्ट माध्य के आसपास सममित है (मेरा मानना ​​है कि आप शून्य का उपयोग करेंगे)। स्केवनेस एक समस्या नहीं है, क्योंकि हस्ताक्षरित परीक्षण, अधिकांश गैर-पैरामीट्रिक परीक्षणों की तरह, "वितरण मुक्त" है। इन परीक्षणों के लिए आपके द्वारा भुगतान की जाने वाली कीमत अक्सर कम हो जाती है, लेकिन ऐसा लगता है कि आपके पास इसे पार करने के लिए एक बड़ा नमूना है।zi=xiyi

रैंक-सम टेस्ट के लिए एक " द हेल" विकल्प एक साधारण परिवर्तन की कोशिश करने का हो सकता है, जैसे ऑफ ले मौके पर और जैसे कि ये माप मोटे तौर पर एक असामान्य वितरण का अनुसरण कर सकते हैं - इसलिए लॉग इन मूल्यों को "बेल वक्र" दिखना चाहिए। तब आप परीक्षण में उपयोग कर सकते हैं और अपने आप को (और आपके बॉस को जिन्होंने केवल बिजनेस स्टैट्स लिया है) को समझा सकते हैं कि रैंक-सम टेस्ट काम कर रहा है। यदि यह काम करता है, तो एक बोनस है: लॉगऑनॉर्मल डेटा के लिए साधनों पर टी टेस्ट मूल, अनियंत्रित, माप के लिए मध्यस्थों की तुलना है।ln ( y i )ln(xi)ln(yi)

मेरे? मैं दोनों करता हूँ, और मैं और कुछ भी कर सकता हूँ (संभावना है कि पोइसन काउंट्स पर पुख्ता आकार के हिसाब से अनुपात परीक्षण?)। परिकल्पना परीक्षण यह निर्धारित करने के बारे में है कि क्या सबूत कायल हैं, और कुछ लोग कांफिनेंस का ढेर लगाते हैं।


आह, यह बहुत मायने रखता है। विशेष रूप से अब जब मैंने घर प्राप्त कर लिया है और अपने पुराने डीग्रोट एंड शेरविश पाठ्यपुस्तक को बाहर निकाल लिया है, जिसमें इस बात का अच्छा विवरण है कि ये हस्ताक्षर परीक्षण वास्तव में क्या कर रहे हैं। बहुत खुबस। और परिकल्पना परीक्षण पर सामान्य विचारों के लिए धन्यवाद :) मुझे परिप्रेक्ष्य पसंद है। एक मामूली नोट: भ्रामक के रूप में आप जिस हिस्से को नोट करते हैं, वह वास्तव में आर से है, डॉक्यूमेंट से wilcox.test के लिए। यह मेरे लिए थोड़ा परेशान करने वाला है ...
CompEcon

9

विकिपीडिया और R मदद पृष्ठ दोनों ही तरह के सही हैं और एक ही चीज़ को बताने की कोशिश कर रहे हैं, वे इसे अलग तरह से वाक्यांश देते हैं।

विकिपीडिया लेख परिकल्पना के अनुसार (माध्य = ०) बनाम (माध्यक! = ०) बताता है, और कहता है कि यदि आप अंतर सममित वितरण (+ अन्य धारणाएँ) हैं तो आप परीक्षण से यह निष्कर्ष निकाल सकते हैं।

R मदद पृष्ठ अधिक विशिष्ट है, यह परिकल्पना को बताता है (मध्य = 0 और अंतरों का एक सममित वितरण है) बनाम (कम से कम एक गलत है)। तो यह एक धारणा को परिकल्पना में बदल दिया। मुझे लगता है कि उन्होंने समरूपता की आवश्यकता पर जोर देने के लिए ऐसा किया है: तिरछे मतभेदों के साथ हस्ताक्षरित-रैंक परीक्षण शून्य परिकल्पना को अस्वीकार कर देगा, भले ही मंझला मर गया हो। यदि आप एक पाठ्यपुस्तक पढ़ते हैं, तो यह भी आपको बता सकता है कि परीक्षण की जा रही शून्य परिकल्पना P (X> Y) = 0.5 है - बाकी वास्तव में बस इसी से अनुसरण करते हैं।

आवेदन के संदर्भ में, सवाल यह है कि क्या आप विशेष रूप से मध्यिका के बारे में परवाह करते हैं (और फिर तिरछापन एक समस्या है, और माध्य परीक्षण एक संभावित विकल्प है), या क्या आप पूरे वितरण के बारे में परवाह करते हैं, और फिर पी (एक्स> y)! = 0.5 परिवर्तन का प्रमाण है।


1
ठीक है, यह समझ में आता है। इनपुट के लिए धन्यवाद! मैंने ध्यान दिया कि माध्यिका परीक्षण के लिए विकिपीडिया पृष्ठ कहता है कि गैर-युग्मित मान-व्हिटनी-यू परीक्षण पसंद किया जाता है। यह तुरंत मुझे लगता है कि मैं वापस जहाँ मैं शुरू कर रहा हूँ की तरह बनाता है, यह सोचते हुए कि युग्मित विलकॉक्सन परीक्षण किसी भी तरह से अधिक जानकारी का उपयोग करता है। शायद जो मैं वास्तव में सोचने की कोशिश कर रहा हूं, उसका मतलब यह है कि जब आप कहते हैं "विशेष रूप से मंझले के बारे में देखभाल ... या संपूर्ण वितरण के बारे में।" मैं पूरे वितरण के बारे में परवाह करता हूं, लेकिन औसत दर्जे के माध्यम से इसे चित्रित कर रहा
हूं
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.