मैंने क्रॉस वेलिडेट अभिलेखागार में थोड़ा सा चारों ओर पसरा है और मुझे अपने प्रश्न का उत्तर नहीं मिला है। मेरा प्रश्न निम्नलिखित है: विकिपीडिया तीन मान्यताएँ देता है जिनके लिए विलकॉक्सन हस्ताक्षरित रैंक परीक्षण की आवश्यकता है (मेरे प्रश्नों के लिए थोड़ा संशोधित):
आई = 1, ..., n के लिए Zi = Xi-Yi दें।
मतभेद Zi को स्वतंत्र माना जाता है।
(a।) प्रत्येक Zi एक ही निरंतर जनसंख्या से आता है, और (b) प्रत्येक Zi एक सामान्य माध्यिका के बारे में सममित है;
जिन मूल्यों पर शी और यी प्रतिनिधित्व करते हैं, उन्हें आदेश दिया जाता है ... इसलिए तुलना 'से अधिक', 'से कम' और 'के बराबर' उपयोगी होती है।
आर में wilcox.test के लिए प्रलेखन, हालांकि, संकेत मिलता है कि (2. बी) वास्तव में कुछ ऐसा है जिसे प्रक्रिया में परीक्षण किया गया है:
"... यदि x और y दोनों दिए गए हैं और युग्मित है TRUE, एक विलकॉक्सन ने नल के रैंक परीक्षण पर हस्ताक्षर किए हैं कि वितरण ... x - y (युग्मित दो नमूना मामले में) म्यू के बारे में सममित है।"
यह मेरे लिए ऐसा लगता है जैसे परीक्षण शून्य परिकल्पना के लिए किया जाता है कि "Z, मध्यमा म्यू = SomeMu के आसपास सहानुभूतिपूर्वक वितरित किया गया है - जैसे कि नल के लिए अस्वीकृति समरूपता या अस्वीकृति की अस्वीकृति हो सकती है या म्यू जिसके आसपास Z सममिति है SomeMu है।
क्या यह wilcox.test के लिए R प्रलेखन की सही समझ है? यह महत्वपूर्ण कारण है, निश्चित रूप से, यह है कि मैं कुछ पहले और बाद के डेटा ("एक्स" और "वाई" उपरोक्त) पर कई युग्मित-अंतर परीक्षण कर रहा हूं। "पहले" और "बाद में" डेटा व्यक्तिगत रूप से अत्यधिक तिरछा होता है, लेकिन मतभेदों को लगभग उतना ही तिरछा नहीं किया जाता है (हालांकि अभी भी कुछ हद तक तिरछा है)। इसके द्वारा मेरा मतलब है कि "पहले" या "के बाद" डेटा अकेले माना जाता है तिरछा है ~ 7 से 21 (नमूना मैं देख रहा हूँ पर निर्भर करता है), जबकि "मतभेद" डेटा में तिरछा ~ = 0.5 से 5. अभी भी तिरछा है, लेकिन लगभग उतना नहीं।
यदि मेरे "मतभेद" डेटा में तिरछापन होने से मुझे गलत / पक्षपाती परिणाम देने के लिए विलकॉक्सन परीक्षण का कारण होगा (जैसा कि विकिपीडिया लेख इंगित करता है), तो तिरछापन एक बड़ी चिंता का विषय हो सकता है। यदि, हालांकि, विलकॉक्सन परीक्षण वास्तव में परीक्षण कर रहे हैं कि क्या अंतर वितरण "म्यू = सममैटिक के आसपास सममित" है (जैसा? Wilcox.test इंगित करता है) तो यह एक चिंता का विषय है।
इस प्रकार मेरे प्रश्न हैं:
ऊपर कौन सी व्याख्या सही है? क्या मेरे "मतभेद" वितरण में तिरछापन मेरे विलकॉक्सन परीक्षण के पूर्वाग्रह के लिए जा रहा है?
अगर तिरछा होना एक चिंता है: "एक तिरछापन कितना चिंता का विषय है?"
अगर विलकॉक्सन के रैंक टेस्ट पर हस्ताक्षर किए गए हैं, तो यहां मुझे बहुत अनुचित लगता है, मुझे क्या उपयोग करना चाहिए, इसके लिए कोई सुझाव?
बहुत बहुत धन्यवाद। यदि आपके पास इस बारे में कोई और सुझाव है कि मैं इस विश्लेषण को कैसे कर सकता हूं तो मैं उन्हें सुनने से ज्यादा खुश हूं (हालांकि मैं इस उद्देश्य के लिए एक और धागा भी खोल सकता हूं)। इसके अलावा, यह मेरा पहला सवाल है क्रॉस वैलिडेट पर; यदि आपके पास इस सवाल का सुझाव / टिप्पणी है, तो मैं इसके लिए भी खुला हूं!
एक छोटी पृष्ठभूमि: मैं एक डेटासेट का विश्लेषण कर रहा हूं, जिसमें इस बात का अवलोकन है कि मैं "फर्म उत्पादन में त्रुटियों" को क्या कहूंगा। मैं औचक निरीक्षण से पहले और बाद में उत्पादन प्रक्रिया में होने वाली त्रुटियों पर अवलोकन करता हूं, और विश्लेषण के लक्ष्यों में से एक सवाल का जवाब देना है, "क्या निरीक्षण त्रुटियों की संख्या में अंतर करता है?"
डेटा सेट कुछ इस तरह दिखता है:
ID, errorsBefore, errorsAfter, size_large, size_medium, typeA, typeB, typeC, typeD
0123,1,1,1,0,1,1,1,0
2345,1,0,0,0,0,1,1,0
6789,2,1,0,1,0,1,0,0
1234,8,8,0,0,1,0,0,0
लगभग 4000 अवलोकन हैं। अन्य चर प्रलयकारी अवलोकन हैं जो फर्मों की विशेषताओं का वर्णन करते हैं। आकार छोटा, मध्यम या बड़ा हो सकता है, और प्रत्येक फर्म एक और उनमें से केवल एक है। फर्म किसी भी या सभी प्रकार के हो सकते हैं।
मुझे यह देखने के लिए कुछ सरल परीक्षणों को चलाने के लिए कहा गया था कि क्या सभी फर्मों और विभिन्न उप-समूहों (आकार और प्रकार के आधार पर) के निरीक्षण के पहले और बाद में सांख्यिकीय रूप से महत्वपूर्ण अंतर थे। T- परीक्षण बाहर थे क्योंकि डेटा को पहले और बाद में दोनों तरह से तिरछा किया गया था, उदाहरण के लिए, R में पहले डेटा कुछ इस तरह दिखता था:
summary(errorsBefore)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# 0.000 0.000 4.000 12.00 13.00 470.0
(ये बनाए गए हैं - मुझे डर है कि मैं मालिकाना / गोपनीयता मुद्दों (मेरी भावनाओं) के कारण वास्तविक डेटा या इसके किसी भी वास्तविक जोड़तोड़ को पोस्ट नहीं कर सकता हूं!)
युग्मित अंतर अधिक केंद्रीकृत थे लेकिन फिर भी एक सामान्य वितरण द्वारा बहुत अच्छी तरह से फिट नहीं थे - अब तक भी चरम पर। अंतर डेटा कुछ इस तरह से देखा गया:
summary(errorsBefore-errorsAfter)
# Min. 1st Qu. Median Mean 3rd Qu. Max
# -110.0 -2.000 0.000 0.005 2.000 140.0
यह सुझाव दिया गया था कि मैं एक विल्कोक्सन हस्ताक्षरित रैंक परीक्षण का उपयोग करता हूं, और wilcox.test और विकिपीडिया के संक्षिप्त विवरण के बाद, और यहां, यह उपयोग करने के लिए परीक्षण जैसा लगता है। उपरोक्त मान्यताओं को ध्यान में रखते हुए, मेरा मानना है कि (1) डेटा जनरेट करने की प्रक्रिया को ठीक करता है। अनुमान (2.a) मेरे डेटा के लिए कड़ाई से सही नहीं है, लेकिन यहां चर्चा: वितरण के निरंतर होने पर विलकॉक्सन टेस्ट के लिए वैकल्पिक? ऐसा लगता है कि यह बहुत चिंता का विषय नहीं था। मान्यता (3) ठीक है। मेरी एकमात्र चिंता (मेरा मानना है) मान लिया गया है (2. बी)।
एक अतिरिक्त ध्यान दें , कुछ साल बाद: मैंने अंततः एक उत्कृष्ट गैर-पैरामीट्रिक सांख्यिकी पाठ्यक्रम लिया और रैंक-योग परीक्षणों पर बहुत समय बिताया। धारणा (२. अ) में एंबेडेड, "प्रत्येक ज़ी एक ही निरंतर जनसंख्या से आता है", यह विचार है कि दोनों नमूने समान जनसंख्या के साथ आबादी से आते हैं - यह अत्यंत महत्वपूर्ण है, व्यावहारिक रूप से बोल रहा है। यदि आपको अपनी आबादी में भिन्नता के बारे में चिंता है (जिसमें आप नमूने खींचते हैं), तो आपको WMW का उपयोग करने के बारे में चिंतित होना चाहिए।