मैं सवालों के क्रम को बदलने जा रहा हूं।
मैंने पाठ्यपुस्तकों और व्याख्यान नोटों को अक्सर असहमत पाया है, और पसंद के माध्यम से काम करने के लिए एक प्रणाली चाहेंगे जो सुरक्षित रूप से सर्वोत्तम अभ्यास के रूप में अनुशंसित किया जा सकता है, और विशेष रूप से एक पाठ्यपुस्तक या पेपर जिसे यह उद्धृत किया जा सकता है।
दुर्भाग्य से, पुस्तकों में इस मुद्दे की कुछ चर्चाएँ और प्राप्त ज्ञान पर निर्भर हैं। कभी-कभी जो ज्ञान प्राप्त होता है वह उचित होता है, कभी-कभी यह कम होता है (कम से कम इस अर्थ में कि यह एक छोटी सी समस्या पर ध्यान केंद्रित करता है जब एक बड़ी समस्या को नजरअंदाज कर दिया जाता है); हमें सलाह के लिए दिए गए औचित्य (यदि कोई औचित्य की पेशकश की जाती है) की देखभाल के साथ जांच करनी चाहिए।
टी-टेस्ट या गैर-पैरामीट्रिक परीक्षण को सामान्यता मुद्दे पर ध्यान केंद्रित करने के लिए अधिकांश गाइड।
यह सच है, लेकिन यह कुछ कारणों से गलत है जो मैं इस उत्तर में संबोधित करता हूं।
यदि एक "असंबंधित नमूने" या "अप्रकाशित" टी-टेस्ट करते हैं, तो क्या एक वेल्च सुधार का उपयोग करना है?
यह (इसका उपयोग करने के लिए जब तक कि आपके पास विचार करने के लिए कारण समान होना चाहिए) कई संदर्भों की सलाह है। मैं इस जवाब में कुछ की ओर इशारा करता हूं।
कुछ लोग भिन्नताओं की समानता के लिए एक परिकल्पना परीक्षण का उपयोग करते हैं, लेकिन यहां इसकी शक्ति कम होगी। आम तौर पर मैं सिर्फ नेत्रगोलक करता हूं कि नमूना एसडी "यथोचित" करीब है या नहीं (जो कुछ व्यक्तिपरक है, इसलिए इसे करने का एक अधिक राजसी तरीका होना चाहिए) लेकिन फिर, कम n के साथ यह अच्छी तरह से हो सकता है कि जनसंख्या एसडी अधिक है सैंपल वालों के अलावा।
क्या यह छोटे नमूनों के लिए वेल्च सुधार का उपयोग करने के लिए बस सुरक्षित है, जब तक कि जनसंख्या भिन्नता के बराबर होने का कुछ अच्छा कारण नहीं है? यही सलाह है। परीक्षणों के गुण धारणा परीक्षण के आधार पर चुनाव से प्रभावित होते हैं।
इस पर कुछ संदर्भ यहाँ और यहाँ देखे जा सकते हैं , हालाँकि और भी ऐसी ही बातें हैं।
समान-संस्करण के मुद्दे में सामान्यता के मुद्दे की कई समान विशेषताएं हैं - लोग इसका परीक्षण करना चाहते हैं, सलाह देते हैं कि परीक्षणों के परिणामों पर परीक्षणों की कंडीशनिंग पसंद का परीक्षण बाद के दोनों प्रकार के परीक्षण के परिणामों को प्रतिकूल रूप से प्रभावित कर सकता है - यह केवल यह मान लेना बेहतर नहीं है कि क्या आप समान रूप से और इसी तरह से संबंधित अन्य अध्ययनों से जानकारी का उपयोग करके, डेटा के बारे में तर्क द्वारा पर्याप्त रूप से उचित नहीं ठहरा सकते हैं।
हालांकि, मतभेद हैं। एक यह है कि - कम से कम अशक्त परिकल्पना के तहत परीक्षण सांख्यिकीय के वितरण के संदर्भ में (और इसलिए, इसकी स्तर-मजबूती) - गैर-सामान्यता बड़े नमूनों में कम महत्वपूर्ण है (कम से कम महत्व स्तर के संबंध में, हालांकि शक्ति हो सकती है अभी भी एक मुद्दा हो सकता है यदि आपको छोटे प्रभाव खोजने की आवश्यकता होती है), जबकि समान भिन्नता धारणा के तहत असमान भिन्नताओं का प्रभाव वास्तव में बड़े नमूना आकार के साथ नहीं जाता है।
नमूना आकार "छोटा" होने पर सबसे उपयुक्त परीक्षण कौन सा है, यह चुनने के लिए कौन से राजसी तरीके की सिफारिश की जा सकती है?
परिकल्पना परीक्षणों के साथ, क्या मायने रखता है (कुछ शर्तों के तहत) मुख्य रूप से दो चीजें हैं:
हमें यह भी ध्यान रखना होगा कि यदि हम दो प्रक्रियाओं की तुलना कर रहे हैं, तो पहले को बदलने से दूसरा बदल जाएगा (यदि वे एक ही वास्तविक महत्व के स्तर पर संचालित नहीं होते हैं, तो आप उम्मीद करेंगे कि उच्च से संबंधित है उच्च शक्ति)।α
इन छोटे-नमूने के मुद्दों को ध्यान में रखते हुए, क्या टी और गैर-पैरामीट्रिक परीक्षणों के बीच निर्णय लेने के माध्यम से काम करने के लिए एक अच्छा - उम्मीद योग्य - चेकलिस्ट है?
मैं गैर-सामान्यता और असमान भिन्नताओं की संभावना को देखते हुए कई स्थितियों पर विचार करूंगा, जिसमें मैं कुछ सिफारिशें करूंगा। हर मामले में, वेल्च-टेस्ट को लागू करने के लिए टी-टेस्ट का उल्लेख करें:
गैर-सामान्य (या अज्ञात), निकट-समान भिन्नता होने की संभावना:
यदि वितरण भारी-पूंछ वाला है, तो आप आमतौर पर मान-व्हिटनी के साथ बेहतर होंगे, हालांकि यदि यह केवल थोड़ा भारी है, तो टी-परीक्षण ठीक करना चाहिए। प्रकाश-पूंछ के साथ टी-परीक्षण (अक्सर) को प्राथमिकता दी जा सकती है। क्रमपरिवर्तन परीक्षण एक अच्छा विकल्प है (आप टी-स्टेटिस्टिक का उपयोग करके क्रमचय परीक्षण भी कर सकते हैं यदि आप बहुत इच्छुक हैं)। बूटस्ट्रैप परीक्षण भी उपयुक्त हैं।
गैर-सामान्य (या अज्ञात), असमान परिवर्तन (या अज्ञात संबंध):
यदि वितरण भारी-पूंछ वाला है, तो आप आम तौर पर मान-व्हिटनी के साथ बेहतर होंगे - यदि विचरण की असमानता केवल माध्य की असमानता से संबंधित है - अर्थात यदि H0 सत्य है तो प्रसार में अंतर भी अनुपस्थित होना चाहिए। GLMs अक्सर एक अच्छा विकल्प होते हैं, खासकर अगर इसमें तिरछापन और फैला हुआ मतलब से संबंधित है। एक क्रमपरिवर्तन परीक्षण एक अन्य विकल्प है, जिसमें रैंक-आधारित परीक्षणों के लिए समान कैवियट है। यहां बूटस्ट्रैप टेस्ट एक अच्छी संभावना है।
ज़िमरमैन और ज़ुम्बो (1993) रैंक पर एक वेल्च-टी-टेस्ट का सुझाव देते हैं जो वे कहते हैं कि बेहतर प्रदर्शन करता है कि विल्कोक्सन-मान-व्हिटनी उन मामलों में जहां variances असमान हैं।[1]
यदि आप गैर-सामान्यता (फिर से ऊपर के साथ) की अपेक्षा करते हैं तो रैंक परीक्षण यहां उचित चूक हैं। यदि आपको आकार या भिन्नता के बारे में बाहरी जानकारी है, तो आप GLM पर विचार कर सकते हैं। यदि आप उम्मीद करते हैं कि चीजें सामान्य से बहुत दूर नहीं होंगी, तो टी-परीक्षण ठीक हो सकते हैं।
उपयुक्त महत्व के स्तर के साथ समस्या के कारण, न तो क्रमपरिवर्तन परीक्षण और न ही रैंक परीक्षण उपयुक्त हो सकते हैं, और सबसे छोटे आकारों में, एक टी-परीक्षण सबसे अच्छा विकल्प हो सकता है (इसमें थोड़ा मजबूत होने की संभावना है)। हालाँकि, छोटे नमूनों के साथ उच्च प्रकार I त्रुटि दरों का उपयोग करने के लिए एक अच्छा तर्क है (अन्यथा आप टाइप I त्रुटि दर स्थिर रखते हुए टाइप II त्रुटि दरों को बढ़ने दे रहे हैं)। डे विंटर (2013) ।[2]
सलाह को कुछ हद तक संशोधित किया जाना चाहिए जब वितरण दृढ़ता से तिरछा और बहुत असतत हो, जैसे कि लिकर्ट स्केल आइटम जहां अधिकांश अवलोकन अंतिम श्रेणियों में से एक हैं। फिर विलकॉक्सन-मैन-व्हिटनी टी-टेस्ट से बेहतर विकल्प नहीं है।
जब आप संभावित परिस्थितियों के बारे में कुछ जानकारी रखते हैं, तो सिमुलेशन आगे गाइड की पसंद में मदद कर सकता है।
मैं इसकी सराहना करता हूं कि यह एक बारहमासी विषय है, लेकिन अधिकांश प्रश्न प्रश्नकर्ता के विशेष डेटा सेट की चिंता करते हैं, कभी-कभी शक्ति की अधिक सामान्य चर्चा करते हैं, और कभी-कभी दो परीक्षण असहमत होने पर क्या करना है, लेकिन मैं सही परीक्षा लेने के लिए एक प्रक्रिया चाहूंगा प्रथम स्थान!
मुख्य समस्या यह है कि एक छोटे से डेटा सेट में सामान्यता धारणा की जांच करना कितना कठिन है:
यह है एक छोटा सा डेटा सेट में सामान्य जांच करने के लिए, और कुछ हद तक एक महत्वपूर्ण मुद्दा है कि करने के लिए मुश्किल है, लेकिन मुझे लगता है कि महत्व का एक और मुद्दा यह है कि हम इस पर विचार करने की आवश्यकता है। एक बुनियादी समस्या यह है कि परीक्षणों के बीच चयन के आधार के रूप में सामान्यता का आकलन करने की कोशिश करने से आपके द्वारा चुने जा रहे परीक्षणों के गुणों पर प्रतिकूल प्रभाव पड़ता है।
सामान्यता के किसी भी औपचारिक परीक्षण में कम शक्ति होगी ताकि उल्लंघन का अच्छी तरह से पता न चल सके। (व्यक्तिगत रूप से मैं इस उद्देश्य के लिए परीक्षण नहीं करूंगा, और मैं स्पष्ट रूप से अकेला नहीं हूं, लेकिन मैंने यह बहुत कम इस्तेमाल किया है जब ग्राहक एक सामान्यता परीक्षण की मांग करते हैं, क्योंकि यह उनकी पाठ्यपुस्तक या पुराने व्याख्यान नोट्स या किसी वेबसाइट पर एक बार पाया जाता है। घोषणा की जानी चाहिए। यह एक ऐसा बिंदु है जहां वजनदार दिखने वाले प्रशस्ति पत्र का स्वागत किया जाएगा।)
यहाँ एक संदर्भ का उदाहरण दिया गया है (अन्य हैं) जो असमान है (फे और प्रस्कान, 2010 ):[3]
T- और WMW DRs के बीच का चुनाव सामान्यता की परीक्षा पर आधारित नहीं होना चाहिए।
वे समान रूप से असमान हैं जो विचरण की समानता के लिए परीक्षण नहीं करते हैं।
मामलों को बदतर बनाने के लिए, केंद्रीय सीमा प्रमेय को सुरक्षा जाल के रूप में उपयोग करना असुरक्षित है: छोटे n के लिए हम परीक्षण सांख्यिकीय और टी वितरण के सुविधाजनक विषमता सामान्यता पर भरोसा नहीं कर सकते हैं।
न ही बड़े नमूनों में भी - अंश की विषमता सामान्यता का अर्थ यह नहीं है कि टी-स्टेटिस्टिक का टी-वितरण होगा। हालाँकि, यह इतना महत्वपूर्ण नहीं हो सकता है, क्योंकि आपके पास अभी भी स्पर्शोन्मुख सामान्यता होनी चाहिए (जैसे कि अंश के लिए CLT, और स्लटस्की के प्रमेय का सुझाव है कि अंततः टी-स्टेटिस्टिक सामान्य दिखना शुरू हो जाना चाहिए, अगर दोनों के लिए स्थितियां हैं)।
इसके लिए एक राजसी प्रतिक्रिया "सुरक्षा पहले" है: क्योंकि एक छोटे से नमूने पर सामान्यता धारणा को मज़बूती से सत्यापित करने का कोई तरीका नहीं है, इसके बजाय एक बराबर गैर पैरामीट्रिक परीक्षण चलाएं।
यह वास्तव में सलाह है कि जिन संदर्भों का मैं उल्लेख करता हूं (या उल्लेख के लिए लिंक) देता हूं।
एक अन्य दृष्टिकोण जो मैंने देखा है, लेकिन इसके साथ कम सहज महसूस करता है, एक दृश्य जांच करना है और एक टी-टेस्ट के साथ आगे बढ़ना है अगर कुछ भी अनहोनी नहीं हुई है ("इस चेक की कम शक्ति की अनदेखी करते हुए सामान्यता को अस्वीकार करने का कोई कारण नहीं")। मेरा व्यक्तिगत झुकाव इस बात पर विचार करना है कि क्या सामान्यता मानने के लिए कोई आधार हैं, सैद्धांतिक (जैसे चर कई यादृच्छिक घटकों और सीएलटी लागू होता है) या अनुभवजन्य है (उदाहरण के लिए बड़े n के साथ पिछले अध्ययनों में चर सामान्य है)।
वे दोनों अच्छे तर्क हैं, खासकर जब इस तथ्य का समर्थन किया जाता है कि टी-परीक्षण सामान्य से मध्यम विचलन के खिलाफ काफी मजबूत है। (एक को ध्यान में रखना चाहिए, हालांकि, "मध्यम विचलन" एक मुश्किल वाक्यांश है; सामान्यता से कुछ प्रकार के विचलन टी-टेस्ट के शक्ति प्रदर्शन को काफी प्रभावित कर सकते हैं, भले ही वे विचलन नेत्रहीन बहुत छोटे हों - टी- परीक्षण दूसरों की तुलना में कुछ विचलन के लिए कम मजबूत है। हमें सामान्य से छोटे विचलन पर चर्चा करते समय इसे ध्यान में रखना चाहिए।)
हालांकि, खबरदार, "सुझाव है कि चर सामान्य है"। सामान्य रूप से सामान्य रूप से सुसंगत होना सामान्यता जैसी बात नहीं है। हम अक्सर वास्तविक सामान्यता को अस्वीकार कर सकते हैं, यहां तक कि डेटा को देखने की भी आवश्यकता नहीं है - उदाहरण के लिए, यदि डेटा नकारात्मक नहीं हो सकता है, तो वितरण सामान्य नहीं हो सकता है। सौभाग्य से, क्या मायने रखता है कि हम वास्तव में पिछले अध्ययनों के करीब हो सकते हैं या डेटा कैसे बना रहे हैं, इसके बारे में तर्क है, जो सामान्य से विचलन छोटा होना चाहिए।
यदि ऐसा है, तो मैं एक टी-परीक्षण का उपयोग करूंगा यदि डेटा दृश्य निरीक्षण पारित कर दिया, और अन्यथा गैर-पैरामीट्रिक्स से चिपके रहें। लेकिन कोई भी सैद्धांतिक या अनुभवजन्य आधार आमतौर पर केवल अनुमानित सामान्यता को सही ठहराता है, और स्वतंत्रता की कम डिग्री पर यह निर्धारित करना कठिन है कि टी-टेस्ट को अमान्य करने से बचने के लिए सामान्य होने की आवश्यकता है।
ठीक है, यह कुछ ऐसा है जो हम काफी आसानी से प्रभाव का आकलन कर सकते हैं (जैसे कि सिमुलेशन के माध्यम से, जैसा कि मैंने पहले उल्लेख किया है)। मैंने जो देखा है, उससे भारीपन की तुलना में तिरछापन ज्यादा मायने रखता है (लेकिन दूसरी तरफ मैंने इसके विपरीत के कुछ दावे देखे हैं - हालांकि मुझे नहीं पता कि यह किस पर आधारित है)।
उन लोगों के लिए जो शक्ति और मजबूती के बीच व्यापार-बंद के रूप में तरीकों की पसंद को देखते हैं, गैर-पैरामीट्रिक तरीकों की असममित दक्षता के बारे में दावे अनपेक्षित हैं। उदाहरण के लिए, अंगूठे का नियम है कि "विल्कोक्सन परीक्षणों में लगभग 95% टी-परीक्षण की शक्ति है यदि डेटा वास्तव में सामान्य हैं, और अक्सर अधिक शक्तिशाली होते हैं यदि डेटा नहीं है, तो बस एक विलकॉक्सन का उपयोग करें" कभी-कभी होता है सुना है, लेकिन अगर 95% केवल बड़े एन पर लागू होता है, तो यह छोटे नमूनों के लिए त्रुटिपूर्ण तर्क है।
लेकिन हम छोटे-सैंपल पावर को आसानी से जांच सकते हैं! यहाँ के रूप में पावर घटता प्राप्त करने के लिए अनुकरण करना काफी आसान है ।
(फिर से, डे विंटर (2013) ) भी देखें।[2]
विभिन्न प्रकार की परिस्थितियों में, दोनों-नमूना और एक-नमूना / युग्मित-अंतर वाले मामलों के लिए इस तरह के सिमुलेशन करने के बाद, दोनों मामलों में सामान्य पर छोटा नमूना दक्षता विषमता दक्षता से थोड़ा कम लगती है, लेकिन दक्षता हस्ताक्षरित रैंक और विलकॉक्सन-मान-व्हिटनी परीक्षण अभी भी बहुत छोटे नमूना आकारों में बहुत अधिक है।
कम से कम यदि परीक्षण समान वास्तविक महत्व के स्तर पर किए जाते हैं; आप बहुत छोटे नमूनों के साथ 5% परीक्षण नहीं कर सकते (और उदाहरण के लिए यादृच्छिक परीक्षण के बिना कम से कम नहीं), लेकिन अगर आप इसके बजाय शायद 5.5% या 3.2% परीक्षण करने के लिए तैयार हैं, तो रैंक परीक्षण उस महत्व के स्तर पर एक टी-टेस्ट की तुलना में वास्तव में बहुत अच्छी तरह से पकड़।
छोटे नमूने इसे बहुत कठिन या असंभव बना सकते हैं, यह आकलन करने के लिए कि क्या परिवर्तन डेटा के लिए उपयुक्त है क्योंकि यह बताना मुश्किल है कि परिवर्तित डेटा सामान्य (पर्याप्त) वितरण से संबंधित है या नहीं। इसलिए यदि कोई क्यूक्यू प्लॉट बहुत सकारात्मक रूप से तिरछा डेटा प्रकट करता है, जो लॉग लेने के बाद अधिक उचित दिखता है, तो क्या लॉग डेटा पर टी-टेस्ट का उपयोग करना सुरक्षित है? बड़े नमूनों पर यह बहुत लुभावना होगा, लेकिन छोटे एन के साथ मैं शायद तब तक विराम लगाऊंगा जब तक कि पहले स्थान पर लॉग-नॉर्मल वितरण की उम्मीद करने के लिए आधार नहीं था।
एक और विकल्प है: एक अलग पैरामीट्रिक धारणा बनाएं। उदाहरण के लिए, यदि तिरछा डेटा है, तो हो सकता है, उदाहरण के लिए, कुछ स्थितियों में यथोचित रूप से एक गामा वितरण, या कुछ अन्य तिरछे परिवार को एक बेहतर सन्निकटन माना जाए - बड़े नमूनों में, हम सिर्फ एक GLM का उपयोग कर सकते हैं, लेकिन बहुत छोटे नमूनों में यह एक छोटे-नमूने के परीक्षण को देखने के लिए आवश्यक हो सकता है - कई मामलों में सिमुलेशन उपयोगी हो सकता है।
वैकल्पिक 2: टी-टेस्ट को मजबूत करें (लेकिन मजबूत प्रक्रिया की पसंद के बारे में ध्यान रखना ताकि परीक्षण सांख्यिकीय के परिणामी वितरण को बहुत अधिक न समझें) - यह एक बहुत ही छोटे-से-गैर-गैर-पैरामीट्रिक प्रक्रिया जैसे क्षमता पर कुछ फायदे हैं। निम्न प्रकार I त्रुटि दर वाले परीक्षणों पर विचार करना।
यहां मैं सामान्यता से विचलन के खिलाफ सुचारू रूप से मजबूत करने के लिए टी-स्टेटिस्टिक में स्थान के एम-अनुमानक (और पैमाने के संबंधित अनुमानक) का उपयोग करने की तर्ज पर सोच रहा हूं। वेल्च के लिए कुछ समान है, जैसे:
x∼−y∼S∼p
जहां और , आदि क्रमशः स्थान और पैमाने के मजबूत अनुमान हैं।S∼2p=s∼2xnx+s∼2ynyx∼s∼x
मैं लक्ष्यहीनता की किसी भी प्रवृत्ति को कम करने का लक्ष्य बनाऊंगा - इसलिए मैं ट्रिमिंग और विनसोराइजिंग जैसी चीजों से बचूंगा, क्योंकि यदि मूल डेटा असतत था, तो ट्रिमिंग आदि इसे बढ़ा देगा; एम-एसेसमेंट टाइप एप्रोच का उपयोग करके एक चिकने -function के साथ आप असंगति में योगदान किए बिना समान प्रभाव प्राप्त करते हैं। ध्यान रखें कि हम उस स्थिति से निपटने की कोशिश कर रहे हैं जहां वास्तव में बहुत छोटा है (प्रत्येक नमूने में 3-5 के आसपास, कहते हैं), इसलिए यहां तक कि एम-अनुमान संभावित रूप से इसके मुद्दे हैं।ψn
उदाहरण के लिए, आप पी-मान प्राप्त करने के लिए सामान्य पर सिमुलेशन का उपयोग कर सकते हैं (यदि नमूना आकार बहुत छोटा है, तो मैं सुझाव दूंगा कि बूटस्ट्रैपिंग पर - यदि नमूना आकार इतना छोटा नहीं है, तो सावधानीपूर्वक लागू किया गया बूटस्ट्रैप काफी अच्छा कर सकता है , लेकिन तब हम विल्कोक्सन-मान-व्हिटनी पर वापस जा सकते हैं)। वहाँ एक स्केलिंग कारक के साथ-साथ एक df समायोजन है जो मुझे लगता है कि तब एक उचित टी-सन्निकटन होगा। इसका मतलब है कि हमें उस तरह के गुण प्राप्त करने चाहिए जो हम सामान्य के बहुत करीब चाहते हैं, और सामान्य के व्यापक आसपास के क्षेत्र में उचित मजबूती होनी चाहिए। ऐसे कई मुद्दे हैं जो वर्तमान प्रश्न के दायरे से बाहर होंगे, लेकिन मुझे लगता है कि बहुत छोटे नमूनों में लाभ लागत और अतिरिक्त प्रयास की आवश्यकता होनी चाहिए।
[मैंने इस सामान पर बहुत लंबे समय तक साहित्य नहीं पढ़ा है, इसलिए मेरे पास उस स्कोर की पेशकश करने के लिए उपयुक्त संदर्भ नहीं हैं।]
बेशक, यदि आप वितरण को कुछ हद तक सामान्य होने की उम्मीद नहीं करते हैं, बल्कि कुछ अन्य वितरण के समान है, तो आप एक अलग पैरामीट्रिक परीक्षण के उपयुक्त सुदृढ़ीकरण का कार्य कर सकते हैं।
क्या होगा यदि आप गैर-पैरामीट्रिक्स के लिए मान्यताओं की जांच करना चाहते हैं? कुछ स्रोत विलकॉक्सन टेस्ट लागू करने से पहले एक सममित वितरण की पुष्टि करने की सलाह देते हैं, जो सामान्यता की जांच करने के लिए समान समस्याएं लाता है।
वास्तव में। मुझे लगता है कि आप हस्ताक्षरित रैंक परीक्षण का मतलब है *। युग्मित डेटा पर इसका उपयोग करने के मामले में, यदि आप यह मानने के लिए तैयार हैं कि दो वितरण एक ही आकार हैं इसके अलावा स्थान परिवर्तन से आप सुरक्षित हैं, क्योंकि अंतर तब सममित होना चाहिए। वास्तव में, हमें इसकी उतनी आवश्यकता नहीं है; परीक्षण के लिए काम करने के लिए आपको नल के नीचे समरूपता की आवश्यकता है; यह विकल्प के तहत आवश्यक नहीं है (उदाहरण के लिए, सकारात्मक अर्ध-रेखा पर समान रूप से तिरछे दाएं तिरछे वितरण के साथ एक युग्मित स्थिति पर विचार करें, जहां तराजू वैकल्पिक के तहत भिन्न होते हैं, लेकिन शून्य के तहत नहीं; हस्ताक्षर किए गए रैंक परीक्षण आवश्यक रूप से अपेक्षित रूप से काम करना चाहिए; उस मामले में)। यदि विकल्प एक स्थान परिवर्तन है, तो परीक्षण की व्याख्या आसान है।
* (विलकॉक्सन का नाम एक और दो सैंपल रैंक टेस्ट - हस्ताक्षरित रैंक और रैंक राशि दोनों के साथ जुड़ा हुआ है। उनके यू टेस्ट के साथ, मान और व्हिटनी ने विल्कोक्सन द्वारा अध्ययन की गई स्थिति को सामान्य किया, और अशक्त वितरण के मूल्यांकन के लिए महत्वपूर्ण नए विचार पेश किए, लेकिन Wilcoxon-Mann-Whitney पर लेखकों के दो सेटों के बीच प्राथमिकता स्पष्ट रूप से Wilcoxon की है - इसलिए कम से कम अगर हम केवल Wilcoxon vs Mann & Whitney पर विचार करें, तो Wilcoxon मेरी पुस्तक में पहले स्थान पर है। हालाँकि, यह Stigler's Law ने मुझे अभी तक फिर से हराया है, और Wilcoxon। शायद उस प्राथमिकता में से कुछ को पहले योगदानकर्ताओं के साथ साझा करना चाहिए, और (मान और व्हिटनी के अलावा) को एक समकक्ष परीक्षण के कई खोजकर्ताओं के साथ क्रेडिट साझा करना चाहिए। [४] [५]]
संदर्भ
[१]: ज़िम्मरमैन डीडब्ल्यू और ज़ुम्बो बीएन, (१ ९९ ३),
रैंक परिवर्तन और नॉन-नॉर्मल पॉपुलेशन के लिए स्टूडेंट टी-टेस्ट और वेल्च टी-टेस्ट की ताकत,
कैनेडियन जर्नल एक्सपेरिमेंटल साइकोलॉजी, ४ 47 : ५२३-३९।
[२]: जेसीएफ डे विंटर (२०१३),
"अत्यंत छोटे नमूने आकारों के साथ छात्र के टी-टेस्ट का उपयोग करते हुए,"
व्यावहारिक मूल्यांकन, अनुसंधान और मूल्यांकन , १ 10: १०, अगस्त, आईएसएसएन १५३१- http:// http:// १४
http://pareonline.net/ getvn.asp? v = 18 & एन = 10
[३]: माइकल पी। फे और माइकल ए। प्रोचान (२०१०),
"विलकॉक्सन-मैन-व्हिटनी या टी-टेस्ट; परिकल्पना परीक्षणों और निर्णय नियमों की कई व्याख्याओं के लिए मान्यताओं पर,"
स्टेटस सर्वाइव ; 4 : 1-39।
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2857732/
[४]: बेरी, केजे, मिल्के, पीडब्लू और जॉन्सटन, जेई (२०१२),
"द टू-सैंपल रैंक-सम टेस्ट: अर्ली डेवलपमेंट,"
इलेक्ट्रॉनिक जर्नल फॉर हिस्ट्री ऑफ प्रोबेबिलिटी एंड स्टैटिस्टिक्स , वॉल्यूम,, दिसंबर
पीडीएफ
[५]: क्रुस्कल, डब्लूएच (१ ९ ५]),
"विल्कोक्सन पर ऐतिहासिक नोट दो-नमूना परीक्षण,"
जर्नल ऑफ़ द अमेरिकन स्टैटिस्टिकल एसोसिएशन , ५२ , ३५६-१००।