मैं जानता हूं कि गैर-पैरामीट्रिक माध्य के बजाय माध्यिका पर निर्भर करता है
शायद ही कोई भी गैर-परीक्षणात्मक परीक्षण वास्तव में "इस अर्थ में" मध्यस्थों पर निर्भर करता है। मैं केवल एक जोड़े के बारे में सोच सकता हूं ... और केवल एक ही उम्मीद करता हूं कि आपने साइन टेस्ट के बारे में भी सुना होगा।
तुलना करने के लिए ... कुछ।
यदि वे मध्यस्थों पर भरोसा करते हैं, तो संभवतः यह मध्यस्थों की तुलना करना होगा। लेकिन - इसके बावजूद, जो कई स्रोत आपको बताने की कोशिश करते हैं - हस्ताक्षरित रैंक परीक्षण, या विलकॉक्सन-मान-व्हिटनी या क्रुस्कल-वालिस जैसे परीक्षण वास्तव में सभी के लिए एक परीक्षण नहीं हैं; यदि आप कुछ अतिरिक्त धारणाएँ बनाते हैं, तो आप विल्कोक्सन-मान-व्हिटनी और क्रुस्क्ल-वालिस को मध्यस्थों के परीक्षणों के रूप में मान सकते हैं, लेकिन समान मान्यताओं (जब तक वितरण के साधन मौजूद हैं) के तहत आप उन्हें समान रूप से साधनों की परीक्षा के रूप में मान सकते हैं। ।
हस्ताक्षरित रैंक परीक्षण के लिए प्रासंगिक वास्तविक स्थान-अनुमान, युग्मक औसत के भीतर का नमूना है, विलकॉक्सन-मैन-व्हिटनी के लिए एक (और निहितार्थ से, क्रुस्कल-वालिस में) संपूर्ण नमूनों में युग्म के अंतर का माध्य है। ।
मेरा यह भी मानना है कि यह "स्वतंत्रता की डिग्री" पर निर्भर करता है? मानक विचलन के बजाय। अगर मैं गलत हूँ तो मुझे सुधारो।
अधिकांश अपरंपरागत परीक्षणों में 'स्वतंत्रता की डिग्री' नहीं होती है, हालांकि नमूना आकार के साथ कई बदलावों का वितरण और आप इस संबंध में कुछ हद तक स्वतंत्रता के अंश के रूप में समझ सकते हैं कि टेबल नमूना आकार के साथ बदलते हैं। नमूने बेशक उनके गुणों को बनाए रखते हैं और उस अर्थ में स्वतंत्रता की डिग्री है, लेकिन एक परीक्षण सांख्यिकीय के वितरण में स्वतंत्रता की डिग्री आम तौर पर कुछ ऐसी चीज़ नहीं है जो हम चिंतित हैं। ऐसा हो सकता है कि आपके पास स्वतंत्रता की डिग्री जैसी कुछ और चीजें हैं - उदाहरण के लिए, आप निश्चित रूप से एक तर्क दे सकते हैं कि क्रुस्काल-वालिस के पास स्वतंत्रता की डिग्री है जो मूल रूप से उसी अर्थ में है जो ची-स्क्वायर करता है, लेकिन यह आमतौर पर नहीं देखा जाता है इस तरह से (उदाहरण के लिए, अगर कोई क्रुस्ल-वालिस की स्वतंत्रता की डिग्री के बारे में बात कर रहा है, तो वे लगभग हमेशा df होंगे
स्वतंत्रता की डिग्री की एक अच्छी चर्चा यहाँ मिल सकती है /
मैंने बहुत अच्छा शोध किया है, या इसलिए मैंने सोचा है, इस अवधारणा को समझने की कोशिश कर रहा है कि इसके पीछे क्या कामकाज हैं, परीक्षा परिणाम वास्तव में क्या मतलब है, और / या परीक्षण परिणामों के साथ भी क्या करना है; हालाँकि कोई भी उस क्षेत्र में कभी उद्यम नहीं करता है।
मुझे यकीन नहीं है कि आप इसका क्या मतलब है।
मैं कुछ किताबों का सुझाव दे सकता हूं, जैसे कॉनवर की प्रैक्टिकल नॉनपैरेमेट्रिक स्टैटिस्टिक्स , और यदि आप इसे प्राप्त कर सकते हैं, तो नीवे और वर्थिंगटन की पुस्तक ( डिस्ट्रीब्यूशन-फ्री टेस्ट्स ), लेकिन कई अन्य हैं - उदाहरण के लिए Marascuilo & McSweeney, Hollander & Wolfe, या Daniel की पुस्तक। मेरा सुझाव है कि आप कम से कम 3 या 4 लोगों को पढ़ते हैं जो आपसे सबसे अच्छी बात करते हैं, अधिमानतः जो संभव के रूप में चीजों को अलग-अलग तरीके से समझाते हैं (इसका मतलब यह होगा कि कम से कम 6 या 7 पुस्तकों में से थोड़ी सी 3 कहने के लिए पढ़ने के लिए कहें)।
सादगी के लिए मान व्हिटनी यू परीक्षण के साथ रहना चाहिए, जो मैंने देखा है वह काफी लोकप्रिय है
यह वह है, जिसने मुझे आपके बयान के बारे में हैरान कर दिया है "कोई भी उस क्षेत्र में कभी उद्यम नहीं करता है" - कई लोग जो इन परीक्षणों का उपयोग करते हैं, वे 'उस क्षेत्र में उद्यम' करते हैं जिसके बारे में आप बात कर रहे थे।
- और भी दुरुपयोग और overused लगता है
मैं कहता हूँ कि यदि कुछ भी (विलकॉक्सन-मैन-व्हिटनी सहित) गैर-सममितीय परीक्षण का आमतौर पर उपयोग किया जाता है - सबसे विशेष रूप से क्रमपरिवर्तन / रैंडमाइज़ेशन परीक्षण, हालांकि मैं जरूरी विवाद नहीं करूँगा कि उनका अक्सर दुरुपयोग किया जाता है (लेकिन पैरामीट्रिक परीक्षण, यहां तक कि तो और अधिक)।
मान लें कि मैं अपने डेटा के साथ एक गैर पैरामीट्रिक परीक्षण चलाता हूं और मुझे यह परिणाम वापस मिल गया है:
[स्निप]
मैं अन्य तरीकों से परिचित हूं, लेकिन यहां क्या अलग है?
आपको किन अन्य तरीकों से मतलब है? आप मुझसे क्या तुलना करना चाहते हैं?
संपादित करें: आप बाद में प्रतिगमन का उल्लेख करते हैं; मैं तब मान लेता हूं कि आप दो-नमूना वाले टी-टेस्ट से परिचित हैं (क्योंकि यह वास्तव में प्रतिगमन का एक विशेष मामला है)।
साधारण दो-नमूना टी-टेस्ट के लिए मान्यताओं के तहत, शून्य परिकल्पना है कि दो आबादी समान हैं, इस विकल्प के खिलाफ कि वितरण में से एक स्थानांतरित हो गया है। यदि आप नीचे दिए गए विलकॉक्सन-मान-व्हिटनी के लिए परिकल्पना के दो सेटों में से पहले को देखते हैं, तो वहां परीक्षण की जाने वाली मूल चीज लगभग समान है; यह सिर्फ इतना है कि टी-परीक्षण समान सामान्य वितरण (संभावित स्थान-परिवर्तन के अलावा) से आए नमूनों को मानने पर आधारित है। यदि अशक्त परिकल्पना सत्य है, और साथ की धारणाएँ सत्य हैं, तो परीक्षण आँकड़ा का टी-वितरण है। यदि वैकल्पिक परिकल्पना सच है, तो परीक्षण-आँकड़ा उन मूल्यों को लेने की अधिक संभावना बन जाता है जो शून्य परिकल्पना के अनुरूप नहीं लगते हैं, लेकिन वैकल्पिक के अनुरूप दिखते हैं - हम सबसे असामान्य पर ध्यान केंद्रित करते हैं।
विलकॉक्सन-मैन-व्हिटनी के साथ स्थिति बहुत समान है, लेकिन यह शून्य से विचलन को कुछ अलग तरीके से मापता है। वास्तव में, जब टी-टेस्ट की धारणाएं सच हैं *, यह लगभग उतना ही अच्छा है जितना कि संभव परीक्षण (जो टी-टेस्ट है)।
* (जो व्यवहार में कभी नहीं होता है, हालांकि यह वास्तव में उतनी समस्या नहीं है जितना लगता है)
वास्तव में, विल्कोक्सन-मान-व्हिटनी पर प्रभावी रूप से विचार करना संभव है क्योंकि डेटा के रैंक पर एक "टी-टेस्ट" किया जाता है - हालांकि तब इसका टी-वितरण नहीं होता है; सांख्यिकी डेटा के रैंक पर गणना की गई दो-नमूना टी-स्टेटिस्टिक का एक मोनोटोनिक फ़ंक्शन है, इसलिए यह नमूना स्थान पर ** (उसी क्रम में "टी-टेस्ट" - क्रमबद्ध प्रदर्शन किया गया है) एक विल्कॉन-मान-व्हिटनी के रूप में एक ही पी-वैल्यू उत्पन्न करेगा, इसलिए यह बिल्कुल समान मामलों को अस्वीकार करता है।
** (सख्ती से, आंशिक आदेश, लेकिन चलो इसे छोड़ दें)
[आपको लगता है कि केवल रैंकों का उपयोग करने से बहुत सी जानकारी दूर हो जाएगी, लेकिन जब डेटा को समान आबादी के साथ सामान्य आबादी से खींचा जाता है, तो स्थान-शिफ्ट के बारे में लगभग सभी जानकारी रैंकों के पैटर्न में होती है। वास्तविक डेटा मान (उनके रैंक पर सशर्त) बहुत कम अतिरिक्त जानकारी जोड़ते हैं। यदि आप सामान्य से अधिक भारी हो जाते हैं, तो यह विलकॉक्सन-मैन-व्हिटनी परीक्षण से पहले बेहतर शक्ति नहीं है, साथ ही इसके नाममात्र महत्व के स्तर को बनाए रखने के लिए, ताकि रैंकों के ऊपर 'अतिरिक्त' जानकारी अंतत: न केवल विकृत हो जाए, बल्कि कुछ में भावना, भ्रामक। हालांकि, निकट-सममित भारी-तनाव एक दुर्लभ स्थिति है; जो आप अक्सर अभ्यास में देखते हैं वह तिरछा है।]
मूल विचार काफी समान हैं, पी-मानों की एक ही व्याख्या है (परिणामस्वरूप परिणाम की संभावना, या अधिक चरम, यदि शून्य परिकल्पना सच थी) - स्थान-शिफ्ट की व्याख्या के ठीक नीचे, यदि आप बनाते हैं अपेक्षित धारणाएं (इस पोस्ट के अंत के पास परिकल्पनाओं की चर्चा देखें)।
अगर मैं टी-टेस्ट के लिए ऊपर के प्लॉटों की तरह ही सिमुलेशन करता, तो प्लॉट बहुत समान दिखते- x- और y- एक्सिस पर स्केल अलग-अलग दिखते, लेकिन मूल स्वरूप समान होगा।
क्या हमें चाहिए कि पी-मान .05 से कम हो?
आपको वहां कुछ भी "नहीं" चाहिए। विचार यह पता लगाने के लिए है कि क्या नमूने संयोग से भिन्न (स्थान-अर्थ में) हैं, जिन्हें संयोग से समझाया जा सकता है, न कि किसी विशेष परिणाम को 'इच्छा' करने के लिए।
अगर मैं कहता हूँ "जैसा कि आप देख क्या रंग राज की कार कृपया है जा सकते हैं?", अगर मैं इसके बारे में एक निष्पक्ष मूल्यांकन चाहते हैं मैं तुम्हें जा रहा करने के लिए "यार, मैं सच में, सच आशा है कि यह नीले रंग की है नहीं चाहता! यह सिर्फ है होना करने के लिए नीला"। बेस्ट सिर्फ यह देखने के लिए कि स्थिति क्या है, बजाय इसके कि कुछ 'मुझे कुछ होने की जरूरत है' के साथ जाना है।
यदि आपका चुना हुआ महत्व स्तर 0.05 है, तो आप शून्य परिकल्पना को अस्वीकार कर देंगे, जब पी-मान 0.05 से नीचे है। लेकिन अस्वीकार करने में विफलता जब आपके पास एक बड़ा पर्याप्त नमूना आकार होता है, तो लगभग हमेशा प्रासंगिक प्रभाव-आकारों का पता लगाने के लिए कम से कम दिलचस्प होता है, क्योंकि यह कहता है कि जो भी अंतर मौजूद हैं वे छोटे हैं।
"मेन व्हाइटली" संख्या का क्या अर्थ है?
मान-व्हिटनी आँकड़ा ।
यह मूल्यों के वितरण की तुलना में वास्तव में केवल सार्थक है जब शून्य परिकल्पना सच होती है (उपरोक्त आरेख देखें), और यह इस बात पर निर्भर करता है कि किसी विशेष कार्यक्रम का उपयोग किन-किन विशेष परिभाषाओं पर निर्भर करता है।
क्या इसका कोई फायदा है?
आमतौर पर आप इस तरह के सटीक मूल्य के बारे में परवाह नहीं करते हैं, लेकिन यह अशक्त-वितरण में निहित है (क्या यह उन मूल्यों के अधिक या कम विशिष्ट हैं, जिन्हें आपको देखना चाहिए कि अशक्त परिकल्पना सच है, या क्या यह अधिक चरम है)
P(X<Y)
क्या यहां यह डेटा केवल सत्यापित करता है या नहीं सत्यापित करता है कि मेरे पास किसी विशेष स्रोत का डेटा होना चाहिए या नहीं?
यह परीक्षण "डेटा का एक विशेष स्रोत जो मुझे होना चाहिए या इसका उपयोग नहीं किया जाना चाहिए" के बारे में कुछ भी नहीं कहता है।
नीचे WMW परिकल्पना को देखने के दो तरीकों की मेरी चर्चा देखें।
मुझे प्रतिगमन और मूल बातें के साथ उचित मात्रा में अनुभव है, लेकिन इस "विशेष" गैर-पैरामीट्रिक सामान के बारे में बहुत उत्सुक हूं
जब तक आप वास्तव में परिकल्पना परीक्षण को समझते हैं, तब तक कुछ भी विशेष रूप से गैर-परीक्षण परीक्षणों के बारे में कुछ खास नहीं है (मैं कहूंगा कि 'मानक' कई मायनों में ठेठ पैरामीट्रिक परीक्षणों से भी अधिक बुनियादी हैं)।
हालांकि, यह एक और सवाल के लिए शायद एक विषय है।
विलकॉक्सन-मैन-व्हिटनी परिकल्पना परीक्षण को देखने के दो मुख्य तरीके हैं।
i) एक कहना है कि "मुझे लोकेशन-शिफ्ट में दिलचस्पी है - वह यह है कि अशक्त परिकल्पना के तहत, दो आबादी में समान (निरंतर) वितरण होता है , वैकल्पिक के खिलाफ कि एक 'अप शिफ्ट किया गया है या नीचे रिश्तेदार अन्य "
यदि आप यह अनुमान लगाते हैं कि विलकॉक्सन-मैन-व्हिटनी बहुत अच्छी तरह से काम करती है (आपका विकल्प सिर्फ एक स्थान परिवर्तन है)
इस मामले में, विलकॉक्सन-मान-व्हिटनी वास्तव में मध्यस्थों के लिए एक परीक्षा है ... लेकिन समान रूप से यह साधनों के लिए एक परीक्षण है, या वास्तव में किसी अन्य स्थान-समतुल्य सांख्यिकीय (90 वीं प्रतिशतता, उदाहरण के लिए, या छंटनी के साधन, या किसी भी संख्या में) अन्य चीजें), चूंकि वे सभी स्थान-परिवर्तन से उसी तरह प्रभावित हैं।
इसके बारे में अच्छी बात यह है कि यह बहुत आसानी से व्याख्या योग्य है - और इस स्थान-बदलाव के लिए आत्मविश्वास अंतराल उत्पन्न करना आसान है।
हालांकि, विलकॉक्सन-मैन-व्हिटनी परीक्षण स्थान परिवर्तन से अन्य प्रकार के अंतर के प्रति संवेदनशील है।
1212