एक गैर-पैरामीट्रिक परीक्षण वास्तव में क्या करता है और आप परिणामों के साथ क्या करते हैं?


22

मुझे लगता है कि यह कहीं और से पूछा गया हो सकता है, लेकिन वास्तव में बुनियादी विवरण के प्रकार के साथ जो मुझे चाहिए। मैं जानता हूं कि गैर-पैरामीट्रिक तुलना करने के लिए माध्य पर निर्भर करता है ... कुछ। मेरा यह भी मानना ​​है कि यह मानक विचलन के बजाय "स्वतंत्रता की डिग्री" (?) पर निर्भर करता है। अगर मैं गलत हूँ, तो मुझे सुधारो।

मैंने बहुत अच्छा शोध किया है, या इसलिए मैंने सोचा है, इस अवधारणा को समझने की कोशिश कर रहा हूं कि इसके पीछे क्या कामकाज हैं, परीक्षा परिणाम वास्तव में क्या मतलब है, और / या परीक्षण परिणामों के साथ भी क्या करना है; हालाँकि, कोई भी उस क्षेत्र में कभी उद्यम नहीं करता है।

सादगी की खातिर मान-व्हिटनी यू-टेस्ट के साथ चलो, जो मैंने देखा है वह काफी लोकप्रिय है (और एक चक्र के छेद में "स्क्वायर मॉडल" को मजबूर करने के लिए भी इसका दुरुपयोग किया जाता है और अति प्रयोग किया जाता है)। यदि आप अन्य परीक्षणों का वर्णन करना चाहते हैं और साथ ही साथ स्वतंत्र महसूस कर रहे हैं, हालांकि मुझे लगता है कि एक बार मुझे समझ में आ जाए, तो मैं दूसरों को विभिन्न टी-परीक्षणों आदि के अनुरूप तरीके से समझ सकता हूं।

मान लें कि मैं अपने डेटा के साथ एक गैर-पैरामीट्रिक परीक्षण चलाता हूं और मुझे यह परिणाम वापस मिलता है:

2 Sample Mann-Whitney - Customer Type       

Test Information        
H0: Median Difference = 0       
Ha: Median Difference ≠ 0       

Size of Customer    Large   Small
Count                    45    55
Median                    2     2

Mann-Whitney Statistic: 2162.00 
p-value (2-sided, adjusted for ties):   0.4156  

मैं अन्य तरीकों से परिचित हूं, लेकिन यहां क्या अलग है? क्या हमें चाहिए कि पी-मान .05 से कम हो? "मान-व्हिटनी स्टेटिस्टिक" का क्या अर्थ है? क्या इसका कोई फायदा है? क्या यह जानकारी यहाँ सत्यापित या सत्यापित नहीं करती है कि मेरे पास किसी विशेष स्रोत का डेटा होना चाहिए या नहीं?

मुझे प्रतिगमन और मूल बातें के साथ उचित मात्रा में अनुभव है, लेकिन इस "विशेष" गैर-पैरामीट्रिक सामान के बारे में बहुत उत्सुक हूं - जो मुझे पता है कि इसकी खुद की कमियां होंगी।

जरा सोचिए कि मैं पाँचवाँ क़ब्रदार हूँ और देखता हूँ कि क्या आप मुझे समझा सकते हैं।


4
हां, मैंने कई बार पढ़ा है। कभी-कभी शब्दजाल जो विकिपीडिया का उपयोग करता है वह भारी हो सकता है और हालांकि इसका सटीक विवरण है - यह जरूरी नहीं कि किसी के पास एक स्पष्ट विवरण हो जो क्षेत्र को सीखने की कोशिश करना शुरू कर रहा है। निश्चित नहीं है कि किसने अपमानित किया, लेकिन मैं वैध रूप से सिर्फ एक बुनियादी, स्पष्टता चाहता हूं, स्पष्टीकरण लगभग कोई भी समझ सकता है। हां, मैंने यह मानने की पूरी कोशिश की है कि कोई इसे मानता है या नहीं। तुरंत मुझे नीचा दिखाने और विकिपीडिया से जोड़ने की कोई आवश्यकता नहीं है। किसी ने कभी नोटिस किया कि कुछ शिक्षक दूसरों की तुलना में बेहतर कैसे हैं? मैं एक अच्छे "शिक्षक" की तलाश कर रहा हूं जो एक अवधारणा के लिए है जिस पर मैं फंस गया हूं।
ताल

1
इसके बाद किसी अच्छे बेसिक नॉमेट्रिक स्टैटिस्टिक्स टेक्स्ट जैसे कि स्पेंट और स्मेटन, हॉलैंडर और वोल्फ, कॉनओवर पर जाएं। या एक परिचयात्मक पाठ ढूंढें जिसमें मान-व्हिटनी शामिल हो।
निक कॉक्स

1
आपके प्रश्न और आपके द्वारा हाल ही में पूछे गए अन्य प्रश्न को देखने से, अकेले इंटरनेट का उपयोग करना आपके लिए अच्छा नहीं है, क्योंकि आप स्पष्ट रूप से बहुत भ्रमित हैं। इसीलिए @Peter Flom और मैं पुस्तकों की सिफारिश कर रहे हैं। मुझे रिज़र्व में अन्य सुझाव नहीं मिले हैं। मैं यह भी सलाह देता हूं - ईमानदारी से और अपने सर्वोत्तम हित में - बहुत अधिक संक्षिप्त, कम गपशप सवालों को लिखने की कोशिश करना। आपकी दमनकारी शैली आपके प्रश्नों को स्पष्ट करने में मदद नहीं करती है।
निक कॉक्स

1
अकेले इंटरनेट वास्तव में किसी भी पुस्तक या कक्षा से बेहतर काम कर रहा है जो मेरे लिए ईमानदार था - और यह किसी भी विषय के लिए जाता है। मैं "गपशप" सवाल लिखने के लिए माफी माँगता हूँ।
ताल

3
नहीं, यह एक अच्छी किताब के रूप में भी काम नहीं कर रहा है। स्टीफन सेन को दृष्टांत देने के लिए, यह अजीब है कि आँकड़े एकमात्र विज्ञान है जिसे लोग पहली नज़र में समझने की मांग करते हैं।
फ्रैंक हरेल

जवाबों:


41

मैं जानता हूं कि गैर-पैरामीट्रिक माध्य के बजाय माध्यिका पर निर्भर करता है

शायद ही कोई भी गैर-परीक्षणात्मक परीक्षण वास्तव में "इस अर्थ में" मध्यस्थों पर निर्भर करता है। मैं केवल एक जोड़े के बारे में सोच सकता हूं ... और केवल एक ही उम्मीद करता हूं कि आपने साइन टेस्ट के बारे में भी सुना होगा।

तुलना करने के लिए ... कुछ।

यदि वे मध्यस्थों पर भरोसा करते हैं, तो संभवतः यह मध्यस्थों की तुलना करना होगा। लेकिन - इसके बावजूद, जो कई स्रोत आपको बताने की कोशिश करते हैं - हस्ताक्षरित रैंक परीक्षण, या विलकॉक्सन-मान-व्हिटनी या क्रुस्कल-वालिस जैसे परीक्षण वास्तव में सभी के लिए एक परीक्षण नहीं हैं; यदि आप कुछ अतिरिक्त धारणाएँ बनाते हैं, तो आप विल्कोक्सन-मान-व्हिटनी और क्रुस्क्ल-वालिस को मध्यस्थों के परीक्षणों के रूप में मान सकते हैं, लेकिन समान मान्यताओं (जब तक वितरण के साधन मौजूद हैं) के तहत आप उन्हें समान रूप से साधनों की परीक्षा के रूप में मान सकते हैं। ।

हस्ताक्षरित रैंक परीक्षण के लिए प्रासंगिक वास्तविक स्थान-अनुमान, युग्मक औसत के भीतर का नमूना है, विलकॉक्सन-मैन-व्हिटनी के लिए एक (और निहितार्थ से, क्रुस्कल-वालिस में) संपूर्ण नमूनों में युग्म के अंतर का माध्य है। ।

मेरा यह भी मानना ​​है कि यह "स्वतंत्रता की डिग्री" पर निर्भर करता है? मानक विचलन के बजाय। अगर मैं गलत हूँ तो मुझे सुधारो।

अधिकांश अपरंपरागत परीक्षणों में 'स्वतंत्रता की डिग्री' नहीं होती है, हालांकि नमूना आकार के साथ कई बदलावों का वितरण और आप इस संबंध में कुछ हद तक स्वतंत्रता के अंश के रूप में समझ सकते हैं कि टेबल नमूना आकार के साथ बदलते हैं। नमूने बेशक उनके गुणों को बनाए रखते हैं और उस अर्थ में स्वतंत्रता की डिग्री है, लेकिन एक परीक्षण सांख्यिकीय के वितरण में स्वतंत्रता की डिग्री आम तौर पर कुछ ऐसी चीज़ नहीं है जो हम चिंतित हैं। ऐसा हो सकता है कि आपके पास स्वतंत्रता की डिग्री जैसी कुछ और चीजें हैं - उदाहरण के लिए, आप निश्चित रूप से एक तर्क दे सकते हैं कि क्रुस्काल-वालिस के पास स्वतंत्रता की डिग्री है जो मूल रूप से उसी अर्थ में है जो ची-स्क्वायर करता है, लेकिन यह आमतौर पर नहीं देखा जाता है इस तरह से (उदाहरण के लिए, अगर कोई क्रुस्ल-वालिस की स्वतंत्रता की डिग्री के बारे में बात कर रहा है, तो वे लगभग हमेशा df होंगे

स्वतंत्रता की डिग्री की एक अच्छी चर्चा यहाँ मिल सकती है /

मैंने बहुत अच्छा शोध किया है, या इसलिए मैंने सोचा है, इस अवधारणा को समझने की कोशिश कर रहा है कि इसके पीछे क्या कामकाज हैं, परीक्षा परिणाम वास्तव में क्या मतलब है, और / या परीक्षण परिणामों के साथ भी क्या करना है; हालाँकि कोई भी उस क्षेत्र में कभी उद्यम नहीं करता है।

मुझे यकीन नहीं है कि आप इसका क्या मतलब है।

मैं कुछ किताबों का सुझाव दे सकता हूं, जैसे कॉनवर की प्रैक्टिकल नॉनपैरेमेट्रिक स्टैटिस्टिक्स , और यदि आप इसे प्राप्त कर सकते हैं, तो नीवे और वर्थिंगटन की पुस्तक ( डिस्ट्रीब्यूशन-फ्री टेस्ट्स ), लेकिन कई अन्य हैं - उदाहरण के लिए Marascuilo & McSweeney, Hollander & Wolfe, या Daniel की पुस्तक। मेरा सुझाव है कि आप कम से कम 3 या 4 लोगों को पढ़ते हैं जो आपसे सबसे अच्छी बात करते हैं, अधिमानतः जो संभव के रूप में चीजों को अलग-अलग तरीके से समझाते हैं (इसका मतलब यह होगा कि कम से कम 6 या 7 पुस्तकों में से थोड़ी सी 3 कहने के लिए पढ़ने के लिए कहें)।

सादगी के लिए मान व्हिटनी यू परीक्षण के साथ रहना चाहिए, जो मैंने देखा है वह काफी लोकप्रिय है

यह वह है, जिसने मुझे आपके बयान के बारे में हैरान कर दिया है "कोई भी उस क्षेत्र में कभी उद्यम नहीं करता है" - कई लोग जो इन परीक्षणों का उपयोग करते हैं, वे 'उस क्षेत्र में उद्यम' करते हैं जिसके बारे में आप बात कर रहे थे।

- और भी दुरुपयोग और overused लगता है

मैं कहता हूँ कि यदि कुछ भी (विलकॉक्सन-मैन-व्हिटनी सहित) गैर-सममितीय परीक्षण का आमतौर पर उपयोग किया जाता है - सबसे विशेष रूप से क्रमपरिवर्तन / रैंडमाइज़ेशन परीक्षण, हालांकि मैं जरूरी विवाद नहीं करूँगा कि उनका अक्सर दुरुपयोग किया जाता है (लेकिन पैरामीट्रिक परीक्षण, यहां तक ​​कि तो और अधिक)।

मान लें कि मैं अपने डेटा के साथ एक गैर पैरामीट्रिक परीक्षण चलाता हूं और मुझे यह परिणाम वापस मिल गया है:

[स्निप]

मैं अन्य तरीकों से परिचित हूं, लेकिन यहां क्या अलग है?

आपको किन अन्य तरीकों से मतलब है? आप मुझसे क्या तुलना करना चाहते हैं?

संपादित करें: आप बाद में प्रतिगमन का उल्लेख करते हैं; मैं तब मान लेता हूं कि आप दो-नमूना वाले टी-टेस्ट से परिचित हैं (क्योंकि यह वास्तव में प्रतिगमन का एक विशेष मामला है)।

साधारण दो-नमूना टी-टेस्ट के लिए मान्यताओं के तहत, शून्य परिकल्पना है कि दो आबादी समान हैं, इस विकल्प के खिलाफ कि वितरण में से एक स्थानांतरित हो गया है। यदि आप नीचे दिए गए विलकॉक्सन-मान-व्हिटनी के लिए परिकल्पना के दो सेटों में से पहले को देखते हैं, तो वहां परीक्षण की जाने वाली मूल चीज लगभग समान है; यह सिर्फ इतना है कि टी-परीक्षण समान सामान्य वितरण (संभावित स्थान-परिवर्तन के अलावा) से आए नमूनों को मानने पर आधारित है। यदि अशक्त परिकल्पना सत्य है, और साथ की धारणाएँ सत्य हैं, तो परीक्षण आँकड़ा का टी-वितरण है। यदि वैकल्पिक परिकल्पना सच है, तो परीक्षण-आँकड़ा उन मूल्यों को लेने की अधिक संभावना बन जाता है जो शून्य परिकल्पना के अनुरूप नहीं लगते हैं, लेकिन वैकल्पिक के अनुरूप दिखते हैं - हम सबसे असामान्य पर ध्यान केंद्रित करते हैं।

विलकॉक्सन-मैन-व्हिटनी के साथ स्थिति बहुत समान है, लेकिन यह शून्य से विचलन को कुछ अलग तरीके से मापता है। वास्तव में, जब टी-टेस्ट की धारणाएं सच हैं *, यह लगभग उतना ही अच्छा है जितना कि संभव परीक्षण (जो टी-टेस्ट है)।

* (जो व्यवहार में कभी नहीं होता है, हालांकि यह वास्तव में उतनी समस्या नहीं है जितना लगता है)

शून्य और वैकल्पिक के तहत wmw

वास्तव में, विल्कोक्सन-मान-व्हिटनी पर प्रभावी रूप से विचार करना संभव है क्योंकि डेटा के रैंक पर एक "टी-टेस्ट" किया जाता है - हालांकि तब इसका टी-वितरण नहीं होता है; सांख्यिकी डेटा के रैंक पर गणना की गई दो-नमूना टी-स्टेटिस्टिक का एक मोनोटोनिक फ़ंक्शन है, इसलिए यह नमूना स्थान पर ** (उसी क्रम में "टी-टेस्ट" - क्रमबद्ध प्रदर्शन किया गया है) एक विल्कॉन-मान-व्हिटनी के रूप में एक ही पी-वैल्यू उत्पन्न करेगा, इसलिए यह बिल्कुल समान मामलों को अस्वीकार करता है।

** (सख्ती से, आंशिक आदेश, लेकिन चलो इसे छोड़ दें)

[आपको लगता है कि केवल रैंकों का उपयोग करने से बहुत सी जानकारी दूर हो जाएगी, लेकिन जब डेटा को समान आबादी के साथ सामान्य आबादी से खींचा जाता है, तो स्थान-शिफ्ट के बारे में लगभग सभी जानकारी रैंकों के पैटर्न में होती है। वास्तविक डेटा मान (उनके रैंक पर सशर्त) बहुत कम अतिरिक्त जानकारी जोड़ते हैं। यदि आप सामान्य से अधिक भारी हो जाते हैं, तो यह विलकॉक्सन-मैन-व्हिटनी परीक्षण से पहले बेहतर शक्ति नहीं है, साथ ही इसके नाममात्र महत्व के स्तर को बनाए रखने के लिए, ताकि रैंकों के ऊपर 'अतिरिक्त' जानकारी अंतत: न केवल विकृत हो जाए, बल्कि कुछ में भावना, भ्रामक। हालांकि, निकट-सममित भारी-तनाव एक दुर्लभ स्थिति है; जो आप अक्सर अभ्यास में देखते हैं वह तिरछा है।]

मूल विचार काफी समान हैं, पी-मानों की एक ही व्याख्या है (परिणामस्वरूप परिणाम की संभावना, या अधिक चरम, यदि शून्य परिकल्पना सच थी) - स्थान-शिफ्ट की व्याख्या के ठीक नीचे, यदि आप बनाते हैं अपेक्षित धारणाएं (इस पोस्ट के अंत के पास परिकल्पनाओं की चर्चा देखें)।

अगर मैं टी-टेस्ट के लिए ऊपर के प्लॉटों की तरह ही सिमुलेशन करता, तो प्लॉट बहुत समान दिखते- x- और y- एक्सिस पर स्केल अलग-अलग दिखते, लेकिन मूल स्वरूप समान होगा।

क्या हमें चाहिए कि पी-मान .05 से कम हो?

आपको वहां कुछ भी "नहीं" चाहिए। विचार यह पता लगाने के लिए है कि क्या नमूने संयोग से भिन्न (स्थान-अर्थ में) हैं, जिन्हें संयोग से समझाया जा सकता है, न कि किसी विशेष परिणाम को 'इच्छा' करने के लिए।

अगर मैं कहता हूँ "जैसा कि आप देख क्या रंग राज की कार कृपया है जा सकते हैं?", अगर मैं इसके बारे में एक निष्पक्ष मूल्यांकन चाहते हैं मैं तुम्हें जा रहा करने के लिए "यार, मैं सच में, सच आशा है कि यह नीले रंग की है नहीं चाहता! यह सिर्फ है होना करने के लिए नीला"। बेस्ट सिर्फ यह देखने के लिए कि स्थिति क्या है, बजाय इसके कि कुछ 'मुझे कुछ होने की जरूरत है' के साथ जाना है।

यदि आपका चुना हुआ महत्व स्तर 0.05 है, तो आप शून्य परिकल्पना को अस्वीकार कर देंगे, जब पी-मान 0.05 से नीचे है। लेकिन अस्वीकार करने में विफलता जब आपके पास एक बड़ा पर्याप्त नमूना आकार होता है, तो लगभग हमेशा प्रासंगिक प्रभाव-आकारों का पता लगाने के लिए कम से कम दिलचस्प होता है, क्योंकि यह कहता है कि जो भी अंतर मौजूद हैं वे छोटे हैं।

"मेन व्हाइटली" संख्या का क्या अर्थ है?

मान-व्हिटनी आँकड़ा

यह मूल्यों के वितरण की तुलना में वास्तव में केवल सार्थक है जब शून्य परिकल्पना सच होती है (उपरोक्त आरेख देखें), और यह इस बात पर निर्भर करता है कि किसी विशेष कार्यक्रम का उपयोग किन-किन विशेष परिभाषाओं पर निर्भर करता है।

क्या इसका कोई फायदा है?

आमतौर पर आप इस तरह के सटीक मूल्य के बारे में परवाह नहीं करते हैं, लेकिन यह अशक्त-वितरण में निहित है (क्या यह उन मूल्यों के अधिक या कम विशिष्ट हैं, जिन्हें आपको देखना चाहिए कि अशक्त परिकल्पना सच है, या क्या यह अधिक चरम है)

P(X<Y)

क्या यहां यह डेटा केवल सत्यापित करता है या नहीं सत्यापित करता है कि मेरे पास किसी विशेष स्रोत का डेटा होना चाहिए या नहीं?

यह परीक्षण "डेटा का एक विशेष स्रोत जो मुझे होना चाहिए या इसका उपयोग नहीं किया जाना चाहिए" के बारे में कुछ भी नहीं कहता है।

नीचे WMW परिकल्पना को देखने के दो तरीकों की मेरी चर्चा देखें।

मुझे प्रतिगमन और मूल बातें के साथ उचित मात्रा में अनुभव है, लेकिन इस "विशेष" गैर-पैरामीट्रिक सामान के बारे में बहुत उत्सुक हूं

जब तक आप वास्तव में परिकल्पना परीक्षण को समझते हैं, तब तक कुछ भी विशेष रूप से गैर-परीक्षण परीक्षणों के बारे में कुछ खास नहीं है (मैं कहूंगा कि 'मानक' कई मायनों में ठेठ पैरामीट्रिक परीक्षणों से भी अधिक बुनियादी हैं)।

हालांकि, यह एक और सवाल के लिए शायद एक विषय है।


विलकॉक्सन-मैन-व्हिटनी परिकल्पना परीक्षण को देखने के दो मुख्य तरीके हैं।

i) एक कहना है कि "मुझे लोकेशन-शिफ्ट में दिलचस्पी है - वह यह है कि अशक्त परिकल्पना के तहत, दो आबादी में समान (निरंतर) वितरण होता है , वैकल्पिक के खिलाफ कि एक 'अप शिफ्ट किया गया है या नीचे रिश्तेदार अन्य "

यदि आप यह अनुमान लगाते हैं कि विलकॉक्सन-मैन-व्हिटनी बहुत अच्छी तरह से काम करती है (आपका विकल्प सिर्फ एक स्थान परिवर्तन है)

इस मामले में, विलकॉक्सन-मान-व्हिटनी वास्तव में मध्यस्थों के लिए एक परीक्षा है ... लेकिन समान रूप से यह साधनों के लिए एक परीक्षण है, या वास्तव में किसी अन्य स्थान-समतुल्य सांख्यिकीय (90 वीं प्रतिशतता, उदाहरण के लिए, या छंटनी के साधन, या किसी भी संख्या में) अन्य चीजें), चूंकि वे सभी स्थान-परिवर्तन से उसी तरह प्रभावित हैं।

इसके बारे में अच्छी बात यह है कि यह बहुत आसानी से व्याख्या योग्य है - और इस स्थान-बदलाव के लिए आत्मविश्वास अंतराल उत्पन्न करना आसान है।

स्थान परिवर्तन

हालांकि, विलकॉक्सन-मैन-व्हिटनी परीक्षण स्थान परिवर्तन से अन्य प्रकार के अंतर के प्रति संवेदनशील है।

1212

1/2 से P (X <Y) में बदलाव


मैंने लगभग अशक्त वितरण (नए शीर्ष आलेख में लाल रंग में एक) को आकर्षित किया जैसे कि यह निरंतर है ... लेकिन वास्तविक वितरण असतत है। इस तरह से तस्वीर कम उखड़ी हुई है।
Glen_b -Reinstate मोनिका

3
+1 महान जवाब। विल्कोक्सन-मान-व्हिटनी परीक्षण के सबसे अच्छे और सबसे सुलभ स्पष्टीकरणों में से एक मुझे पता है। धन्यवाद।
COOLSerdash

"इस मामले में, विलकॉक्सन-मान-व्हिटनी वास्तव में मध्यस्थों के लिए एक परीक्षा है ... लेकिन समान रूप से इसका मतलब है कि एक परीक्षण है" हालांकि, कुछ वितरणों का मतलब यह नहीं है, जबकि उनका माध्य अच्छी तरह से परिभाषित है (जैसे कॉची)।
काराकल

@caracal सच है (यह एक ऐसा बिंदु है जिसे मैंने कई बार यहाँ बनाया है), अगर किसी की जनसंख्या की समानता के लिए परीक्षण का मतलब है, संभवतः वे पहले से ही मानते हैं कि वे जनसंख्या का अर्थ परिमित हैं। यदि वे ऐसा नहीं करते हैं, तो उन्हें परीक्षण चुनने के बिंदु पर पहुंचने से पहले अच्छी तरह से समस्या है। यह देखते हुए कि समान (और इस प्रकार परिमित) जनसंख्या की एक परिकल्पना है, समान धारणाओं के तहत, जो आमतौर पर इसे मध्यस्थों की परीक्षा (शिफ्ट विकल्प) बनाने के लिए उपयोग किया जाता है, WMW भी साधनों की एक परीक्षा है।
Glen_b -Reinstate मोनिका

17

मान लीजिए कि आप और मैं ट्रैक टीमों की कोचिंग कर रहे हैं। हमारे एथलीट एक ही स्कूल से आते हैं, समान उम्र के हैं, और एक ही लिंग (यानी, वे एक ही आबादी से तैयार किए गए हैं), लेकिन मेरा दावा है कि एक क्रांतिकारी नई प्रशिक्षण प्रणाली की खोज की गई है जो मेरी टीम के सदस्यों की तुलना में बहुत तेज़ी से चलेगी आपका अपना। मैं आपको कैसे समझा सकता हूं कि यह वास्तव में काम करता है?

हमारे पास एक दौड़ है।

बाद में, मैं अपनी टीम के सदस्यों के लिए औसत समय और आपके सदस्यों के लिए औसत समय की गणना करता हूं। अगर मेरे एथलीटों के लिए माध्य समय न केवल आपके लिए, बल्कि हमारे परिणामों के "बिखराव" या मानक विचलन की तुलना में अंतर भी बड़ा है, तो मैं जीत का दावा करूंगा।


t


"लेकिन मैट", आप शिकायत करते हैं, "यह काफी उचित नहीं है। हमारी टीम काफी समान हैं, लेकिन आप - शुद्ध मौका के कारण - जिले के सबसे तेज धावक के साथ समाप्त हो गए। वह सभी के समान लीग में नहीं हैं। इसके अलावा, वह व्यावहारिक रूप से प्रकृति का एक सनकी है। वह अगले सबसे तेज फिनिशर से 3 मिनट पहले समाप्त हो गया, जो आपके औसत समय को बहुत कम कर देता है, लेकिन बाकी प्रतियोगी बहुत समान रूप से मिश्रित होते हैं। आइए इसके बजाय फिनिश ऑर्डर देखें। वास्तव में काम करता है, पहले के फिनिशर ज्यादातर आपकी टीम से होने चाहिए, लेकिन अगर यह खत्म नहीं होता है तो ऑर्डर बहुत यादृच्छिक होना चाहिए। यह आपके सुपर-स्टार को अनुचित वजन नहीं देता है! "


t

p

ttt


आपने वास्तव में मेरे प्रश्न का ठीक उसी तरह से उत्तर दिया, और मेरा ठीक-ठीक मतलब है, जिस तरह से मैं चाहता था कि इसका उत्तर दिया जाए। ग्लेन ने गणितीय पक्ष को और अधिक बढ़ाया, और इन दो प्रतिक्रियाओं के संयोजन ने मेरे लिए क्लिक किया। मैं इनाम को उससे दूर नहीं कर सकता हालांकि - मेरा मतलब है ... वह आपकी प्रतिक्रिया की स्पष्टता के बावजूद, रेखांकन बना रहा है। मुझे लगता है कि आपके पास अतीत में किसी प्रकार का शिक्षण कार्य था। मुझे पता है कि यहां प्रतिक्रियाओं में कुछ सामान्यीकरण हो सकते हैं, लेकिन मुझे पता था कि मुझे एक पुस्तक खरीदने और गहनता से अध्ययन करने के लिए कुछ स्तर पर गैर-पैरामीट्रिक्स लागू करने में सक्षम होने के लिए नहीं था
ताल

t

इस सब की विडंबना यह है कि मैं इसका उपयोग शायद करने वाला नहीं हूं, यह मुझे परेशान करता है कि मुझे इसका सीधा जवाब नहीं मिला कि यह क्या था। ग्लेन का उत्तर मेरी अपेक्षा से बहुत अधिक है और मुझे मूल रूप से मिला - सबसे अच्छा उत्तर मुझे लगता है कि मैं वर्णन नहीं कर सकता क्योंकि कोई भी विवरण अपर्याप्त साबित होगा। जैसे किसी को बताना कि नीला रंग कैसा दिखता है। यदि आपने किसी भी व्हीबर के सामान को पढ़ा है, तो ऐसा लगता है कि आपके पास एक समान स्वाद हो सकता है ...
ताल


6

आपने गलत होने पर सही होने को कहा। यहाँ उस टिप्पणी के तहत कुछ टिप्पणियाँ @Peter Flom के सकारात्मक सुझावों के पूरक हैं।

  • "गैर-पैरामीट्रिक माध्य के बजाय माध्यिका पर निर्भर करता है": अक्सर अभ्यास में, लेकिन यह एक परिभाषा नहीं है। कई गैर-पैरामीट्रिक परीक्षणों (जैसे ची-स्क्वायर) का मध्यस्थों के साथ कोई लेना-देना नहीं है।

  • मानक विचलन के बजाय स्वतंत्रता की डिग्री पर निर्भर करता है; यह बहुत उलझन में है। स्वतंत्रता की डिग्री का विचार किसी भी मायने में मानक विचलन का विकल्प नहीं है; एक विचार के रूप में स्वतंत्रता की डिग्री सही आंकड़ों पर लागू होती है।

  • "डेटा का एक विशेष स्रोत जो मेरे पास होना चाहिए या उपयोग नहीं किया जाना चाहिए": इस सवाल का आपके द्वारा लागू महत्व परीक्षण से कोई लेना-देना नहीं है, जो डेटा के सबसेट के बीच अंतर के बारे में है और यह मध्यस्थों के बीच अंतर के संदर्भ में है।


मेरा मानना ​​है कि "मुझे गलत किया गया है" जहां सही हो, यह पूछने पर आपका ले लेना अभी तक की सबसे अच्छी प्रतिक्रिया है। मुझे लगता है कि मुझे कुछ अशक्त परिकल्पना की आवश्यकता थी या उसे समाप्त करने की प्रक्रिया द्वारा सीखना चाहिए। आपकी प्रतिक्रिया ने मुझे नई जानकारी दी है जो मुझे समझ में आई है - विषय की मेरी समझ में अभी भी कुछ बड़े छेद हैं, लेकिन मैं पूर्णता की उम्मीद नहीं कर सकता। शायद उन छेदों की तुलना में मैं मूल रूप से प्रत्याशित हूं, जब यह प्रश्न लिखते समय और स्टैकएक्सचेंज पर्याप्त नहीं होगा, चाहे मैं "गपशप" कैसे करूं।
ताल

4

आप यहां पी-वैल्यू से वही चीजें चाहते हैं जो आप किसी अन्य परीक्षा में चाहते हैं।

यू स्टेटिस्टिक एक गणना का परिणाम है, जैसे टी स्टेटिस्टिक, ऑड्स अनुपात, एफ स्टेटिस्टिक या आपके पास क्या है। सूत्र को बहुत सारे स्थान मिल सकते हैं। यह बहुत सहज नहीं है, लेकिन तब तक, न ही अन्य परीक्षण आँकड़े हैं जब तक आप उन्हें इस्तेमाल नहीं करते (हम 2 को महत्वपूर्ण सीमा में होने के कारण पहचानते हैं क्योंकि हम उन्हें हर समय देखते हैं)।

आपके ब्लॉक टेक्स्ट के बाकी आउटपुट स्पष्ट होने चाहिए।

Nonparametric परीक्षणों के लिए एक अधिक सामान्य परिचय के लिए, मैं @NickCox की प्रतिध्वनि करता हूं .... एक अच्छी पुस्तक प्राप्त करता हूं। गैर-पैरामीट्रिक का अर्थ है "बिना मापदंडों के"; कई प्रकार के उद्देश्यों के लिए कई गैर-पैरामीट्रिक परीक्षण और आंकड़े हैं।


हां, आदर्श रूप से, एक अच्छी किताब मदद करेगी; हालाँकि, यह आज के संसाधनों (जैसे स्टेक्सएक्सचेंज), विकिपीडिया (कभी-कभी), यूट्यूब मार्केट प्रतियोगिता (क्या आपको पता है कि प्रत्येक मिलियन विचारों के लिए उन्हें $ 4000 का भुगतान मिलता है?), साथ ही साथ अन्य संसाधनों की एक किस्म के साथ अनावश्यक लगता है। मैं आम तौर पर, अपनी सीखने की शैली के रूप में, सरल पुस्तक सीखने में भी बहुत कठिन विफल रहता हूं।
ताल

1
मैं आपके पोस्ट की सराहना करता हूं, हालांकि यह वास्तव में पहले से ही सबसे अधिक दोहराता है जो मैं पहले से जानता हूं या दुर्भाग्य से ग्रहण किया था। ऐसा लगता है कि कुछ प्रकार के पैटर्न हैं जहां लगभग हर स्पष्टीकरण मुझे इस एक विशिष्ट बिंदु पर बंद हो जाता है। शायद यह बिंदु वह है जहाँ समझाना या बहुत अधिक प्रयास करना बहुत जटिल हो जाता है - मुझे यकीन नहीं है। किसी भी तरह से, यह एक पैटर्न है जिसे मैं सामान्य रूप से उपयोग की जाने वाली जानकारी के प्रत्येक स्रोत से अनुभव कर रहा हूं - जो हर किसी के पुस्तक विवरण को दोहराता है। शायद मुझे एहसास नहीं था कि जवाब इतना जटिल था; तो फिर मैं एसई पर कुछ गहन जवाब देखा है।
ताल

2
पहले आप हमें सरल बनाने के लिए कहें, फिर आप शिकायत करते हैं कि हमारे उत्तर सरल हैं! यदि आप U (या कुछ और) के लिए फार्मूला समझना चाहते हैं तो उस पर देखिए। यदि आप कुछ सरल चाहते हैं, तो जटिलताएं न पूछें! विकिपीडिया प्रविष्टि सभी विवरणों के साथ एक उत्कृष्ट, विस्तृत प्रविष्टि है। आप इसे नहीं समझते हैं। इसलिए। तुम क्या चाहते हो?
पीटर Flom - को पुनः स्थापित मोनिका

1
मुझे लगता है कि इसके बीच में कहीं है। मैं स्वीकार करता हूं कि मैं संवाद करने में सर्वश्रेष्ठ नहीं हूं, और मैं समझ सकता हूं कि आप हताशा में हैं। यह मेरा एक लक्षण है जो मैं वास्तव में बहुत जागरूक हूं। सच कहूं तो, मुझे लगता है कि मुझे इस बारे में सोचना होगा कि मैं वास्तव में क्या चाहता हूं - जैसा कि यह लगभग है कि मैं इस सवाल को पर्याप्त रूप से समझने की कोशिश कर रहा हूं कि यह एक ऐसे क्षेत्र में ओवरलैप हो गया है जहां मैं जागरूक नहीं था या पहले से नहीं जानता था के बारे में। यह ऐसी चीज के बारे में पूछना मुश्किल है जिसे आप सामान्य रूप से नहीं समझते हैं। मुझे लगता है कि मैं इसे करने के लिए वापस आना होगा।
ताल

1

हाल ही में बंद किए गए सवाल के जवाब के रूप में , यह ऊपर भी संबोधित करता है। नीचे ब्रैडली के क्लासिक डिस्ट्रीब्यूशन-फ्री स्टेटिस्टिकल टेस्ट्स (1968, पृष्ठ 15-16) का एक उद्धरण है , जो कि थोड़ा लंबा है, एक बहुत स्पष्ट स्पष्टीकरण है, मेरा मानना ​​है।

शब्द nonparametric और वितरण मुक्त समानार्थक नहीं हैं, और norterm उन आंकड़ों के वर्ग के बारे में पूरी तरह से संतोषजनक विवरण प्रदान करता है, जिनके लिए उन्हें संदर्भित किया जाता है।… मोटे तौर पर, एक nonparametric परीक्षण वह है जो किसी पैरामीटर के मूल्य के बारे में कोई परिकल्पना नहीं करता है। एक सांख्यिकीय घनत्व समारोह में, जबकि एक वितरण-मुक्त परीक्षण वह है जो नमूना आबादी के सटीक रूप के बारे में कोई धारणा नहीं बनाता है। परिभाषाएँ पारस्परिक रूप से अनन्य नहीं हैं, और एक परीक्षण दोनों वितरण-मुक्त और पैरामीट्रिक हो सकते हैं। ... वितरण-मुक्त होने का मतलब पूरी तरह से स्पष्ट होने के लिए, तीन वितरणों के बीच अंतर करना आवश्यक है: (ए) कि नमूना जनसंख्या; (ख) वास्तव में परीक्षण द्वारा उपयोग की गई अवलोकन-विशेषता; और (सी) परीक्षण सांख्यिकीय का। जिस वितरण से परीक्षण "मुक्त" होते हैं, वह है (ए), नमूना जनसंख्या। और वे जिस स्वतंत्रता का आनंद लेते हैं, वह आमतौर पर सापेक्ष होती है।… हालांकि धारणाएं कभी इतनी विस्तृत नहीं होतीं कि एक ऐसी आबादी को समझा जाए, जो पूरी तरह से निर्दिष्ट हो।… कारण ... बहुत सरल है: परिमाण का उपयोग इस तरह नहीं किया जाता है जैसे कि [गैर-समरूपता] परीक्षण। न ही कोई अन्य दृढ़ता से जुड़ी हुई जनसंख्या विशेषता है। बजाय न ही कोई अन्य दृढ़ता से जुड़ी हुई जनसंख्या विशेषता है। बजाय न ही कोई अन्य दृढ़ता से जुड़ी हुई जनसंख्या विशेषता है। बजायप्राप्त अवलोकनों के सैंपल- लिंक किए गए वर्णसंकर … टेस्ट स्टेटिस्टिक द्वारा उपयोग किए जाने वाले इनफॉर्मेटिकॉन प्रदान करते हैं।… इस प्रकार जब पैरामीट्रिक और नॉनपैरेमेट्रिक दोनों परीक्षणों के लिए आवश्यक है कि प्रपत्र f एक वितरण, अवलोकनों के साथ जुड़ा हुआ हो, पूरी तरह से ज्ञात हो, वह ज्ञान, पैरामीट्रिक मामले में। आम तौर पर आगामी विज्ञापन नहीं है परिमाण के आवश्यक वितरण इसलिए "अनुमानित" या अनुमानित या अधूरी जानकारी के आधार पर अनुमान होना चाहिए। गैरपरंपरागत मामले में, दूसरे पर और अवलोकन विशेषता की गड़बड़ीआमतौर पर एक प्राथमिकताओं से सटीक रूप से जाना जाता है और इसकी आवश्यकता नहीं है, इसलिए, "माना जाता है।" तब अंतर, आवश्यकता में से एक नहीं है, बल्कि इसकी आवश्यकता है और निश्चितता के अनुसार कि आवश्यकता पूरी हो जाएगी।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.