मतलब के लिए मजबूत टी-टेस्ट


17

मैं एक वैकल्पिक चर लिए, स्थानीय वैकल्पिक विपरीत n का परीक्षण करने का प्रयास कर रहा हूं , जो कि मध्यम से मध्यम तिरछा और यादृच्छिक चर के कर्टोसिस के अधीन है। विलकॉक्स द्वारा 'परिचय टू रोबस्ट एस्टिमेशन एंड हाइपोथिसिस टेस्टिंग' में दिए गए सुझावों के बाद, मैंने ट्रिम किए गए माध्य, माध्यियन के साथ-साथ स्थान के एम-आकलनकर्ता (विल्कोक्स '"एक-चरण) की प्रक्रिया पर ध्यान दिया है। ये मजबूत परीक्षण शक्ति के संदर्भ में मानक टी-टेस्ट को बेहतर बनाते हैं, जब वितरण के साथ परीक्षण किया जाता है जो गैर-तिरछा होता है, लेकिन लेप्टोक्यूरोटिक।E[X]=0E[X]>0X

हालाँकि, जब वितरण को तिरछा करके परीक्षण किया जाता है, तो ये एकतरफा परीक्षण या तो बहुत अधिक उदार होते हैं या दूर की परिकल्पना के तहत बहुत कम रूढ़िवादी होते हैं, यह इस बात पर निर्भर करता है कि वितरण क्रमशः छोड़ा गया है या दायाँ-तिरछा। उदाहरण के लिए, 1000 टिप्पणियों के साथ, माध्यिका पर आधारित परीक्षण वास्तव में नाममात्र 5% के स्तर पर ~ 40% समय को अस्वीकार कर देगा। इसका कारण स्पष्ट है: तिरछे वितरणों के लिए, माध्यिका और माध्य भिन्न होते हैं। हालांकि, मेरे आवेदन में, मुझे वास्तव में माध्य का परीक्षण करने की आवश्यकता है, मध्यिका की नहीं, छंटनी वाले माध्य की नहीं।

क्या टी-टेस्ट का एक अधिक मजबूत संस्करण है जो वास्तव में माध्य के लिए परीक्षण करता है, लेकिन तिरछा और कुर्तोसिस के लिए अभेद्य है?

आदर्श रूप से प्रक्रिया नो-स्क्यू, हाई-कुर्टोसिस केस में भी अच्छी तरह से काम करेगी। 'वन-स्टेप' टेस्ट लगभग काफी अच्छा है, जिसमें 'बेंड' पैरामीटर अपेक्षाकृत अधिक है, लेकिन यह तिरछे मतलब परीक्षणों की तुलना में कम शक्तिशाली है, जब कोई तिरछा नहीं होता है, और कुछ परेशानियों को तिरछा के तहत नाममात्र के स्तर को बनाए रखने में परेशानी होती है ।

पृष्ठभूमि: मैं वास्तव में माध्य, और माध्यिका के बारे में परवाह करता हूं, यह परीक्षण एक वित्तीय अनुप्रयोग में उपयोग किया जाएगा। उदाहरण के लिए, यदि आप परीक्षण करना चाहते हैं कि क्या पोर्टफोलियो में सकारात्मक अपेक्षित लॉग रिटर्न था, तो इसका मतलब वास्तव में उचित है क्योंकि यदि आप पोर्टफोलियो में निवेश करते हैं, तो आप सभी रिटर्न का अनुभव करेंगे (जो नमूनों की संख्या का मतलब है), बजाय माध्यिका का डुप्लिकेट। यही है, मैं वास्तव में आरवी एक्स से एन ड्रॉ के योग के बारे में परवाह करता हूं ।nnX


क्या कोई कारण है जो वेल्च टी-टेस्ट के उपयोग को प्रतिबंधित करता है? इस प्रश्न के मेरे उत्तर पर एक नज़र डालें ( आंकड़े.stackexchange.com/questions/305/… ) जहां मैं गैर-सामान्यता और विषमलैंगिकता के मामले में वेल्च के उपयोग की वकालत करने वाले एक पेपर का संदर्भ देता हूं।
हेनरिक

1
E[X]=μE[X1]=E[X2]

स्पष्टीकरण देने के लिए धन्यवाद। इस मामले में कुबिंगर कागज आपके लिए बहुत उपयोगी नहीं होगा। मुझे क्षमा करें।
हेनरिक

जवाबों:


5

आप गैर-पैरामीट्रिक परीक्षण क्यों देख रहे हैं? क्या टी-टेस्ट की मान्यताओं का उल्लंघन किया गया है? अर्थात्, सामान्य या गैर-सामान्य डेटा और अनिश्चित संस्करण? बेशक, यदि आपका नमूना काफी बड़ा है, तो आप नमूना में सामान्यता की कमी के बावजूद अपनी अधिक शक्ति के साथ पैरामीट्रिक टी-परीक्षण को सही ठहरा सकते हैं। इसी तरह अगर आपकी चिंता असमान भिन्नता है, तो पैरामीट्रिक परीक्षण में सुधार होते हैं जो सटीक पी-वैल्यू (वेल्च सुधार) उत्पन्न करते हैं।

अन्यथा, टी-टेस्ट के लिए अपने परिणामों की तुलना इस बारे में जाने का एक अच्छा तरीका नहीं है, क्योंकि मान्यताओं के पूरा नहीं होने पर टी-टेस्ट के परिणाम पक्षपाती हैं। मान-व्हिटनी यू एक उपयुक्त गैर-पैरामीट्रिक विकल्प है, अगर आपको वास्तव में इसकी आवश्यकता है। यदि आप गैर-पैरामीट्रिक परीक्षण का उपयोग कर रहे हैं तो आप केवल शक्ति खो देते हैं जब आप उचित रूप से टी-परीक्षण का उपयोग कर सकते हैं (क्योंकि मान्यताओं को पूरा किया जाता है)।

और, बस कुछ और पृष्ठभूमि के लिए, यहां जाएं ...

http://www.jerrydallal.com/LHSP/STUDENT.HTM


डेटा निश्चित रूप से सामान्य नहीं है। अतिरिक्त कुर्तोसिस 10-20 के क्रम पर है, तिरछा -0.2 से 0.2 के क्रम पर है। मैं 1-नमूना टी-परीक्षण कर रहा हूं, इसलिए मुझे यकीन नहीं है कि मैं 'असमान परिवर्तन' या यू-परीक्षण के बारे में आपका अनुसरण कर रहा हूं।
Shabbychef

मैं 'एक पैरामीट्रिक परीक्षण का उपयोग करें' सलाह को स्वीकार कर रहा हूं। यह मेरे सवाल का बिल्कुल हल नहीं करता है, लेकिन मेरा सवाल शायद बहुत खुला था।
shabbychef

12

मैं इस बात से सहमत हूं कि यदि आप वास्तव में परीक्षण करना चाहते हैं कि क्या समूह के साधन अलग-अलग हैं (जैसे कि समूह के मध्यस्थों या छंटनी के साधनों, आदि के बीच अंतर का परीक्षण करने के लिए), तो आप एक गैर-समरूप परीक्षण का उपयोग नहीं करना चाहते हैं जो एक अलग परिकल्पना का परीक्षण करता है।

  1. टी-टेस्ट से सामान्य पी-वैल्यू में अवशिष्टों की सामान्यता की धारणा के मध्यम से सटीक प्रस्थान दिए जाते हैं। इस मजबूती पर एक अंतर्ज्ञान पाने के लिए इस एप्लेट को देखें : http://onlinestatbook.com/stat_sim/robustness/index.html

  2. यदि आप अभी भी सामान्य धारणा के उल्लंघन के बारे में चिंतित हैं, तो आप बूटस्ट्रैप करना चाह सकते हैं । जैसे, http://biostat.mc.vanderbilt.edu/wiki/pub/Main/JenniferThompson/ms_mtg_18oct07.pdf

  3. आप सामान्यता से प्रस्थान के साथ मुद्दों को हल करने के लिए तिरछे आश्रित चर को भी बदल सकते हैं ।


2
+1 अच्छा और स्पष्ट जवाब। जेरॉमी, क्या मैं बिंदु 3 के बारे में एक प्रश्न पूछ सकता हूं? मैं डेटा को बदलने के पीछे के तर्क को समझता हूं, लेकिन कुछ ने मुझे हमेशा ऐसा करने के लिए परेशान किया। अनियंत्रित डेटा में ट्रांसफ़ॉर्म किए गए डेटा पर टी-टेस्ट के परिणामों की रिपोर्ट करने की वैधता क्या है (जहां आपको टी-टेस्ट करने के लिए "अनुमति नहीं है")? दूसरे शब्दों में, यदि डेटा के होने पर दो समूह भिन्न होते हैं, उदाहरण के लिए, लॉग रूपांतरित, तो किन आधारों पर आप कह सकते हैं कि कच्चा डेटा भी भिन्न है? ध्यान में रखते हुए, मैं एक सांख्यिकीविद् नहीं हूं, इसलिए शायद मैंने कुछ बेवकूफी भरी बात कही :)
nico

2
@nico मुझे यकीन नहीं है कि परिणामों के बारे में कैसे रिपोर्ट करें या सोचें, लेकिन अगर आप सभी को दिखाना चाहते हैं कि कुछ X और Y के लिए, mu_X! = mu_Y, यह सच होना चाहिए कि सभी X_i <X_j के लिए, लॉग करें! X_i) <log (X_j) और सभी के लिए X_i> X_j, log (X_i)> लॉग (X_j)। इसलिए गैर-पैरामीट्रिक परीक्षणों के लिए जो रैंक के साथ काम करते हैं, डेटा के रूपांतरण परिणाम को प्रभावित नहीं करते हैं। मुझे लगता है कि इससे आप यह मान सकते हैं कि यदि कुछ परीक्षण से पता चलता है कि mu_log (X)! = Mu_log (Y), तो mu_X! = Mu_Y।
JoFrhwld

उत्तर के लिए धन्यवाद। वास्तव में, टी-टेस्ट मामूली रूप से तिरछे / कर्टोटिक इनपुट के तहत नाममात्र प्रकार I दर को बनाए रखने के लिए प्रकट होता है। हालाँकि, मैं और अधिक शक्ति के साथ कुछ के लिए उम्मीद कर रहा था। पुन: 2, मैंने विलकॉक्स 'को लागू किया है trimpbऔर trimcibt, लेकिन वे मेरी शक्ति परीक्षण करने के लिए थोड़ा धीमा हैं, कम से कम मेरे स्वाद के लिए। पुन: 3, मैंने इस विधि के बारे में सोचा था, लेकिन मैं अन-ट्रांसफ़ॉर्म किए गए डेटा के माध्यम से दिलचस्पी ले रहा हूं (यानी, मैं 2 आरवी की तुलना टी-टेस्ट से नहीं कर रहा हूं, इस स्थिति में, एक मोनोटोनिक ट्रांसफॉर्मेशन ठीक रहेगा एक रैंक-आधारित तुलना, जैसा कि @JoFrhwld द्वारा नोट किया गया है।)
shabbychef

2
@ निको यदि अवशिष्टों का जनसंख्या वितरण दो समूहों में समान है, तो मुझे लगता है कि किसी भी समय कच्ची आबादी के समूह में अंतर होता है, समूह-क्रम परिवर्तन के साधन के अंतर में भी अंतर होगा। कहा गया है कि, पी-वैल्यू और कॉन्फिडेंस अंतराल थोड़े बदलाव के आधार पर तय करेंगे कि आप कच्चे डेटा का उपयोग कर रहे हैं या ट्रांसफॉर्म किए गए डेटा का। सामान्य तौर पर मैं परिवर्तन का उपयोग करना पसंद करता हूं जब वे चर को समझने के लिए एक सार्थक मीट्रिक की तरह लगते हैं (उदाहरण के लिए, रिक्टर स्केल, डेसीबल, काउंट के लॉग आदि)।
जेरोमी एंग्लिम


0

मेरे पास एक टिप्पणी के लिए पर्याप्त प्रतिष्ठा नहीं है, इस प्रकार एक उत्तर के रूप में: इस विचलन पर एक नज़र डालें। मुझे लगता है कि यह एक उत्कृष्ट उत्तर प्रदान करता है। संक्षेप में:

स्पर्शोन्मुख प्रदर्शन कुरूपता की तुलना में तिरछापन के रूप में सामान्यता से विचलन के लिए बहुत अधिक संवेदनशील होता है ... इस प्रकार छात्र का टी-टेस्ट तिरछा करने के लिए संवेदनशील होता है लेकिन भारी पूंछ के खिलाफ अपेक्षाकृत मजबूत होता है, और इसके लिए परीक्षण का उपयोग करना उचित होता है सामान्यता जो टी-टेस्ट को लागू करने से पहले तिरछा विकल्पों की ओर निर्देशित की जाती है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.