क्या मुझे अत्यधिक तिरछे डेटा पर टी-टेस्ट का उपयोग करना चाहिए? वैज्ञानिक प्रमाण, कृपया?


15

मेरे पास उपयोगकर्ताओं की भागीदारी (जैसे: पोस्ट की संख्या) के बारे में एक अत्यधिक तिरछी (एक घातांक वितरण की तरह) डेटासेट के नमूने हैं, जिनके विभिन्न आकार हैं (लेकिन 200 से कम नहीं) और मैं उनके मतलब की तुलना करना चाहता हूं। उसके लिए, मैं दो-नमूना अनपेक्षित टी-परीक्षणों का उपयोग कर रहा हूं (और वेल्च के कारक के साथ टी-परीक्षण, जब नमूने अलग-अलग संस्करण थे)। जैसा कि मैंने सुना है कि वास्तव में बड़े नमूनों के लिए, यह कोई फर्क नहीं पड़ता कि नमूना सामान्य वितरित नहीं हैं।

किसी ने, मैंने जो किया है उसकी समीक्षा करते हुए कहा कि मैं जिन परीक्षणों का उपयोग कर रहा हूं वे मेरे डेटा के लिए उपयुक्त नहीं थे। उन्होंने टी-परीक्षणों का उपयोग करने से पहले मेरे नमूनों को लॉग-ट्रांसफ़ॉर्म करने का सुझाव दिया।

मैं एक शुरुआत कर रहा हूं, इसलिए मुझे लगता है कि "भागीदारी मेट्रिक के लॉग" के साथ मेरे शोध सवालों के जवाब देने के लिए वास्तव में भ्रमित होना चाहिए।

क्या वे गलत हैं? क्या मै गलत हु? यदि वे गलत हैं, तो क्या कोई पुस्तक या वैज्ञानिक पेपर है जिसे मैं उन्हें उद्धृत / दिखा सकता हूं? अगर मैं गलत हूं, तो मुझे कौन सी परीक्षा का उपयोग करना चाहिए?


1
टी-टेस्ट में सामान्य वितरण धारणा csic.cornell.edu/Elrod/t-test/t-test-assumations.html है । आप सोच रहे होंगे कि नमूना जब पर्याप्त रूप से बड़ा होता है तो टी-वितरण सामान्य हो जाता है।
rdorlearn

6
इस संदर्भ में "वैज्ञानिक प्रमाण" का क्या अर्थ है?
Glen_b -Reinstate मोनिका

1
मैंने सोचा था कि यह धारणा थी कि एक निश्चित जनसंख्या से सभी संभव नमूनों के सभी साधन सामान्य होने चाहिए। इसलिए, सीएलटी द्वारा, यह मेरे डेटासेट के लिए भी सही होगा।
मिल्ना आराजू

1
वैज्ञानिक प्रमाण = कुछ अकादमिक प्रासंगिक: एक पुस्तक, एक पेपर, आदि
मिल्ना आराजू

जवाबों:


36

मैं 'घातीय' विशेष रूप से अत्यधिक तिरछा नहीं कहूंगा। उदाहरण के लिए, इसका लॉग विशिष्ट रूप से बाएं-तिरछा है, और इसका क्षण-तिरछापन केवल 2 है।

1) घातांक डेटा के साथ टी-टेस्ट का उपयोग करना और n पास 500 ठीक है :

ए) परीक्षण सांख्यिकीय का अंश ठीक होना चाहिए: यदि डेटा सामान्य पैमाने के साथ स्वतंत्र घातीय हैं (और उस की तुलना में काफी भारी नहीं हैं), तो उनका औसत गामा-वितरण के साथ आकार पैरामीटर के बराबर है जो टिप्पणियों की संख्या के बराबर है। इसका वितरण आकार पैरामीटर के बारे में 40 या उससे अधिक के लिए बहुत सामान्य दिखता है (यह इस बात पर निर्भर करता है कि पूंछ में कितनी दूर आपको सटीकता की आवश्यकता है)।

यह गणितीय प्रमाण में सक्षम है, लेकिन गणित विज्ञान नहीं है। आप अनुकरण के माध्यम से इसे अनुभव से देख सकते हैं, निश्चित रूप से, लेकिन यदि आप घातीयता के बारे में गलत हैं तो आपको बड़े नमूनों की आवश्यकता हो सकती है। एक्सपोनेंशियल डेटा के नमूने (और इसलिए, नमूना का मतलब) का वितरण ऐसा लगता है जब n = 40:

यहाँ छवि विवरण दर्ज करें

बहुत थोड़ा तिरछा। यह तिरछापन नमूना आकार के वर्गमूल के रूप में घटता है। तो n = 160 पर, यह तिरछा के रूप में आधा है। N = 640 पर यह तिरछा के रूप में एक चौथाई है:

यहाँ छवि विवरण दर्ज करें

यह प्रभावी रूप से सममित है, इसे माध्य पर पलट कर और शीर्ष पर प्लॉट करके देखा जा सकता है:

यहाँ छवि विवरण दर्ज करें

नीला मूल है, लाल फ़्लिप है। जैसा कि आप देख रहे हैं, वे लगभग संयोग हैं।

-

n=40

यहाँ छवि विवरण दर्ज करें

n=500

-

ग) वास्तव में क्या मायने रखता है, हालांकि, शून्य के तहत पूरे आंकड़े का वितरण है। अंकीय की सामान्यता पर्याप्त नहीं है कि टी-स्टेटिस्टिक का टी-वितरण हो। हालाँकि, घातीय-डेटा के मामले में, यह भी एक समस्या नहीं है:

यहाँ छवि विवरण दर्ज करें

n=40n=500n=500

ध्यान दें, हालांकि, वास्तव में घातीय डेटा के लिए, मानक विचलन केवल भिन्न होगा यदि साधन अलग हैं। अगर घातीय अनुमान है, तो अशक्त के तहत, अलग-अलग आबादी के संस्करणों के बारे में चिंता करने की कोई विशेष आवश्यकता नहीं है, क्योंकि वे केवल विकल्प के तहत होते हैं। तो एक समान-विचरण टी-परीक्षण अभी भी ठीक होना चाहिए (जिस स्थिति में उपरोक्त अच्छा सन्निकटन आपको हिस्टोग्राम में दिखाई दे रहा है वह थोड़ा और भी बेहतर हो सकता है)।


2) लॉग लेना फिर भी आपको इसका अर्थ निकालने की अनुमति दे सकता है, हालाँकि

लॉगλ1लॉगλ2λ1λ2

[यदि आप लॉग में वह परीक्षण करते हैं, तो मैं उस मामले में बराबर-भिन्नता परीक्षण करने का सुझाव देना चाहूंगा।]

इसलिए - शायद एक वाक्य के दो हस्तक्षेप या कनेक्शन को सही ठहराने के साथ, जो मेरे पास है, उसके समान है - आपको भागीदारी मीट्रिक के लॉग के बारे में नहीं, बल्कि भागीदारी मीट्रिक के बारे में अपने निष्कर्ष लिखने में सक्षम होना चाहिए।


3) आप कर सकते हैं अन्य चीजों के बहुत सारे है!

a) आप घातीय डेटा के लिए उपयुक्त परीक्षण कर सकते हैं। संभावना अनुपात आधारित परीक्षण प्राप्त करना आसान है। जैसा कि ऐसा होता है, घातीय डेटा के लिए आपको एक-पुच्छ मामले में इस स्थिति के लिए एक छोटा-सा नमूना एफ-टेस्ट (साधनों के अनुपात के आधार पर) मिलता है; दो पूंछ वाले LRT में आमतौर पर छोटे नमूने के आकार के लिए प्रत्येक पूंछ में एक समान अनुपात नहीं होगा। (टी-टेस्ट की तुलना में यह बेहतर शक्ति होनी चाहिए, लेकिन टी-टेस्ट के लिए शक्ति काफी उचित होनी चाहिए, और मुझे उम्मीद है कि आपके नमूना आकार में बहुत अंतर नहीं होगा।)

बी) आप एक क्रमचय-परीक्षण कर सकते हैं - यहां तक ​​कि अगर आप चाहें तो इसे टी-परीक्षण के आधार पर भी करें। तो केवल एक चीज जो बदलती है वह है पी-वैल्यू की गणना। या आप कुछ अन्य रेज़मैपलिंग परीक्षण कर सकते हैं जैसे कि बूटस्ट्रैप-आधारित परीक्षण। इसके पास अच्छी शक्ति होनी चाहिए, हालांकि यह आंशिक रूप से इस बात पर निर्भर करेगा कि आपके पास जो वितरण है, उसके सापेक्ष आप कौन से परीक्षण को चुनते हैं।

ग) आप रैंक-आधारित गैर-समरूप परीक्षण (जैसे विल्कोक्सन-मान-व्हिटनी) कर सकते हैं। यदि आप मानते हैं कि यदि वितरण भिन्न होते हैं, तो वे केवल एक स्केल फैक्टर (घातांक सहित विभिन्न प्रकार के तिरछा वितरण के लिए उपयुक्त) से भिन्न होते हैं, तो आप स्केल मापदंडों के अनुपात के लिए एक विश्वास अंतराल भी प्राप्त कर सकते हैं।

[उस उद्देश्य के लिए, मैं लॉग-स्केल (लॉग में स्केल शिफ्ट के लॉग होने के स्थान पर बदलाव) पर काम करने का सुझाव दूंगा। यह पी-वैल्यू को नहीं बदलेगा, लेकिन यह आपको स्केल अनुमान के लिए एक अंतराल प्राप्त करने के लिए पॉइंट एस्टीमेशन और CI लिमिट्स को एक्सप्लेन करने की अनुमति देगा।]

यदि आप घातीय स्थिति में हैं, तो भी, इसमें बहुत अच्छी शक्ति होनी चाहिए, लेकिन संभव है कि टी-टेस्ट का उपयोग करने के रूप में अच्छा न हो।


एक संदर्भ जो स्थान परिवर्तन के विकल्प के लिए मामलों के एक बहुत व्यापक सेट को मानता है (उदाहरण के लिए, शून्य के तहत विचरण और तिरछापन विषमता दोनों के साथ)

फेजरलैंड, एमडब्ल्यू और एल। सैंडविक (2009),
"असमान परिवर्तन के साथ तिरछे वितरण के लिए पांच दो-नमूना स्थान परीक्षणों का प्रदर्शन,"
समकालीन नैदानिक ​​परीक्षण , 30 , 490-496

यह आमतौर पर वेल्च यू-टेस्ट (वेल्च द्वारा विचार किए गए कई परीक्षणों में से एक और वे एक ही परीक्षण करते हैं) की सिफारिश करने के लिए जाता है। यदि आप बिल्कुल वैल्च स्टैटिस्टिक का उपयोग नहीं कर रहे हैं, तो सिफारिशें कुछ हद तक भिन्न हो सकती हैं (हालांकि शायद ज्यादा नहीं)। [ध्यान दें कि यदि आपके वितरण घातीय हैं, तो आप स्केल विकल्प में रुचि रखते हैं जब तक कि आप लॉग नहीं लेते ... जिस स्थिति में आपके पास असमान संस्करण नहीं होंगे।]


4
बहुत बढ़िया जवाब! मैं वास्तव में दंग रह गया कि आपने एक ही पोस्ट में कितनी जानकारी पैक की है
क्रिश्चियन सॉयर

@Glen_b, यह एक भयानक जवाब है! आपका बहुत बहुत धन्यवाद। बस एक और सवाल: मेरे नमूने एक ही डाटासेट से आते हैं। मैं विशेषता X वाले उपयोगकर्ताओं के नमूनों की तुलना करना चाहता हूं और विशेषताओं वाले उपयोगकर्ताओं के नमूने Y। उपयोगकर्ताओं के नमूने X लगभग ~ 500 हैं और उपयोगकर्ताओं Y के नमूने लगभग ~ 10000 हैं। आकार में बहुत बड़ा अंतर है, लेकिन यह उनके आकार (घनत्व और संभाव्यता भूखंडों को देखते हुए) में बहुत बड़ा अंतर नहीं है। वैसे भी टी-टेस्ट का उपयोग करना एक समस्या होगी?
मिलेना आरुजो

जब आप कहते हैं कि "आकार में भारी अंतर" क्या आप नमूना आकार (10000 बनाम 500) या प्रत्येक समूह के भीतर विशिष्ट मूल्यों के बारे में बात कर रहे हैं? (संयोग से, ये निरंतर या असतत हैं? इस प्रकार के डेटा के लिए विशिष्ट न्यूनतम मूल्य कितने छोटे हैं? क्या आकार में समान लॉग हैं - यानी यह सिर्फ एक स्केल बदलाव है जिस पर हम विचार कर रहे हैं?)
Glen_b -Reinstate Monica

1
आप उस तरह के डेटा के लिए एक तालिका के साथ बेहतर हो सकते हैं। महत्वपूर्ण जानकारी यह है कि यह सिर्फ असतत नहीं है, बल्कि यह है कि लगभग सभी मूल्य सबसे कम प्रश्नों की संख्या में हैं। यदि आप एक हिस्टोग्राम करते हैं, तो इसे बिना मोहरों के प्लॉट करें, और सुनिश्चित करें कि सभी निम्न मान अलग-अलग हैं (प्रत्येक, 0, 1, 2 में से प्रत्येक के लिए बार उन्हें संयोजन नहीं करते हैं)। दाएं से काटना बेहतर है और बाएं को अधिक फैलाना (जहां लगभग सभी डेटा है), जब तक आप यह स्पष्ट करते हैं कि यदि आप किसी भी तरह से काटते हैं, तो दाईं ओर अधिक है। इस बारे में जानकारी शामिल करें कि आप क्या माप रहे हैं और आप क्या हासिल करने की कोशिश कर रहे हैं ... (ctd)
Glen_b -Reate Monica

1
@ मेरे जवाब का हिस्सा 1.c यह स्पष्ट रूप से संबोधित करता है और यह देखता है कि चर्चा के तहत मामले में यह कितना मायने रखता है (समान नमूना आकार में लगभग घातीय वितरण)
Glen_b -Reinstate Monica
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.