मैं 'घातीय' विशेष रूप से अत्यधिक तिरछा नहीं कहूंगा। उदाहरण के लिए, इसका लॉग विशिष्ट रूप से बाएं-तिरछा है, और इसका क्षण-तिरछापन केवल 2 है।
1) घातांक डेटा के साथ टी-टेस्ट का उपयोग करना और n पास 500 ठीक है :
ए) परीक्षण सांख्यिकीय का अंश ठीक होना चाहिए: यदि डेटा सामान्य पैमाने के साथ स्वतंत्र घातीय हैं (और उस की तुलना में काफी भारी नहीं हैं), तो उनका औसत गामा-वितरण के साथ आकार पैरामीटर के बराबर है जो टिप्पणियों की संख्या के बराबर है। इसका वितरण आकार पैरामीटर के बारे में 40 या उससे अधिक के लिए बहुत सामान्य दिखता है (यह इस बात पर निर्भर करता है कि पूंछ में कितनी दूर आपको सटीकता की आवश्यकता है)।
यह गणितीय प्रमाण में सक्षम है, लेकिन गणित विज्ञान नहीं है। आप अनुकरण के माध्यम से इसे अनुभव से देख सकते हैं, निश्चित रूप से, लेकिन यदि आप घातीयता के बारे में गलत हैं तो आपको बड़े नमूनों की आवश्यकता हो सकती है। एक्सपोनेंशियल डेटा के नमूने (और इसलिए, नमूना का मतलब) का वितरण ऐसा लगता है जब n = 40:
बहुत थोड़ा तिरछा। यह तिरछापन नमूना आकार के वर्गमूल के रूप में घटता है। तो n = 160 पर, यह तिरछा के रूप में आधा है। N = 640 पर यह तिरछा के रूप में एक चौथाई है:
यह प्रभावी रूप से सममित है, इसे माध्य पर पलट कर और शीर्ष पर प्लॉट करके देखा जा सकता है:
नीला मूल है, लाल फ़्लिप है। जैसा कि आप देख रहे हैं, वे लगभग संयोग हैं।
-
n = 40
n = 500
-
ग) वास्तव में क्या मायने रखता है, हालांकि, शून्य के तहत पूरे आंकड़े का वितरण है। अंकीय की सामान्यता पर्याप्त नहीं है कि टी-स्टेटिस्टिक का टी-वितरण हो। हालाँकि, घातीय-डेटा के मामले में, यह भी एक समस्या नहीं है:
n = 40n = 500n = 500
ध्यान दें, हालांकि, वास्तव में घातीय डेटा के लिए, मानक विचलन केवल भिन्न होगा यदि साधन अलग हैं। अगर घातीय अनुमान है, तो अशक्त के तहत, अलग-अलग आबादी के संस्करणों के बारे में चिंता करने की कोई विशेष आवश्यकता नहीं है, क्योंकि वे केवल विकल्प के तहत होते हैं। तो एक समान-विचरण टी-परीक्षण अभी भी ठीक होना चाहिए (जिस स्थिति में उपरोक्त अच्छा सन्निकटन आपको हिस्टोग्राम में दिखाई दे रहा है वह थोड़ा और भी बेहतर हो सकता है)।
2) लॉग लेना फिर भी आपको इसका अर्थ निकालने की अनुमति दे सकता है, हालाँकि
लॉगλ1≠ लॉगλ2λ1≠ λ2
[यदि आप लॉग में वह परीक्षण करते हैं, तो मैं उस मामले में बराबर-भिन्नता परीक्षण करने का सुझाव देना चाहूंगा।]
इसलिए - शायद एक वाक्य के दो हस्तक्षेप या कनेक्शन को सही ठहराने के साथ, जो मेरे पास है, उसके समान है - आपको भागीदारी मीट्रिक के लॉग के बारे में नहीं, बल्कि भागीदारी मीट्रिक के बारे में अपने निष्कर्ष लिखने में सक्षम होना चाहिए।
3) आप कर सकते हैं अन्य चीजों के बहुत सारे है!
a) आप घातीय डेटा के लिए उपयुक्त परीक्षण कर सकते हैं। संभावना अनुपात आधारित परीक्षण प्राप्त करना आसान है। जैसा कि ऐसा होता है, घातीय डेटा के लिए आपको एक-पुच्छ मामले में इस स्थिति के लिए एक छोटा-सा नमूना एफ-टेस्ट (साधनों के अनुपात के आधार पर) मिलता है; दो पूंछ वाले LRT में आमतौर पर छोटे नमूने के आकार के लिए प्रत्येक पूंछ में एक समान अनुपात नहीं होगा। (टी-टेस्ट की तुलना में यह बेहतर शक्ति होनी चाहिए, लेकिन टी-टेस्ट के लिए शक्ति काफी उचित होनी चाहिए, और मुझे उम्मीद है कि आपके नमूना आकार में बहुत अंतर नहीं होगा।)
बी) आप एक क्रमचय-परीक्षण कर सकते हैं - यहां तक कि अगर आप चाहें तो इसे टी-परीक्षण के आधार पर भी करें। तो केवल एक चीज जो बदलती है वह है पी-वैल्यू की गणना। या आप कुछ अन्य रेज़मैपलिंग परीक्षण कर सकते हैं जैसे कि बूटस्ट्रैप-आधारित परीक्षण। इसके पास अच्छी शक्ति होनी चाहिए, हालांकि यह आंशिक रूप से इस बात पर निर्भर करेगा कि आपके पास जो वितरण है, उसके सापेक्ष आप कौन से परीक्षण को चुनते हैं।
ग) आप रैंक-आधारित गैर-समरूप परीक्षण (जैसे विल्कोक्सन-मान-व्हिटनी) कर सकते हैं। यदि आप मानते हैं कि यदि वितरण भिन्न होते हैं, तो वे केवल एक स्केल फैक्टर (घातांक सहित विभिन्न प्रकार के तिरछा वितरण के लिए उपयुक्त) से भिन्न होते हैं, तो आप स्केल मापदंडों के अनुपात के लिए एक विश्वास अंतराल भी प्राप्त कर सकते हैं।
[उस उद्देश्य के लिए, मैं लॉग-स्केल (लॉग में स्केल शिफ्ट के लॉग होने के स्थान पर बदलाव) पर काम करने का सुझाव दूंगा। यह पी-वैल्यू को नहीं बदलेगा, लेकिन यह आपको स्केल अनुमान के लिए एक अंतराल प्राप्त करने के लिए पॉइंट एस्टीमेशन और CI लिमिट्स को एक्सप्लेन करने की अनुमति देगा।]
यदि आप घातीय स्थिति में हैं, तो भी, इसमें बहुत अच्छी शक्ति होनी चाहिए, लेकिन संभव है कि टी-टेस्ट का उपयोग करने के रूप में अच्छा न हो।
एक संदर्भ जो स्थान परिवर्तन के विकल्प के लिए मामलों के एक बहुत व्यापक सेट को मानता है (उदाहरण के लिए, शून्य के तहत विचरण और तिरछापन विषमता दोनों के साथ)
फेजरलैंड, एमडब्ल्यू और एल। सैंडविक (2009),
"असमान परिवर्तन के साथ तिरछे वितरण के लिए पांच दो-नमूना स्थान परीक्षणों का प्रदर्शन,"
समकालीन नैदानिक परीक्षण , 30 , 490-496
यह आमतौर पर वेल्च यू-टेस्ट (वेल्च द्वारा विचार किए गए कई परीक्षणों में से एक और वे एक ही परीक्षण करते हैं) की सिफारिश करने के लिए जाता है। यदि आप बिल्कुल वैल्च स्टैटिस्टिक का उपयोग नहीं कर रहे हैं, तो सिफारिशें कुछ हद तक भिन्न हो सकती हैं (हालांकि शायद ज्यादा नहीं)। [ध्यान दें कि यदि आपके वितरण घातीय हैं, तो आप स्केल विकल्प में रुचि रखते हैं जब तक कि आप लॉग नहीं लेते ... जिस स्थिति में आपके पास असमान संस्करण नहीं होंगे।]