क्या लॉग-रूपांतरण गैर-सामान्य डेटा के परीक्षण के लिए एक मान्य तकनीक है?


19

एक पेपर की समीक्षा करते हुए, लेखक कहते हैं, "सामान्य परिणाम की सामान्य मान्यताओं को संतुष्ट करने के लिए टी परीक्षणों के आयोजित होने से पहले, एक विषम वितरण को प्रदर्शित करने वाले निरंतर परिणाम चर को प्राकृतिक लघुगणक का उपयोग करते हुए रूपांतरित किया गया था।"

क्या यह गैर-सामान्य डेटा का विश्लेषण करने का एक स्वीकार्य तरीका है, खासकर यदि अंतर्निहित वितरण जरूरी नहीं कि लॉगऑनॉर्मल है?

यह एक बहुत ही असामान्य सवाल हो सकता है, लेकिन मैंने इससे पहले ऐसा नहीं देखा है ...।


3
ठीक है, यदि प्रारंभिक वितरण लॉग-सामान्य नहीं है, तो रूपांतरित डेटा सामान्यता की पूर्वापेक्षित मान्यताओं को संतुष्ट नहीं करता है, इसलिए परिवर्तन द्वारा क्या प्राप्त किया जा रहा है?
मैक्रो

@ मकारो - काफी सच! (+1) - वे शायद केवल वितरण को सममित के करीब लाना चाहते थे, जो कि टी-टेस्टिंग के लिए करना कोई बुरी बात नहीं है, लेकिन, जब तक कि उन्होंने जाँच नहीं की और इसे लिखा नहीं, हमें पता नहीं है कि लॉग परिवर्तन ने एक नकारात्मक तिरछा को प्रेरित किया है जो शायद मामलों को और भी बदतर बना दिया है ...
1

2
हम यह अनुमान लगा सकते हैं कि क्योंकि यह सामान्यता को संतुष्ट करने के लिए किया गया था, और सामान्यता को पहले स्थान पर जांचा गया था, उस सामान्यता को बाद में जांचा गया था। यह यहां की भाषा में दृढ़ता से निहित है।
जॉन

10
लघुगणक के लिए एक टी-परीक्षण न तो अनियंत्रित डेटा के लिए एक टी-टेस्ट के समान है और न ही एक गैर-परीक्षणात्मक परीक्षण। लॉग पर टी-परीक्षण ज्यामितीय साधनों की तुलना करता है, न कि (सामान्य) अंकगणितीय साधनों की। यह तय करने में कई महत्वपूर्ण कारणों में से एक है कि क्या लघुगणक का उपयोग स्वीकार्य है (जो कि यह आवेदन के आधार पर हो सकता है)।
whuber

जवाबों:


9

सामान्यता में किसी प्रकार के परिवर्तन को लागू करने की कोशिश करना सामान्य है (उदाहरण के लिए, लघुगणक, वर्गमूल, ... का उपयोग करते हुए) डेटा के साथ सामना किया जो सामान्य नहीं है। जबकि लघुगणक डेटा को अक्सर तिरछे डेटा के लिए अच्छे परिणाम देता है, इस बात की कोई गारंटी नहीं है कि यह इस विशेष मामले में काम करेगा। परिवर्तित डेटा का विश्लेषण करते समय एक व्यक्ति को @whubers को भी ध्यान में रखना चाहिए: "लॉगरिदम के लिए एक टी-टेस्ट न तो अनट्रॉन्फ़ॉर्म किए गए डेटा के लिए एक टी-टेस्ट और न ही एक नॉनपरमेट्रिक टेस्ट के समान है। लॉग पर टी-टेस्ट ज्यामितीय तुलना करता है। (सामान्य) अंकगणित का मतलब नहीं है। "

सामान्यता के परिवर्तन को हमेशा सामान्य धारणा की जांच के बाद किया जाना चाहिए, ताकि यह आकलन किया जा सके कि परिवर्तित डेटा "सामान्य रूप से पर्याप्त" दिखता है या नहीं। यह उदाहरण हिस्टोग्राम, क्यूक्यू-प्लॉट और सामान्यता के लिए परीक्षण का उपयोग करके किया जा सकता है। टी-टेस्ट विशेष रूप से तिरछापन के रूप में सामान्यता से विचलन के प्रति संवेदनशील है और इसलिए सामान्यता के लिए एक परीक्षण जो कि तिरछा विकल्पों की ओर निर्देशित है, बेहतर होगा। पियर्सन का नमूना तिरछा इस मामले में एक उपयुक्त परीक्षण आँकड़ा है।n-1Σमैं=1n(एक्समैं-एक्स¯)3(n-1Σमैं=1n(एक्समैं-एक्स¯)2)3/2

एक रूपांतरण चुनने के बजाय (जैसे कि लघुगणक) क्योंकि यह ज्यादातर समय काम करता है, मैं दिए गए डेटा का उपयोग करके परिवर्तन चुनने के लिए बॉक्स-कॉक्स प्रक्रिया का उपयोग करना पसंद करता हूं । हालाँकि इसके साथ कुछ दार्शनिक मुद्दे भी हैं; विशेष रूप से क्या यह टी-टेस्ट में स्वतंत्रता की डिग्री की संख्या को प्रभावित करना चाहिए, क्योंकि हमने नमूना से कुछ जानकारी का उपयोग किया है, जिसे चुनने पर उपयोग करने के लिए बदलना होता है।

अंत में, एक परिवर्तन के बाद टी-टेस्ट का उपयोग करने का एक अच्छा विकल्प या क्लासिकल नॉनपैरेमेट्रिक टेस्ट , टी-टेस्ट के बूटस्ट्रैप एनालॉग का उपयोग करना है । इसमें सामान्यता की धारणा की आवश्यकता नहीं होती है और यह अनियंत्रित साधनों (और किसी चीज़ के बारे में नहीं) के बारे में एक परीक्षा है।


1
+1 अच्छा, अंत में एक अच्छी सिफारिश के साथ विचारशील चर्चा। टी-टेस्ट के बूटस्ट्रैप / रीसम्पलिंग / क्रमपरिवर्तन संस्करण के बारे में अधिक जानकारी के लिए, कृपया हाल ही में देखे जाने वाले धागे पर देखें
whuber

0

आमतौर पर अगर टी-टेस्ट करने के लिए आवश्यक धारणाएं पूरी नहीं होती हैं, तो गैर-पैरामीट्रिक परीक्षण का उपयोग करना अधिक उपयुक्त होगा।


5
शायद। गैर पैरामीट्रिक परीक्षण लगभग हमेशा तुलना माध्यिकाओं (या अन्य शतमक) के बजाय साधन और इसलिए वास्तव में एक अलग प्रश्न को हल। लेकिन यह वर्तमान प्रश्न का एक उपयोगी उत्तर की तरह नहीं लगता है, जो डेटा के लॉग के टी-परीक्षण के बारे में विशेष रूप से (और केवल) पूछता है।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.