टी परीक्षणों के लिए "लगभग सामान्य" का आकलन


12

मैं वेल्च के टी-टेस्ट का उपयोग करके साधनों की समानता का परीक्षण कर रहा हूं। अंतर्निहित वितरण (एक संबंधित चर्चा में अधिक उदाहरण से विषम सामान्य से दूर है यहाँ )। मैं अधिक डेटा प्राप्त कर सकता हूं, लेकिन यह निर्धारित करने के कुछ राजसी तरीके चाहूंगा कि ऐसा किस हद तक किया जाए।

  1. क्या मूल्यांकन करने के लिए एक अच्छा अनुमान है कि नमूना वितरण स्वीकार्य है? सामान्यता से कौन से विचलन सबसे अधिक संबंधित हैं?
  2. क्या अन्य दृष्टिकोण हैं - उदाहरण के लिए नमूना आंकड़े के लिए एक बूटस्ट्रैप विश्वास अंतराल पर भरोसा करना - जो अधिक समझ में आता है?

2
यह एक बड़ा सवाल है। सामान्यता के अलावा परीक्षण "अनिवार्य रूप से बेकार" है? (पहले से ही जुड़ा हुआ), दो और संबंधित प्रश्न हैं कि छोटे नमूनों में टी-टेस्ट या गैर-पैरामीट्रिक परीक्षण जैसे विलकॉक्सन का चयन कैसे करें? और गैर-सामान्य के लिए टी-टेस्ट जब एन> 50? इस सवाल का एक अच्छा जवाब संभवतः इन दो संबंधित प्रश्नों के पाठकों के लिए मूल्यवान होगा।
सिल्वरफिश

जहाँ तक मुझे पता है कि वितरण के लिए कितने डेटा की आवश्यकता है, यह निर्धारित करने के लिए कोई सामान्य तरीका नहीं है, "सामान्य रूप से पर्याप्त"। ऐसा इसलिए है क्योंकि "सामान्य पर्याप्त" को परिभाषित करना कठिन है, और यह इस बात पर निर्भर करेगा कि अंतर्निहित वितरण कितना गैर-सामान्य है, विशेष तरीके के अलावा जिसमें आप सामान्यता से विदा हो रहे हैं। यदि आपके पास गंभीर रूप से गैर-सामान्य डेटा है तो मैं इसके बजाय गैर-पैरामीट्रिक परीक्षण का उपयोग करूंगा। नकारात्मक पक्ष यह है कि आप आत्मविश्वास अंतराल प्राप्त करने में सक्षम नहीं होंगे जो कि लोन परिकल्पना परीक्षणों की तुलना में अधिक उपयोगी हैं।
dsaxton

2
मैं मानता हूं कि "सामान्य रूप से पर्याप्त" परिभाषित करना कठिन है, लेकिन अनुभवजन्य डेटा के बारे में तर्क करने से पहले प्रत्येक व्यवसायी को मूल्यांकन करना होगा, यही कारण है कि मुझे आश्चर्य है कि मैं कितनी छोटी चर्चा को उजागर करने में सक्षम रहा हूं (शायद मैं गलत स्थानों में देख रहा हूं) । उपयोग के मामलों के लिए मेरे मन में यहाँ (जो कि काफी सामान्य लगता है) गैर-पैरामीट्रिक परीक्षण "सामान्य पर्याप्त" नमूना वितरण सुनिश्चित करने के लिए अधिक डेटा एकत्र करने की तुलना में असंतोषजनक हैं।
cohoz

जवाबों:


1

जैसा कि टी परीक्षण सामान्यता मानता है, और आपके अंतर्निहित वितरण सामान्य नहीं हैं, नमूना वितरण स्वीकार्य है यह निर्धारित करने का एक निर्धारित तरीका नहीं हो सकता है। हालांकि, जैसा कि नमूना आकार "बड़ा" हो जाता है, केंद्रीय सीमा प्रमेय अंदर चला जाता है, और आप एक बड़े नमूना जेड-परीक्षण का उपयोग कर सकते हैं, जो अनिवार्य रूप से आपको टी -टेस्ट के समान उत्तर देगा क्योंकि टी सामान्य वितरण के साथ आता है। बड़े नमूने।

आँकड़े पुस्तकें / पाठ्यक्रम अक्सर यह कहते हैं कि 25 या 30 सीएलटी के एक नमूना आकार में एक उपयोगी तरीके से खेल में आता है। हालाँकि, मेरा अनुभव यह रहा है कि सैकड़ों बड़े नमूना z- परीक्षणों में नमूना आकारों के साथ अभी भी बहुत खराब हो सकते हैं (जैसे, गिनती डेटा के साथ)।

मेरी राय में, एक क्रमचय परीक्षण आपकी समस्या के लिए एक अच्छा फिट है। इसमें डिब्बाबंद गैर-समरूप परीक्षण (जैसे, मान-व्हिटनी) की तुलना में समान या बेहतर शक्ति होनी चाहिए और आपको सामान्यता के मुद्दे के बारे में चिंता करने की आवश्यकता नहीं है। और, वे लिखने में मज़ेदार हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.