मैं टिप्पणी करने के लिए इस पैराग्राफ को छोड़ रहा हूं ताकि समझ में आए: मूल आबादी में सामान्यता की धारणा बहुत प्रतिबंधात्मक है, और इसे नमूना वितरण पर ध्यान केंद्रित करने के लिए क्षमा किया जा सकता है, और विशेष रूप से बड़े नमूनों के लिए केंद्रीय सीमा प्रमेय के लिए धन्यवाद।
टेस्ट लागू करना शायद एक अच्छा विचार है अगर (जैसा कि आमतौर पर होता है) आपको जनसंख्या भिन्नता का पता नहीं होता है, और आप इसके बजाय नमूना संस्करण का अनुमान लगाने वालों के रूप में उपयोग कर रहे हैं। ध्यान दें कि एक समान रूपांतरों के एफ परीक्षण के साथ समरूप रूपांतरों की धारणा को एफ परीक्षण के साथ परीक्षण करने की आवश्यकता हो सकती है - मेरे पास गीथहब पर कुछ नोट हैं ।t
जैसा कि आप उल्लेख करते हैं, नमूना वितरण बढ़ने पर टी-वितरण सामान्य वितरण में परिवर्तित हो जाता है, क्योंकि यह त्वरित आर प्लॉट प्रदर्शित करता है:
लाल में एक सामान्य वितरण की पीडीएफ है, और बैंगनी में, आप वितरण के पीडीएफ के "वसा पूंछ" (या भारी पूंछ) में प्रगतिशील परिवर्तन देख सकते हैं क्योंकि स्वतंत्रता की डिग्री बढ़ जाती है जब तक कि यह अंत में इसके साथ मिश्रित नहीं होती है सामान्य भूखंड।t
इसलिए बड़े नमूनों के साथ एक z- परीक्षण लागू करना ठीक होगा।
मेरे प्रारंभिक उत्तर के साथ मुद्दों को संबोधित करना। धन्यवाद, ओपी के साथ आपकी मदद के लिए ग्लेन_ बी (व्याख्या में संभावित नई गलतियां पूरी तरह से मेरी हैं)।
- टी सांख्यिकी वितरण में असमानता के कारण वितरण की स्थिति:
वन-सैंपल v। टू-सैंपल (युग्मित और अप्रकाशित) के लिए सूत्रों में एक तरफ जटिलताएं छोड़ते हुए, सामान्य t स्टेटिस्टिक एक नमूना माध्य की तुलना में जनसंख्या माध्य के मामले में ध्यान केंद्रित करता है:
t-test=X¯−μsn√=X¯−μσ/n√s2σ2−−−√=X¯−μσ/n−−√∑nx=1(X−X¯)2n−1σ2−−−−−−−−√(1)
यदि माध्य और विचरण साथ एक सामान्य वितरण का अनुसरण करता है :Xμσ2
- का अंश ।(1) ∼N(1,0)
- का हर का वर्गमूल हो जाएगा (स्केल किया गया चि), चूंकि जैसा कि यहां प्राप्त हुआ है ।(1) ( n - 1 ) एस 2 / σ 2 ~ χ 2 n - 1s2/σ2n−1∼1n−1χ2n−1(n−1)s2/σ2∼χ2n−1
- न्यूमरेटर और भाजक स्वतंत्र होना चाहिए।
इन कॉन्डिटों के तहत ।t-statistic∼t(df=n−1)
- केंद्रीय सीमा प्रमेय:
नमूना के नमूना वितरण की सामान्यता के प्रति झुकाव का मतलब है कि नमूना आकार में वृद्धि जनसंख्या के सामान्य न होने पर भी अंश के सामान्य वितरण को सही ठहरा सकती है। हालांकि, यह अन्य दो स्थितियों को प्रभावित नहीं करता है (हर के हर और भाजक का वितरण।
लेकिन सभी खो नहीं गए हैं, इस पोस्ट में चर्चा की गई है कि कैसे स्लटज़्की प्रमेय एक वितरण के लिए असममित अभिसरण का समर्थन करता है, भले ही हर का वितरण न हो।
- मजबूती:
पेपर पर "ए मोर रियलिस्टिक लुक ऑन रॉबस्टनेस एंड टाइप II एरर प्रॉपर्टीज द टी टेस्ट टू डिपार्टमेंट्स टू पॉपुलेशन नॉर्मलिटी" सॉविलोव्स्की एस एस और ब्लेयर आरसी इन साइकोलॉजिकल बुलेटिन, 1992, वॉल्यूम। 111, नंबर 2, 352-360 , जहां उन्होंने कम आदर्श या अधिक "वास्तविक दुनिया" (कम सामान्य) वितरण शक्ति और प्रकार I त्रुटियों के लिए परीक्षण किया, निम्नलिखित दावे पाए जा सकते हैं: "प्रकार के संबंध में रूढ़िवादी प्रकृति के बावजूद मैं इनमें से कुछ वास्तविक वितरणों के लिए टी परीक्षण में त्रुटि करता हूं, विभिन्न प्रकार की उपचार स्थितियों और नमूना आकारों का अध्ययन करने के लिए शक्ति के स्तर पर बहुत कम प्रभाव था। शोधकर्ता थोड़ा बड़ा नमूना आकार का चयन करके सत्ता में मामूली नुकसान की भरपाई आसानी से कर सकते हैं " ।
" प्रचलित दृश्य से प्रतीत होता है कि स्वतंत्र-नमूने टी परीक्षण काफी मजबूत है, टाइप I त्रुटियों के रूप में इनफ़ॉफ़र, गैर-गाऊसी जनसंख्या आकार के लिए इतने लंबे समय तक (ए) नमूना आकार बराबर या लगभग इतना है, (बी) नमूना आकार काफी बड़े हैं (बॉन्यू, 1960, 25 से 30 के नमूने के आकार का उल्लेख करते हैं), और (सी) परीक्षण एक-पुच्छ के बजाय दो-पूंछ हैं। ध्यान दें कि जब ये स्थितियां मिलती हैं और नाममात्र अल्फा और वास्तविक अल्फा के बीच अंतर करते हैं। आमतौर पर, विसंगतियां उदारवादी प्रकृति की बजाय रूढ़िवादी होती हैं। "
लेखक विषय के विवादास्पद पहलुओं पर बल देते हैं, और मैं प्रोफेसर हर्ले द्वारा उल्लिखित लॉगऑनॉर्मल वितरण के आधार पर कुछ सिमुलेशन पर काम करने के लिए उत्सुक हूं। मैं गैर-पैरामीट्रिक तरीकों (जैसे मान-व्हिटनी यू परीक्षण) के साथ कुछ मोंटे कार्लो तुलना के साथ भी आना चाहूंगा। इसलिए यह प्रगति पर है ...
सिमुलेशन:
डिस्क्लेमर: क्या निम्न प्रकार से इन अभ्यासों में से एक है "इसे स्वयं साबित करना" एक तरह से या कोई अन्य। परिणामों का उपयोग सामान्यीकरण बनाने के लिए नहीं किया जा सकता है (कम से कम मेरे द्वारा नहीं), लेकिन मुझे लगता है कि मैं कह सकता हूं कि इन दोनों (शायद त्रुटिपूर्ण) एमसी सिमुलेशन परिस्थितियों में टी परीक्षण के उपयोग के रूप में बहुत हतोत्साहित नहीं करते हैं। का वर्णन किया।
टाइप I एरर:
टाइप I त्रुटियों के मुद्दे पर, मैंने Lognormal वितरण का उपयोग करके एक मोंटे कार्लो सिमुलेशन चलाया। बड़े नमूनों ( ) को क्या माना जाता है इसे निकालने से कई बार पैरामीटर और साथ एक असामान्य वितरण से , मैंने टी-मान और पी-वैल्यू की गणना की जिसके परिणामस्वरूप अगर हम साधनों की तुलना करते हैं इन नमूनों में से, सभी एक ही आबादी से उत्पन्न होते हैं, और सभी एक ही आकार के होते हैं। Lognormal को टिप्पणियों और वितरण के दाईं ओर के तिरछेपन के आधार पर चुना गया था:μ = 0 σ = 1n=50μ=0σ=1
वास्तविक प्रकार I त्रुटि दर का एक महत्व स्तर सेट करना4.5 %5%4.5% , बहुत बुरा नहीं ...
वास्तव में प्राप्त टी परीक्षणों के घनत्व का प्लॉट टी-वितरण के वास्तविक पीडीएफ को ओवरलैप करने के लिए लग रहा था:
सबसे दिलचस्प हिस्सा टी परीक्षण के "भाजक" को देख रहा था, वह हिस्सा जो ची-स्क्वायड वितरण का पालन करने वाला था:
(n−1)s2/σ2=98(49(SD2A+SD2A))/98(eσ2−1)e2μ+σ2
यहाँ हम इस विकिपीडिया प्रविष्टि में सामान्य मानक विचलन का उपयोग कर रहे हैं :
SX1X2=(n1−1)S2X1+(n2−1)S2X2n1+n2−2−−−−−−−−−−−−−−−−−−−−−−√
और, आश्चर्यजनक रूप से (या नहीं) प्लॉट सुपरइम्पोज़्ड ची-स्क्वॉयर पीडीएफ के विपरीत था:
टाइप II त्रुटि और पावर:
रक्तचाप का वितरण लॉग-सामान्य संभव है , जो एक सिंथेटिक परिदृश्य सेट करने के लिए बेहद आसान है, जिसमें तुलनात्मक समूह नैदानिक प्रासंगिकता की दूरी से औसत मूल्यों में अलग हैं, एक नैदानिक अध्ययन में रक्तचाप के प्रभाव का परीक्षण करना कहते हैं डायस्टोलिक बीपी पर ध्यान केंद्रित करने वाली दवा, एक महत्वपूर्ण प्रभाव को एमएमएचजी की औसत बूंद माना जा सकता है (लगभग एमएमएचजी का एक एसडी चुना गया था):९109
इन काल्पनिक समूहों के बीच टाइप I त्रुटियों के लिए एक अन्यथा समान मोंटे कार्लो सिमुलेशन पर तुलनात्मक परीक्षण चल रहा है, और महत्व स्तर के साथ हम प्रकार II त्रुटियों के साथ समाप्त होते हैं, और केवल की शक्ति ।0.024 % 99 %5%0.024%99%
कोड यहाँ है ।