समग्र प्रकार I त्रुटि जब बार-बार संचय डेटा का परीक्षण


12

मेरे पास समूह अनुक्रमिक विधियों के बारे में एक प्रश्न है ।

विकिपीडिया के अनुसार:

दो उपचार समूहों के साथ यादृच्छिक परीक्षण में, शास्त्रीय समूह अनुक्रमिक परीक्षण का उपयोग निम्नलिखित तरीके से किया जाता है: यदि प्रत्येक समूह में एन विषय उपलब्ध हैं, तो 2 एन विषयों पर एक अंतरिम विश्लेषण किया जाता है। सांख्यिकीय विश्लेषण दो समूहों की तुलना करने के लिए किया जाता है, और यदि वैकल्पिक परिकल्पना को स्वीकार किया जाता है, तो परीक्षण समाप्त हो जाता है। अन्यथा, प्रति समूह n विषयों के साथ, दूसरे 2n विषयों के लिए परीक्षण जारी है। सांख्यिकीय विश्लेषण 4n विषयों पर फिर से किया जाता है। यदि विकल्प स्वीकार कर लिया जाता है, तो परीक्षण समाप्त कर दिया जाता है। अन्यथा, यह 2 एन विषयों के एन सेट उपलब्ध होने तक आवधिक मूल्यांकन के साथ जारी रहता है। इस बिंदु पर, अंतिम सांख्यिकीय परीक्षण आयोजित किया जाता है, और परीक्षण बंद कर दिया जाता है

लेकिन इस तरह से बार-बार डेटा जमा करने के परीक्षण से, मुझे त्रुटि स्तर का प्रकार फुलाया जाता है ...

यदि नमूने एक दूसरे से स्वतंत्र थे, तो समग्र प्रकार I त्रुटि, , होगाα

α=1(1α)k

जहां प्रत्येक परीक्षण का स्तर है, और अंतरिम रूप की संख्या है।αk

लेकिन नमूने ओवरलैप होने के बाद से स्वतंत्र नहीं हैं। मान लें कि अंतरिम विश्लेषण समान सूचना वेतन वृद्धि पर किया जाता है, तो यह पाया जा सकता है कि (स्लाइड 6)

यहाँ छवि विवरण दर्ज करें

क्या आप मुझे समझा सकते हैं कि यह तालिका कैसे प्राप्त की जाती है?

जवाबों:


12

14 के माध्यम से निम्नलिखित स्लाइड, विचार की व्याख्या करें। बिंदु, जैसा कि आप ध्यान दें, यह है कि आंकड़ों का क्रम सहसंबद्ध है।

प्रसंग ज्ञात मानक विचलन वाला एक z- परीक्षण है। पहला परीक्षण आँकड़ा , उपयुक्त रूप से मानकीकृत, cdf साथ एक सामान्य (0,1) वितरण है । तो दूसरा सांख्यिकीय करता है , लेकिन - क्योंकि पहला दूसरे के लिए उपयोग किए गए डेटा के सबसेट का उपयोग करता है - दो आँकड़े सहसंबंध गुणांक साथ संबंधित हैं । इसलिए में एक असामान्य वितरण है। एक प्रकार I त्रुटि (अशक्त परिकल्पना के तहत) की संभाव्यता की समानता है कि या तो (a) एक प्रकार I त्रुटि पहले परीक्षण में होती है या (b) एक प्रकार I त्रुटि पहली परीक्षा में नहीं होती है लेकिन होती है दूसरा परीक्षण। चलोz1Φz21/2(z1,z2)c=Φ1(10.05/2)महत्वपूर्ण मान हो (नाममात्र आकार = 0.05 के साथ दो तरफा परीक्षण के लिए )। फिर दो विश्लेषणों के बाद एक प्रकार की त्रुटि का मौका मुझे मिलता है या और । संख्यात्मक एकीकरण इस संभावना के लिए मान ०.०11३११ for for देता है, जिससे तालिका सहमत है। तालिका में बाद के मान समान तर्क (और अधिक जटिल एकीकरण) के साथ प्राप्त किए जाते हैं।α|z1|>c|z1|c|z2|>c

इस ग्राफिक में बायनेरिअल पीडीएफ और एकीकरण का क्षेत्र (ठोस सतह) दर्शाया गया है। बायनेरिअल पीडीएफ, 3 डी सतह प्लॉट


समझ गए, धन्यवाद! क्या सहसंबंध cor (z1, z2) प्राप्त करना मुश्किल है?
ओसराम

@ मार्को, सहसंबंध गणना के लिए सीधा है क्योंकि परीक्षण आँकड़ा इतना सरल है: यह सामान्य चर का एक रैखिक संयोजन है। (ऐसा इसलिए है क्योंकि हम मानते हैं कि विचरण ज्ञात है।) वैकल्पिक रूप से, आप दो स्वतंत्र यादृच्छिक चर की राशि के रूप में दूसरी आँकड़ा के बारे में सोच सकते हैं: पहला एक, , और अतिरिक्त डेटा द्वारा बनाया गया परिवर्तन, । अधिक जटिल मामलों में सहसंबंध की गणना करना काफी मुश्किल हो सकता है: यही एक कारण है कि कुछ हद तक आदर्श स्थिति का उपयोग अनुक्रमिक परीक्षणों को प्रेरित करने के लिए किया जाता है! z1z1z2
whuber

आपका बहुत बहुत धन्यवाद। हां, सहसंबंध गणना के लिए बहुत आसान लगता है। दरअसल, मेरे लिए यह स्पष्ट नहीं था कि संदर्भ दो सामान्य वितरण के साधनों की तुलना था। अब, यह स्पष्ट है और आप बाकी सब कुछ बहुत स्पष्ट करते हैं! धन्यवाद!
ओसराम

क्या आप एक सूत्र (या R कोड) प्रदान कर सकते हैं कि कैसे इस उदाहरण के लिए n = 400 की गणना करें? मैं अपने आप से ऐसा करूंगा लेकिन दुर्भाग्य से मुझे नहीं पता कि कैसे। और अगर मैं एकाधिक तुलना (जैसे 4 अनुपात की तुलना) करूं और समग्र त्रुटि दर की गणना करना चाहता हूं, तो मुझे सूत्र को कैसे समायोजित करना होगा और बोनफर्रोनी की तरह सुधार न करें और बार-बार परीक्षण करें? क्या आप मेरी मदद कर सकते हैं?
एंड्रियास
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.