क्या छोटा नमूना आकार टाइप 1 त्रुटि का कारण बन सकता है?


21

मैंने सीखा है कि छोटे नमूने का आकार अपर्याप्त शक्ति और टाइप 2 त्रुटि का कारण बन सकता है। हालाँकि, मुझे लगता है कि छोटे नमूने आमतौर पर अविश्वसनीय हो सकते हैं और संयोग से किसी भी तरह का परिणाम हो सकता है। क्या यह सच है?


मेरे पास अनावश्यक गणितीय संकेतन के लिए एक विरोधाभास है, इसलिए मैंने शीर्षक संपादित किया है, क्या आप कृपया जांच सकते हैं कि मैंने इसे बदलकर अर्थ नहीं बदला?
mpiktas

1
परिकल्पना परीक्षण (नेमन-पियर्सन परीक्षण) और महत्व परीक्षण (फ़िशर परीक्षण) के बारे में भी बात करना सुनिश्चित करें। ये दृष्टिकोण आमतौर पर मिश्रित होते हैं, भले ही दूसरे में त्रुटि की कोई धारणा न हो, और उचित उपयोग अलग-अलग होने चाहिए क्योंकि वे विभिन्न प्रकार के निष्कर्षों की ओर ले जाते हैं।
सेब

यदि आप एक विषम परीक्षा का उपयोग कर रहे हैं तो, हाँ, यह संभव है। अन्यथा, नहीं - परीक्षण को टाइप 1 त्रुटि दर (यानी ) को नियंत्रित करने के लिए परिभाषित किया गया है । α
मैक्रो

लेकिन क्या यह सच नहीं है, यदि आप दो बार सिक्कों को फड़फड़ा रहे हैं, तो जब आप 100 बार फ़्लिप कर रहे होते हैं, तो आपकी तुलना में तिरछे परिणाम (2 समान पक्ष (100%)) होने की संभावना अधिक होती है, जिसके परिणाम लगभग 1 / होंगे। 2, 1/2। क्या यह इंगित नहीं करता है कि आकार जितना छोटा होगा, उतनी ही अधिक संभावना होगी कि मैं टाइप त्रुटि कर सकता हूं?

जवाबों:


27

एक सामान्य सिद्धांत के रूप में, छोटे नमूने का आकार सरल कारण के लिए टाइप I त्रुटि दर में वृद्धि नहीं करेगा जो कि टाइप I दर को नियंत्रित करने के लिए परीक्षण की व्यवस्था है। (असतत परिणामों से जुड़े मामूली तकनीकी अपवाद हैं, जो नाममात्र प्रकार I दर को विशेष रूप से छोटे नमूना आकारों के साथ बिल्कुल प्राप्त नहीं होने का कारण बन सकते हैं।)

यहां एक महत्वपूर्ण सिद्धांत है: यदि आपके परीक्षण में स्वीकार्य आकार (= नाममात्र प्रकार I दर) है और आपके द्वारा खोजे जा रहे प्रभाव के लिए स्वीकार्य शक्ति है, तो भले ही नमूना आकार छोटा हो।

खतरा यह है कि अगर हम अन्यथा स्थिति के बारे में बहुत कम जानते हैं - शायद ये हमारे पास मौजूद सभी डेटा हैं - तो हम "टाइप III" त्रुटियों के बारे में चिंतित हो सकते हैं: अर्थात्, मॉडल गलत-विनिर्देश। उन्हें छोटे नमूने सेट के साथ जांचना मुश्किल हो सकता है।

विचारों के परस्पर क्रिया के व्यावहारिक उदाहरण के रूप में , मैं एक कहानी साझा करूंगा। बहुत पहले मुझे एक पर्यावरणीय सफाई की पुष्टि करने के लिए एक नमूना आकार की सिफारिश करने के लिए कहा गया था। यह पूर्व-सफाई चरण के दौरान था जब हमारे पास कोई डेटा था। मेरी योजना ने 1000 या तो नमूनों का विश्लेषण करने का आह्वान किया जो कि सफाई के दौरान प्राप्त किए जाएंगे (यह स्थापित करने के लिए कि प्रत्येक स्थान पर पर्याप्त मिट्टी को हटा दिया गया है) और बाद में दूषित एकाग्रता के माध्य और विचरण का आकलन करने के लिए। तब (बहुत सरल बनाने के लिए), मैंने कहा कि हम एक पाठ्यपुस्तक सूत्र का उपयोग करेंगे - निर्दिष्ट शक्ति और परीक्षण आकार के आधार पर - स्वतंत्र पुष्टि नमूनों की संख्या निर्धारित करने के लिए जो सफाई को सफल बनाने के लिए उपयोग किया जाएगा।

इस बात को यादगार बना दिया कि सफाई के बाद, सूत्र ने केवल 3 नमूनों का उपयोग करने के लिए कहा। अचानक मेरी सिफारिश बहुत विश्वसनीय नहीं लग रही थी!

केवल 3 नमूनों की आवश्यकता का कारण यह है कि सफाई आक्रामक थी और अच्छी तरह से काम करती थी। इसने 500 पीपीएम के लक्ष्य से लगभग 100 कम या 100 पीपीएम तक औसत संकेंद्रण कम कर दिया।

अंत में इस दृष्टिकोण ने काम किया क्योंकि हमने 1000 पिछले नमूने (कम विश्लेषणात्मक गुणवत्ता के साथ: वे अधिक माप त्रुटि थे) प्राप्त करने के लिए यह स्थापित करने के लिए कि सांख्यिकीय अनुमान इस साइट के लिए वास्तव में अच्छे थे। इस प्रकार टाइप III त्रुटि की संभावना को संभाला गया।

आपके विचार के लिए एक और मोड़: नियामक एजेंसी को जानना सिर्फ 3 नमूनों का उपयोग करना कभी मंजूर नहीं होगा, मैंने 5 माप प्राप्त करने की सिफारिश की। इन्हें पूरी साइट के 25 रैंडम नमूनों से बनाया जाना था, 5. समूह में रचना की गई। सांख्यिकीय रूप से अंतिम परिकल्पना परीक्षण में केवल 5 नंबर होंगे, लेकिन हमने 25 शारीरिक रूप से एक अलग "हॉट स्पॉट" का पता लगाने के लिए अधिक शक्ति प्राप्त की। नमूने हैं। यह परीक्षण में कितने नंबरों का उपयोग किया जाता है और उन्हें कैसे प्राप्त किया गया था, के बीच महत्वपूर्ण संबंध पर प्रकाश डाला गया संख्या के साथ सिर्फ एल्गोरिदम की तुलना में सांख्यिकीय निर्णय लेने के लिए अधिक है!

मेरे चिरस्थायी राहत के लिए, पांच समग्र मूल्यों की पुष्टि की सफाई लक्ष्य को पूरा किया गया था।


1
आक्रामक सफाई और टाइप III त्रुटि के बारे में (+1) बढ़िया कहानी , अगर यह आर्थिक समय श्रृंखला के लिए भी प्रासंगिक होगा तो अच्छा होगा। नियतात्मक मॉडल या कम शोर अनुपात वाले मॉडल के लिए छोटे नमूना आकार IMHO सबसे बड़ी समस्या नहीं होगी (तुलना में बहुत शोर की संभावना स्वतंत्र बड़े नमूना डेटा, यहां तक ​​कि प्रमुख घटक इन लोगों के साथ कठिन हैं)।
सेल्युल

1
+1, उन लोगों के लिए जो पहले पैराग्राफ में वर्णित "असतत परिणामों से जुड़े तकनीकी अपवाद" को समझने में रुचि रखते हैं, मैं उन लोगों के बारे में यहां चर्चा करता हूं: पी-मूल्यों, महत्व स्तरों और तुलनात्मक रूप से त्रुटि की तुलना करना
गूँग - मोनिका

1
+1, आप बिना किसी महत्वपूर्ण जानकारी के उपयोगी नमूना आकार में एक जंगली छुरा क्यों नहीं ले सकते, इसका महान उदाहरण।
फ्राई हैरिसन

0

एक छोटे नमूने का एक और परिणाम टाइप 2 त्रुटि की वृद्धि है।

1960 में "मनोविज्ञान में सांख्यिकी का स्थान" नामक पेपर में दिखाया गया कि छोटे नमूने आम तौर पर एक बिंदु शून्य परिकल्पना को अस्वीकार करने में विफल होते हैं। ये परिकल्पनाएं परिकल्पना हैं जिनके कुछ पैरामीटर शून्य के बराबर हैं, और माना अनुभव में गलत माना जाता है।

इसके विपरीत, बहुत बड़े नमूने टाइप 1 त्रुटि को बढ़ाते हैं क्योंकि पी-मूल्य नमूने के आकार पर निर्भर करता है, लेकिन महत्व का अल्फा स्तर तय होता है। इस तरह के नमूने पर एक परीक्षण हमेशा शून्य परिकल्पना को खारिज करेगा। जॉनसन और डगलस (1999) द्वारा "सांख्यिकीय महत्व परीक्षण का महत्व" पढ़ें इस मुद्दे का अवलोकन करने के लिए।

यह सवाल का सीधा जवाब नहीं है लेकिन ये विचार पूरक हैं।


बड़े नमूनों और टाइप I त्रुटि के मुद्दे पर कॉल करने के लिए +1
जोश हेमन

6
-1, टिप्पणी है कि "बहुत बड़े नमूने टाइप 1 त्रुटि को बढ़ाते हैं" गलत है। आप सांख्यिकीय महत्व और व्यावहारिक महत्व को भ्रमित कर सकते हैं, इसमें ऐसी स्थिति मौजूद हो सकती है जहां सही प्रभाव 0 नहीं है, लेकिन इतना छोटा है कि यह असंगत है, और हम व्यावहारिक उद्देश्यों के लिए शून्य 'सही' पर विचार करेंगे । इस स्थिति में, शून्य को 5% से अधिक (जैसे) समय से खारिज कर दिया जाएगा, और अधिक बार w / बढ़ती एन। हालांकि, कड़ाई से बोलते हुए, शून्य परिकल्पना कि सही प्रभाव 0 है, वजीफा द्वारा, गलत है। इस प्रकार, ये अस्वीकृति वास्तव में I त्रुटियाँ नहीं हैं।
गूँग - मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.