मैंने सीखा है कि छोटे नमूने का आकार अपर्याप्त शक्ति और टाइप 2 त्रुटि का कारण बन सकता है। हालाँकि, मुझे लगता है कि छोटे नमूने आमतौर पर अविश्वसनीय हो सकते हैं और संयोग से किसी भी तरह का परिणाम हो सकता है। क्या यह सच है?
मैंने सीखा है कि छोटे नमूने का आकार अपर्याप्त शक्ति और टाइप 2 त्रुटि का कारण बन सकता है। हालाँकि, मुझे लगता है कि छोटे नमूने आमतौर पर अविश्वसनीय हो सकते हैं और संयोग से किसी भी तरह का परिणाम हो सकता है। क्या यह सच है?
जवाबों:
एक सामान्य सिद्धांत के रूप में, छोटे नमूने का आकार सरल कारण के लिए टाइप I त्रुटि दर में वृद्धि नहीं करेगा जो कि टाइप I दर को नियंत्रित करने के लिए परीक्षण की व्यवस्था है। (असतत परिणामों से जुड़े मामूली तकनीकी अपवाद हैं, जो नाममात्र प्रकार I दर को विशेष रूप से छोटे नमूना आकारों के साथ बिल्कुल प्राप्त नहीं होने का कारण बन सकते हैं।)
यहां एक महत्वपूर्ण सिद्धांत है: यदि आपके परीक्षण में स्वीकार्य आकार (= नाममात्र प्रकार I दर) है और आपके द्वारा खोजे जा रहे प्रभाव के लिए स्वीकार्य शक्ति है, तो भले ही नमूना आकार छोटा हो।
खतरा यह है कि अगर हम अन्यथा स्थिति के बारे में बहुत कम जानते हैं - शायद ये हमारे पास मौजूद सभी डेटा हैं - तो हम "टाइप III" त्रुटियों के बारे में चिंतित हो सकते हैं: अर्थात्, मॉडल गलत-विनिर्देश। उन्हें छोटे नमूने सेट के साथ जांचना मुश्किल हो सकता है।
विचारों के परस्पर क्रिया के व्यावहारिक उदाहरण के रूप में , मैं एक कहानी साझा करूंगा। बहुत पहले मुझे एक पर्यावरणीय सफाई की पुष्टि करने के लिए एक नमूना आकार की सिफारिश करने के लिए कहा गया था। यह पूर्व-सफाई चरण के दौरान था जब हमारे पास कोई डेटा था। मेरी योजना ने 1000 या तो नमूनों का विश्लेषण करने का आह्वान किया जो कि सफाई के दौरान प्राप्त किए जाएंगे (यह स्थापित करने के लिए कि प्रत्येक स्थान पर पर्याप्त मिट्टी को हटा दिया गया है) और बाद में दूषित एकाग्रता के माध्य और विचरण का आकलन करने के लिए। तब (बहुत सरल बनाने के लिए), मैंने कहा कि हम एक पाठ्यपुस्तक सूत्र का उपयोग करेंगे - निर्दिष्ट शक्ति और परीक्षण आकार के आधार पर - स्वतंत्र पुष्टि नमूनों की संख्या निर्धारित करने के लिए जो सफाई को सफल बनाने के लिए उपयोग किया जाएगा।
इस बात को यादगार बना दिया कि सफाई के बाद, सूत्र ने केवल 3 नमूनों का उपयोग करने के लिए कहा। अचानक मेरी सिफारिश बहुत विश्वसनीय नहीं लग रही थी!
केवल 3 नमूनों की आवश्यकता का कारण यह है कि सफाई आक्रामक थी और अच्छी तरह से काम करती थी। इसने 500 पीपीएम के लक्ष्य से लगभग 100 कम या 100 पीपीएम तक औसत संकेंद्रण कम कर दिया।
अंत में इस दृष्टिकोण ने काम किया क्योंकि हमने 1000 पिछले नमूने (कम विश्लेषणात्मक गुणवत्ता के साथ: वे अधिक माप त्रुटि थे) प्राप्त करने के लिए यह स्थापित करने के लिए कि सांख्यिकीय अनुमान इस साइट के लिए वास्तव में अच्छे थे। इस प्रकार टाइप III त्रुटि की संभावना को संभाला गया।
आपके विचार के लिए एक और मोड़: नियामक एजेंसी को जानना सिर्फ 3 नमूनों का उपयोग करना कभी मंजूर नहीं होगा, मैंने 5 माप प्राप्त करने की सिफारिश की। इन्हें पूरी साइट के 25 रैंडम नमूनों से बनाया जाना था, 5. समूह में रचना की गई। सांख्यिकीय रूप से अंतिम परिकल्पना परीक्षण में केवल 5 नंबर होंगे, लेकिन हमने 25 शारीरिक रूप से एक अलग "हॉट स्पॉट" का पता लगाने के लिए अधिक शक्ति प्राप्त की। नमूने हैं। यह परीक्षण में कितने नंबरों का उपयोग किया जाता है और उन्हें कैसे प्राप्त किया गया था, के बीच महत्वपूर्ण संबंध पर प्रकाश डाला गया । संख्या के साथ सिर्फ एल्गोरिदम की तुलना में सांख्यिकीय निर्णय लेने के लिए अधिक है!
मेरे चिरस्थायी राहत के लिए, पांच समग्र मूल्यों की पुष्टि की सफाई लक्ष्य को पूरा किया गया था।
एक छोटे नमूने का एक और परिणाम टाइप 2 त्रुटि की वृद्धि है।
1960 में "मनोविज्ञान में सांख्यिकी का स्थान" नामक पेपर में दिखाया गया कि छोटे नमूने आम तौर पर एक बिंदु शून्य परिकल्पना को अस्वीकार करने में विफल होते हैं। ये परिकल्पनाएं परिकल्पना हैं जिनके कुछ पैरामीटर शून्य के बराबर हैं, और माना अनुभव में गलत माना जाता है।
इसके विपरीत, बहुत बड़े नमूने टाइप 1 त्रुटि को बढ़ाते हैं क्योंकि पी-मूल्य नमूने के आकार पर निर्भर करता है, लेकिन महत्व का अल्फा स्तर तय होता है। इस तरह के नमूने पर एक परीक्षण हमेशा शून्य परिकल्पना को खारिज करेगा। जॉनसन और डगलस (1999) द्वारा "सांख्यिकीय महत्व परीक्षण का महत्व" पढ़ें इस मुद्दे का अवलोकन करने के लिए।
यह सवाल का सीधा जवाब नहीं है लेकिन ये विचार पूरक हैं।