एक ही डेटा सेट के साथ एक साथ 25 परीक्षण करते समय chl ने पहले ही कई तुलनाओं के जाल का उल्लेख किया। इसे संभालने का एक आसान तरीका है कि परीक्षणों की संख्या (इस मामले में 25) से विभाजित करके पी मूल्य सीमा को समायोजित करें। अधिक सटीक सूत्र है: समायोजित p मान = 1 - (1 - p मान) ^ (1 / n)। हालाँकि, दो अलग-अलग सूत्र लगभग एक ही समायोजित p मान प्राप्त करते हैं।
आपकी परिकल्पना परीक्षण अभ्यास के साथ एक और प्रमुख मुद्दा है। आप निश्चित रूप से टाइप I त्रुटि (गलत सकारात्मक) में भाग लेंगे, जिससे आप कुछ वास्तव में तुच्छ अंतरों को उजागर करेंगे जो 99.9999% के स्तर पर बेहद महत्वपूर्ण हैं। ऐसा इसलिए है क्योंकि जब आप इतने बड़े आकार (n = 1,313,662) के नमूने के साथ सौदा करते हैं, तो आपको एक मानक त्रुटि मिलेगी जो 0. के बहुत करीब है। ऐसा इसलिए है क्योंकि 1,313,662 = 1,146 का वर्गमूल है। तो, आप मानक विचलन को 1,146 से विभाजित करेंगे। संक्षेप में, आप मिनट के अंतर को पकड़ लेंगे जो पूरी तरह से सारहीन हो सकता है।
मेरा सुझाव है कि आप इस परिकल्पना परीक्षण ढांचे से दूर चले जाएं और इसके बजाय एक प्रभाव आकार प्रकार विश्लेषण करें। इस ढांचे के भीतर सांख्यिकीय दूरी का माप मानक विचलन है। मानक त्रुटि के विपरीत, नमूना के आकार से मानक विचलन कृत्रिम रूप से सिकुड़ नहीं रहा है। और, यह दृष्टिकोण आपको आपके डेटा सेटों के बीच सामग्री अंतर की बेहतर समझ देगा। प्रभाव आकार भी औसत औसत अंतर के आसपास विश्वास अंतराल पर अधिक केंद्रित है जो सांख्यिकीय महत्व पर परिकल्पना परीक्षण फोकस की तुलना में बहुत अधिक जानकारीपूर्ण है जो अक्सर महत्वपूर्ण नहीं होता है। उम्मीद है की वो मदद करदे।