मैं एक ही जांच के भीतर कई-परिकल्पना सुधार के महत्व को पहचानने से @fcoppens छलांग से दृढ़ता से असहमत हूं, यह दावा करने के लिए कि "एक ही तर्क से, एक ही धारण करता है यदि कई दल इन परीक्षणों का प्रदर्शन करते हैं।"
इसमें कोई सवाल नहीं है कि अधिक अध्ययन किए जाते हैं और अधिक परिकल्पनाओं का परीक्षण किया जाता है, अधिक टाइप I त्रुटियां होंगी। लेकिन मुझे लगता है कि "परिवार-वार त्रुटि" दरों के अर्थ पर यहाँ एक भ्रम है और वे वास्तविक वैज्ञानिक कार्यों में कैसे लागू होते हैं।
सबसे पहले, याद रखें कि बहु-परीक्षण सुधार आमतौर पर पोस्ट-हॉक तुलनाओं में उत्पन्न हुए थे, जिसके लिए पहले से तैयार की गई परिकल्पना नहीं थी। यह बिल्कुल स्पष्ट नहीं है कि जब हाइपोथेसिस का एक छोटा पूर्व निर्धारित सेट होता है तो उसी सुधार की आवश्यकता होती है।
दूसरा, एक व्यक्तिगत प्रकाशन का "वैज्ञानिक सत्य" प्रकाशन के भीतर प्रत्येक व्यक्ति के कथन की सच्चाई पर निर्भर नहीं करता है। एक अच्छी तरह से डिज़ाइन किया गया अध्ययन कई अलग-अलग दृष्टिकोणों से एक समग्र वैज्ञानिक (सांख्यिकीय के विपरीत) परिकल्पना के करीब पहुंचता है, और वैज्ञानिक परिकल्पना का मूल्यांकन करने के लिए विभिन्न प्रकार के परिणामों को एक साथ रखता है। प्रत्येक व्यक्तिगत परिणाम का मूल्यांकन एक सांख्यिकीय परीक्षण द्वारा किया जा सकता है।
तथापि @fcoppens से तर्क करके, भले ही एक उन व्यक्तिगत सांख्यिकीय परीक्षण के तो एक प्रकार मैं त्रुटि है कि एक " 'वैज्ञानिक सत्य' की गलत धारणा" करने के लिए होता है। यह केवल गलत है।
एक प्रकाशन में वैज्ञानिक परिकल्पना का "वैज्ञानिक सत्य" , एक व्यक्तिगत सांख्यिकीय परीक्षण की वैधता के विपरीत, आमतौर पर विभिन्न प्रकार के साक्ष्य के संयोजन से आता है। कई प्रकार के सबूतों पर जोर एक वैज्ञानिक परिकल्पना की वैधता को व्यक्तिगत गलतियों से मजबूत बनाता है जो अनिवार्य रूप से होती हैं। जैसा कि मैं अपने 50 या इतने वैज्ञानिक प्रकाशनों को देखता हूं, मुझे किसी भी चीज को खोजने के लिए कड़ी मेहनत करनी पड़ेगी जो कि हर विवरण में इतनी निर्दोष बनी रहती है जैसे @fcoppens जोर देकर कहती है। अभी तक मैं इसी तरह मुश्किल लगता करने के लिए दबाया हूँ किसी भी जहां वैज्ञानिकपरिकल्पना बिलकुल गलत थी। अधूरा, शायद; क्षेत्र में बाद के घटनाक्रमों से अप्रासंगिक बना, निश्चित रूप से। लेकिन उस समय वैज्ञानिक ज्ञान की स्थिति के संदर्भ में "गलत" नहीं।
तीसरा, तर्क टाइप II त्रुटियों को बनाने की लागतों की अनदेखी करता है। एक प्रकार की द्वितीय त्रुटि होनहार वैज्ञानिक जांच के पूरे क्षेत्रों को बंद कर सकती है। यदि @fcoppens की सिफारिशों का पालन किया जाना था, तो टाइप II त्रुटि दर बड़े पैमाने पर, वैज्ञानिक उद्यम की गिरावट के लिए बढ़ेगी।
अंत में, सिफारिश व्यवहार में पालन करना असंभव है। यदि मैं सार्वजनिक रूप से उपलब्ध डेटा के एक सेट का विश्लेषण करता हूं, तो मेरे पास यह जानने का कोई तरीका नहीं हो सकता है कि किसी और ने इसका उपयोग किया है, या किस उद्देश्य से। मेरे पास किसी और की परिकल्पना परीक्षणों के लिए सही करने का कोई तरीका नहीं है। और जैसा कि मैं ऊपर तर्क देता हूं, मुझे नहीं करना चाहिए।