मैं जॉन क्रुश्के की "डूइंग बायेसियन डेटा एनालिसिस" स्लाइड्स पढ़ रहा हूं , लेकिन वास्तव में टी-टेस्ट और / या संपूर्ण नल-परिकल्पना महत्व परीक्षण ढांचे की उनकी व्याख्या के बारे में एक प्रश्न है। उनका तर्क है कि पी-वैल्यू बीमार परिभाषित हैं क्योंकि वे अन्वेषक के इरादों पर निर्भर करते हैं।
विशेष रूप से, वह दो प्रयोगशालाओं का उदाहरण (पृष्ठ 3-6) देता है जो दो उपचारों की तुलना में समान डेटा सेट एकत्र करते हैं। एक प्रयोगशाला 12 विषयों (6 प्रति शर्त) से डेटा एकत्र करने के लिए प्रतिबद्ध है, जबकि दूसरा एक निश्चित अवधि के लिए डेटा एकत्र करता है, जो 12 विषयों का उत्पादन करने के लिए भी होता है। स्लाइड, महत्वपूर्ण के अनुसार के लिए -value इन दो डेटा संग्रह योजनाओं के बीच अलग है: पूर्व के लिए है, लेकिन बाद के लिए !p < 0.05 t crit = 2.33 t crit = 2.45
एक ब्लॉग पोस्ट - जो मुझे अब नहीं मिल रहा है - ने सुझाव दिया कि निश्चित अवधि परिदृश्य में स्वतंत्रता की अधिक डिग्री है क्योंकि वे 11, 13 या किसी भी अन्य विषयों से डेटा एकत्र कर सकते थे, जबकि निश्चित-एन परिदृश्य, द्वारा परिभाषा, ।
क्या कोई मुझे समझा सकता है:
इन स्थितियों के बीच महत्वपूर्ण मूल्य अलग क्यों होगा?
(यह एक मुद्दा है) मान लें कि किसी को रोकने के विभिन्न मापदंडों के प्रभावों के लिए सही करने / तुलना करने के बारे में कैसे जाना जाएगा?
मुझे पता है कि महत्व के आधार पर स्टॉपिंग मानदंड स्थापित करना (जैसे, तक नमूना ) टाइप I त्रुटि की संभावना को बढ़ा सकता है, लेकिन यह यहां नहीं जा रहा है, क्योंकि न तो नियम रोकना परिणाम पर निर्भर करता है विश्लेषण।