खोजपूर्ण डेटा विश्लेषण (EDA) अक्सर अन्य "ट्रैक्स" का पता लगाने की ओर जाता है जो जरूरी नहीं कि परिकल्पना के प्रारंभिक सेट से संबंधित हैं। मैं एक सीमित नमूना आकार और विभिन्न प्रश्नावली (सामाजिक-जनसांख्यिकी डेटा, न्यूरोसाइकोलॉजिकल या चिकित्सा तराजू के माध्यम से एकत्र किए गए डेटा के साथ अध्ययन के मामले में ऐसी स्थिति का सामना करता हूं - जैसे, मानसिक या शारीरिक कामकाज, अवसाद / चिंता का स्तर, लक्षण चेकलिस्ट) )। ऐसा होता है कि ईडीए कुछ अप्रत्याशित संबंधों ("अप्रत्याशित" अर्थ को उजागर करने में मदद करता है जिसका अर्थ है कि वे प्रारंभिक विश्लेषण योजना में शामिल नहीं थे) जो अतिरिक्त प्रश्नों / परिकल्पना में अनुवाद करता है।
जैसा कि ओवरफिटिंग, डेटा ड्रेजिंग या स्नूपिंग के मामले में होता है, इसके परिणाम सामान्य नहीं होते हैं। हालांकि, जब बहुत अधिक डेटा उपलब्ध होता है, तो शोधकर्ता (चिकित्सक या चिकित्सक के लिए) परिकल्पना के सीमित सेट को स्थगित करना काफी कठिन होता है।
मैं जानना चाहूंगा कि क्या अच्छी तरह से स्वीकार किए गए तरीके, सिफारिशें, या अंगूठे के नियम हैं जो छोटे-नमूने के अध्ययन के मामले में ईडीए को वितरित करने में मदद कर सकते हैं।