कल्पना कीजिए कि एक शोधकर्ता एक डेटासेट खोज रहा है और 1000 अलग-अलग पंजीकरण चला रहा है और वह उनके बीच एक दिलचस्प संबंध पाता है।
अब एक और शोधकर्ता की कल्पना करें कि समान डेटा केवल 1 प्रतिगमन चलाता है, और यह पता चलता है कि यह वही है जिसे दूसरे शोधकर्ता ने खोजने के लिए 1000 प्रतिगमन लिया था। शोधकर्ता 2 शोधकर्ता 1 को नहीं जानता है।
क्या शोधकर्ता 1 को शोधकर्ता 2 की तुलना में अलग-अलग निष्कर्ष निकालना चाहिए? क्यों? उदाहरण के लिए, क्या शोधकर्ता को 1 तुलनात्मक सुधार करना चाहिए, लेकिन शोधकर्ता 2 को नहीं करना चाहिए?
यदि शोधकर्ता 2 ने आपको अपना एकल प्रतिगमन पहले दिखाया, तो आप क्या निष्कर्ष निकालेंगे? यदि उसके बाद शोधकर्ता 1 ने आपको अपने परिणाम दिखाए, तो क्या आपको अपना अनुमान बदलना चाहिए? यदि हां, तो यह क्यों मायने रखता है?
पुनश्च 1 : यदि काल्पनिक शोधकर्ताओं के बारे में बात करना समस्या को अमूर्त बना देता है, तो इस बारे में सोचें: कल्पना करें कि आपने उपलब्ध सर्वोत्तम विधि का उपयोग करते हुए, अपने पेपर के लिए सिर्फ एक रिग्रेशन चलाया। फिर एक अन्य शोधकर्ता ने एक ही डेटा के साथ 1000 अलग-अलग रजिस्टरों का पता लगाया, जब तक कि वह ठीक वही प्रतिगमन नहीं मिला जो आपने चलाया था । क्या आपको दो अलग-अलग संदर्भ बनाने चाहिए? क्या साक्ष्य दोनों मामलों के लिए समान है या नहीं? यदि आपको अन्य शोधकर्ता परिणामों का पता था, तो क्या आपको अपना अनुमान बदलना चाहिए? जनता को दो अध्ययनों के साक्ष्य का आकलन कैसे करना चाहिए?
पुनश्च 2: यदि संभव हो तो कृपया विशिष्ट होने और गणितीय / सैद्धांतिक औचित्य प्रदान करने का प्रयास करें!