"प्रतिलिपि प्रस्तुत करने योग्य विश्लेषण के रूप में" प्रतिकारक अनुसंधान
Reproducible अनुसंधान एक शब्द है जिसका उपयोग कुछ शोध डोमेन में विशेष रूप से विश्लेषण करने के लिए किया जाता है
- कोड कच्चे डेटा और मेटा-डेटा को संसाधित डेटा में बदल देता है,
- कोड डेटा पर विश्लेषण चलाता है, और
- कोड एक रिपोर्ट में विश्लेषण को शामिल करता है।
जब इस तरह के डेटा और कोड साझा किए जाते हैं, तो यह अन्य शोधकर्ताओं को निम्नलिखित की अनुमति देता है:
- मूल शोधकर्ताओं द्वारा रिपोर्ट नहीं किए गए विश्लेषण करते हैं
- मूल शोधकर्ताओं द्वारा किए गए विश्लेषणों की शुद्धता की जांच करें
इस प्रयोग को स्वेव जैसी तकनीकों की चर्चा में देखा जा सकता है । उदाहरण के लिए, फ्रेडरिक लेइस्क स्वेव के संदर्भ में लिखते हैं कि "डेटा या विश्लेषण बदलने पर रिपोर्ट स्वचालित रूप से अपडेट की जा सकती है, जो वास्तव में प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान के लिए अनुमति देता है।" यह CRAN Task View on Reproducible Research में भी देखा जा सकता है जिसमें कहा गया है कि "प्रतिलिपि अनुसंधान का लक्ष्य डेटा विश्लेषण और प्रयोगात्मक डेटा के लिए विशिष्ट निर्देशों को बाँधना है ताकि छात्रवृत्ति को फिर से बनाया जा सके, बेहतर ढंग से समझा और सत्यापित किया जा सके।"
"प्रजनन शक्ति" शब्द का व्यापक उपयोग
Reproducibility विज्ञान का एक मूल उद्देश्य है। यह नया नहीं है। शोध रिपोर्टों में विधि और परिणाम अनुभाग शामिल होते हैं, जिन्हें यह रेखांकित करना चाहिए कि डेटा कैसे उत्पन्न, संसाधित और विश्लेषण किया गया था। एक सामान्य नियम यह है कि प्रदान किए गए विवरण पर्याप्त रूप से सक्षम शोधकर्ता को उपलब्ध कराई गई जानकारी लेने और अध्ययन को दोहराने के लिए सक्षम करने के लिए पर्याप्त होना चाहिए।
रिप्रोड्यूसबिलिटी भी प्रतिकृति और सामान्यीकरण की अवधारणाओं से निकटता से संबंधित है।
इस प्रकार, शब्द "प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान", जिसे सचमुच लिया जाता है, जैसा कि स्वेव जैसी प्रौद्योगिकियों पर लागू किया गया है, एक मिथ्या नाम है, यह देखते हुए कि यह एक प्रासंगिक व्यापकता को कवर करता है। इसके अलावा, जब ऐसी तकनीकों का उपयोग नहीं करने वाले शोधकर्ताओं को स्वेव जैसी प्रौद्योगिकियां पेश की जाती हैं, तो ऐसे शोधकर्ता अक्सर आश्चर्यचकित होते हैं जब मैं इस प्रक्रिया को "प्रजनन योग्य अनुसंधान" कहता हूं।
"प्रजनन योग्य अनुसंधान" से बेहतर शब्द
यह देखते हुए कि स्वेव जैसे संदर्भों में "प्रजनन योग्य अनुसंधान" का उपयोग केवल प्रजनन योग्य अनुसंधान के एक पहलू से संबंधित है, शायद एक वैकल्पिक शब्द को अपनाया जाना चाहिए। संभावित विकल्पों में शामिल हैं:
- प्रतिकारक विश्लेषण:
- Reproducible डेटा विश्लेषण
- प्रतिकारक सांख्यिकीय विश्लेषण
- रिप्रोड्यूसिबल रिपोर्टिंग
उपरोक्त सभी शब्द एक अधिक सटीक प्रतिबिंब हैं जो स्वेव-जैसे विश्लेषणों को आकर्षित करते हैं। प्रतिकारक विश्लेषण छोटा और मीठा होता है। "डेटा" या "सांख्यिकीय" जोड़ना आगे चीजों को स्पष्ट करता है, लेकिन यह शब्द को लंबे और संकीर्ण दोनों बनाता है। इसके अलावा, "सांख्यिकीय" का एक संकीर्ण और व्यापक अर्थ है, और निश्चित रूप से संकीर्ण अर्थ के भीतर, डेटा प्रोसेसिंग का अधिकांश भाग सांख्यिकीय नहीं है। इस प्रकार, "प्रजनन योग्य विश्लेषण" शब्द से निहित चौड़ाई के अपने फायदे हैं ।
यह केवल प्रतिलिपि प्रस्तुत करने योग्यता के बारे में नहीं है
"प्रतिलिपि प्रस्तुत करने योग्य अनुसंधान" शब्द के साथ अन्य अतिरिक्त मुद्दा स्वेव जैसी प्रौद्योगिकियों का उद्देश्य सिर्फ "पुनरुत्पादकता" नहीं है। कई परस्पर संबंधित उद्देश्य हैं:
- reproducibility
- क्या एक ही परिणाम के साथ कच्चे डेटा को अंतिम रिपोर्ट में बदलने के लिए विश्लेषण आसानी से किया जा सकता है?
- यथार्थता
- क्या डेटा विश्लेषण शोधकर्ता के इरादों के अनुरूप है?
- क्या शोधकर्ता के इरादे सही हैं?
- खुलापन
- पारदर्शिता, जवाबदेही
- क्या अन्य प्रदर्शन किए गए विश्लेषणों की सटीकता की जांच और सत्यापन कर सकते हैं?
- एक्स्टेंसिबिलिटी, मॉडिफिबिलिटी
- क्या अन्य लोग नए शोध कार्य बनाने के लिए डेटा, विश्लेषण, या दोनों को संशोधित, विस्तारित, पुन: उपयोग और मैश कर सकते हैं?
एक तर्क है कि प्रतिलिपि प्रस्तुत करने योग्य विश्लेषण को सही विश्लेषण को बढ़ावा देना चाहिए, क्योंकि विश्लेषण का एक लिखित रिकॉर्ड है जिसे जांचा जा सकता है। इसके अलावा यदि डेटा और कोड साझा किया जाता है, तो यह जवाबदेही बनाता है जो शोधकर्ताओं को उनके विश्लेषण की जांच करने के लिए प्रेरित करता है, और अन्य शोधकर्ताओं को सुधारों को नोट करने में सक्षम बनाता है।
Reproducible विश्लेषण भी खुले अनुसंधान के आसपास की अवधारणाओं के साथ निकटता से फिट बैठता है। बेशक, एक शोधकर्ता स्वेव जैसी तकनीकों का उपयोग सिर्फ अपने लिए कर सकता है। ओपन रिसर्च के सिद्धांत अधिक पुन: उपयोग और जवाबदेही को सक्षम करने के लिए डेटा और विश्लेषण कोड को साझा करने को प्रोत्साहित करते हैं।
यह वास्तव में "प्रतिलिपि प्रस्तुत करने योग्य" शब्द के उपयोग की आलोचना नहीं है। इसके बजाय, यह सिर्फ इस बात पर प्रकाश डालता है कि स्वैव जैसी तकनीकों का उपयोग करना आवश्यक है, लेकिन खुले वैज्ञानिक अनुसंधान लक्ष्यों को प्राप्त करने के लिए पर्याप्त नहीं है।